Перевод книги “Learning Google BigQuery” (E. Brown, H. Thirukkumaran)
В мире существует не так много книг по Google BigQuery. Я нашел всего 3 печатных издания. Именно с руководства Learning Google BigQuery Эрика (Eric Brown) и Харидаса (Haridass Thirukkumaran) началось мое обучение и знакомство с инструментом от Google.
Если вы разработчик (developer), аналитик данных (data analyst) или дата-сайентист (data scientist), который хочет выполнять сложные запросы к тысячам записей в считанные секунды, эта книга поможет вам.
О чем эта книга?
Краткое содержание всех глав:
Глава 1. Google Cloud и Google BigQuery. Представляет собой практическую демонстрацию App Engine, Cloud SQL, BigQuery, Cloud Datastore, Compute Engine и Google Cloud Storage.
Глава 2. Google Cloud SDK. Описывает, как установить и настроить Google Cloud SDK и использовать различные утилиты, входящие в SDK, для взаимодействия с App Engine, Cloud SQL, BigQuery и Google Cloud Storage.
Глава 3. Типы данных BigQuery. Иллюстрирует различные типы данных, поддерживаемые в Google BigQuery, и способы переноса ваших данных (migrate) в BigQuery.
Глава 4. BigQuery SQL Basic. Описывает, как запрашивать данные, используя как устаревший SQL, так и стандартный SQL, а также как объединять данные из различных таблиц с помощью запросов.
Глава 5. BigQuery SQL Advanced. Показывает, как использовать таблицы разделов в вашем проекте и запрашивать внешний источник данных в Google Cloud (например, Google Cloud Storage) внутри BigQuery. Мы рассказываем про запросы таблиц подстановочных знаков (wild card tables), пользовательских функций (user-defined functions), представлений (views) и использования вложенных (nested) и повторяющихся типов (repeated types) в наших таблицах для поддержки импорта данных JSON.
Глава 6. Google BigQuery API. Рассказывает, как использовать BigQuery API для динамического создания таблиц и наборов данных. Вы научитесь загружать данные в BigQuery и выполнять потоковую вставку записей для аналитики в реальном времени, используя Python и C#. Права доступа, пользователи и роли рассматриваются в этой главе.
Глава 7 Визуализация данных BigQuery. Показано, как визуализировать данные, подключив их к различным инструментам внешнего интерфейса, таким как Tableau и Google Data Studio. Мы пишем пользовательские программы на R.
Глава 8. Google Cloud Pub / Sub. Описывается использование системы доставки сообщений Cloud Pub / Sub для регистрации сообщений из различных приложений и ее использование для создания отчетов и аналитики в реальном времени. В этой главе также рассматривается Google Cloud Dataprep, который помогает подготовить данные для загрузки в BigQuery.
Что нужно для этой книги?
Вам понадобится только Google Cloud SDK, браузер (рекомендуется Chrome) и редактор, поддерживающий кодирование PHP. Также рекомендуется изучить основы SQL для написания сложных запросов в Google BigQuery. В этой книге для демонстраций используется Google BigQuery Public Dataset.
Скажу сразу, что я не являюсь профессионалом в этом деле, мои знания в английском языке ограничены, с какими-то терминами из данной области я познакомился впервые на страницах Learning Google BigQuery. Поэтому если вы нашли ошибку в переводе, терминологии, просьба сообщить мне об этом на почту ya.osipenkov@icloud.com.
Книга была издана в 2017 году. За это время произошли изменения в работе сервиса, включая обновления интерфейса и технической части. Все коды, представленные в оригинальной версии издания, я оставил без изменений. Я не гарантирую абсолютную точность и полноту приводимых сведений, а также не несу ответственности за возможные ошибки, связанные с использованием этой книги