Визуализация данных BigQuery в Data Studio

1. Введение

Data Studio и BigQuery вместе образуют мощную комбинацию, позволяющую создавать панели мониторинга, которые помогают пользователям понимать информацию и аналитические выводы, содержащиеся в ваших данных. Эти панели мониторинга легко распространяются с помощью привычного интерфейса Google Drive и могут быть встроены в сайты для еще более широкого распространения.

Что такое Data Studio?

Data Studio — это бесплатный инструмент визуализации данных от Google, который позволяет:

  • Визуализируйте свои данные с помощью настраиваемых диаграмм и таблиц.
  • Быстро и легко подключайтесь к различным источникам данных.
  • Поделитесь своими идеями со своей командой или со всем миром.
  • Совместно с командой работайте над отчетами.
  • Создавайте отчеты еще быстрее благодаря встроенным примерам отчетов и визуализациям, созданным сообществом.

В этом практическом занятии мы шаг за шагом покажем, как подключить BigQuery и Data Studio для создания панелей мониторинга и отчетов, которые помогут вам лучше понимать ваши данные. Для демонстрации этого процесса мы будем использовать общедоступные наборы данных из программы Cloud Public Datasets Program .

Что вы построите

В этом практическом задании вы создадите панель мониторинга в Data Studio. Ваша панель мониторинга будет визуализировать общедоступный набор данных BigQuery, подключив BigQuery к Data Studio и определив оптимальные типы визуализации для этого набора данных.

Что вы узнаете

  • Как подключить BigQuery и Data Studio
  • Как визуализировать данные в Data Studio

Что вам понадобится

  • Учетная запись Google Cloud. Если у вас ее еще нет, вы можете быстро зарегистрироваться в песочнице BigQuery без кредитной карты.
  • Базовые знания SQL полезны, но не обязательны.
  • Базовое понимание лучших практик визуализации данных.

2. Настройка

Доступ к общедоступным наборам данных BigQuery

В этом практическом задании вы визуализируете запросы в службу поддержки 311 из города Сан-Франциско . Этот набор данных, наряду с более чем 150 другими, доступен в рамках программы BigQuery Public Datasets Program. Изучите весь каталог доступных наборов данных , чтобы найти другие наборы данных. Используемый нами набор данных запросов в службу поддержки 311 является хорошим аналогом типов запросов в службу поддержки клиентов, с которыми приходится сталкиваться многим компаниям.

Настройка вашего проекта в Google Cloud

В консоли Cloud на странице выбора проекта выберите или создайте проект Cloud. Эта опция доступна в выпадающем меню в левом верхнем углу экрана. Убедитесь, что для вашего проекта Google Cloud включена оплата. Узнайте, как подтвердить включение оплаты для вашего проекта .

4378f8fd21828a66.png

3. Подключение Data Studio и BigQuery

Что такое Data Studio?

Data Studio — это бесплатный инструмент визуализации данных от Google, который помогает пользователям раскрыть потенциал своих данных с помощью интерактивных панелей мониторинга и наглядных отчетов, способствующих принятию более обоснованных бизнес-решений. Вы можете подключаться к более чем 500 наборам данных через более чем 200 встроенных в Data Studio коннекторов. В их число входят коннекторы к продуктам Google, таким как Google Analytics, BigQuery и Sheets, а также к внешним источникам данных.

Что такое BigQuery?

BigQuery — это полностью управляемое, масштабируемое и экономичное облачное хранилище данных от Google Cloud, разработанное для обеспечения гибкости бизнеса. BigQuery позволяет анализировать петабайты данных с использованием ANSI SQL на невероятно высокой скорости, получать ценные аналитические данные с помощью аналитики в реальном времени и прогнозной аналитики, а также легко получать доступ к данным и делиться полученными результатами. И все это без каких-либо операционных затрат.

Создайте источник данных

Первый шаг при создании отчета в Data Studio — это создание источника данных для отчета. Отчет может содержать один или несколько источников данных. При создании источника данных BigQuery Data Studio использует коннектор BigQuery.

Для добавления источника данных BigQuery в отчет Data Studio необходимы соответствующие разрешения. Кроме того, разрешения, применяемые к наборам данных BigQuery, будут применяться к отчетам, диаграммам и панелям мониторинга, которые вы создаете в Data Studio. При совместном использовании отчета Data Studio его компоненты будут видны только пользователям, имеющим соответствующие разрешения.

Для создания источника данных:

  1. Open Data Studio .
  2. На странице «Отчеты» в разделе «Начать с шаблона» выберите « Пустой шаблон». Это создаст новый отчет без названия.

801a709b4a392db7.png

  1. При появлении запроса заполните поля «Маркетинговые предпочтения» и «Настройки учетной записи и конфиденциальности» , а затем нажмите «Сохранить» . Возможно, после сохранения настроек вам потребуется снова нажать на кнопку « Пустой шаблон».
  2. В окне «Добавить данные в отчет» перейдите в раздел «Подключиться к данным» и выберите BigQuery , щелкнув по нему.

3fb927eb5317986e.png

  1. Для авторизации нажмите «Авторизовать» . Это позволит Google Data Studio получить доступ к вашим проектам GCP.
  2. В диалоговом окне «Запрос на разрешение» нажмите « Разрешить» , чтобы предоставить Google Data Studio возможность просматривать данные в BigQuery. Возможно, это сообщение не появится, если вы ранее использовали Google Data Studio.
  3. В левой панели навигации вы увидите, что по умолчанию выбран пункт «Мои проекты» . Измените свой выбор на «Общедоступные наборы данных» .
  4. Для перехода к разделу «Проект выставления счетов» щелкните по названию проекта GCP, который вы создали ранее.
  5. В разделе «Общедоступные наборы данных» нажмите san_francisco_311.
  6. Чтобы открыть таблицу, нажмите 311_service_requests.
  7. В правом нижнем углу окна нажмите кнопку «Добавить ». Если появится диалоговое окно с сообщением «Вы собираетесь добавить данные в этот отчет», нажмите кнопку «ДОБАВИТЬ В ОТЧЕТ», чтобы продолжить.
  8. В меню Data Studio нажмите «Управление добавленными источниками данных» в разделе «Ресурсы». c1aadb68dd5bf34f.png
  9. На странице «Источники данных» нажмите кнопку «Редактировать» рядом с таблицей 311_service_requests, чтобы просмотреть поля таблицы и их типы данных. На этой странице вы можете изменить свойства полей или создать новые вычисляемые поля. f0250903710fc9ed.png
  10. Этот набор данных включает внутренние географические координаты каждого района, представленные таким образом, чтобы Data Studio могла использовать их по умолчанию. Рядом с полем neighborhood_center_ds измените тип данных, щелкнув «Текст» , а затем выбрав «Широта, Долгота» в раскрывающемся списке «География» . Это укажет Data Studio, что наше поле данных должно быть представлено географически.

1f979cf54681ae12.png

Теперь вы подключили свой набор данных BigQuery к Data Studio!

4. Создание визуализаций

Теперь, когда вы успешно подключили свой набор данных BigQuery (в данном случае, общедоступный набор данных BigQuery « Запросы 311 в Сан-Франциско »), вы можете начать визуализацию данных. Data Studio автоматически создаст вашу первую визуализацию на основе ваших данных. Вы можете удалить её сейчас, чтобы создать пустой шаблон.

94aea5bb5fc4ffe1.png

Создание древовидной карты

Начнём с создания древовидной диаграммы, чтобы визуализировать, какие типы запросов в службу 311 поступают чаще всего. Это даст нам отправную точку для других визуализаций, показав, на каких типах запросов нам следует сосредоточиться.

  1. В меню Data Studio нажмите «Добавить диаграмму» , затем внизу выберите «Древовидная диаграмма» . Возможно, вам придётся прокрутить страницу вниз, чтобы её найти.

677663906bdd050f.png 2. Data Studio позволит вам щелкнуть или перетащить область на холсте, чтобы создать визуализацию. Начните с размещения ее в левом нижнем углу панели мониторинга. Data Studio автоматически создаст древовидную диаграмму, предположив, какие поля вы хотите включить.

c593d3313b5ce89.png 3. Щелкните по древовидной диаграмме, чтобы внести изменения в визуализируемые данные. На панели в правой части экрана измените параметры в соответствии с визуализацией ниже.

869db54f9ef19ea3.png

  1. Нажмите «Стиль» в верхней части панели. Мы воспользуемся этим, чтобы внести небольшие изменения и сделать древовидную диаграмму более читабельной. Давайте изменим цвет типов запросов с наибольшим количеством значений. Нажмите на выделенную ниже кнопку и выберите оттенок синего с галочкой. Это обеспечит лучший контраст с текстом на древовидной диаграмме.

db4e4505d51f1539.pngc04e33d3aa35e7b.png 5. После завершения работы ваша панель управления должна выглядеть примерно так:

af147fc5a4c40d15.png

5. Создание панели мониторинга

Одна из основных целей панели мониторинга — обеспечить удобную и масштабируемую отчетность по показателям для поддержки принятия решений. Мы достигаем этого, включая данные и метрики, необходимые для предоставления надлежащего контекста для набора данных в легко усваиваемом формате.

Давайте продолжим создавать нашу панель управления, добавив несколько элементов, которые сделают эту информацию более понятной и интерпретируемой. Начнём с добавления карты, которая покажет, в каких районах в целом больше всего запросов, и оценочных таблиц, которые покажут нам общее количество запросов по 3 наиболее распространённым типам запросов.

Добавление карты на вашу панель управления

  1. В меню нажмите «Добавить диаграмму» , затем в выпадающем списке выберите Google Maps . Вы также можете использовать Geo Map, но визуализации Google Maps предоставляют больше контекста, что делает их более подходящими для данного случая.

806f9ddfe45a242c.png 2. Добавьте диаграмму в правый нижний угол панели мониторинга так же, как вы добавляли древовидную диаграмму. 3. Выберите карту на панели мониторинга, чтобы изменить ее параметры. Затем измените параметры на вкладке «Данные» в соответствии с приведенными ниже настройками. Для этого добавьте поле «Район» в измерение «Всплывающая подсказка » и поле «Количество записей» в измерение « Размер пузырька » в разделе «Метрика».

fc764cf8ec84558d.png 4. После завершения работы ваша панель управления должна выглядеть примерно так:

59c06b3b041ff950.png

Добавление оценочных таблиц на вашу панель управления.

Далее добавим на панель мониторинга три оценочные таблицы. Оценочные таблицы позволяют отображать значение отфильтрованной переменной, что помогает пользователям панели мониторинга сосредоточиться на наиболее важных показателях. Мы создадим три фильтра, а затем применим их к оценочным таблицам. В результате будут созданы 3 оценочные таблицы, которые будут показывать пользователям количество запросов на услуги типа «Уборка улиц и тротуаров», «Граффити» и «Лагеря». Это три наиболее часто запрашиваемых типа услуг, как показала построенная ранее древовидная диаграмма.

  1. В меню выберите «Добавить диаграмму» , затем в раскрывающемся списке выберите «Система показателей». Вы увидите два варианта: «Система показателей» и «Система показателей с компактными числами». Любой из них подойдет для решения поставленной задачи.

cf41ed6d758d4b3d.png 2. Добавьте таблицу показателей над древовидной диаграммой на панели мониторинга и убедитесь, что в качестве метрики выбрано поле «количество записей». Скопируйте и вставьте ее, чтобы создать еще две таблицы показателей, расположенные на разных уровнях панели мониторинга. d72dff7b5ada3ab3.png 3. Выберите крайнюю левую таблицу показателей. На панели данных справа выберите «Добавить фильтр» и создайте фильтр, соответствующий указанным ниже параметрам. Таблица показателей автоматически обновится, чтобы отфильтровать количество записей и включить запросы на обслуживание, отвечающие критериям фильтра.

5f88670d31341a11.png 4. Сделайте то же самое для средней и самой правой оценочной таблицы, чтобы создать таблицы, отображающие количество запросов с категориями «Граффити» и «Лагеря». Нажатие кнопки «Добавить фильтр» откроет «Выбор фильтра», в котором отображаются все уже созданные фильтры. Нажмите «Создать фильтр » внизу, чтобы создать новые фильтры. После создания фильтров вы заметите, что значения автоматически обновятся, отражая новые параметры для оценочной таблицы. 5. Выберите все три объекта оценочных таблиц одновременно, удерживая клавишу Shift и щелкая по ним, затем нажмите «Стили» на панели, чтобы изменить стиль оценочных таблиц. Внесенные вами изменения будут применены ко всем трем оценочным таблицам одновременно. Обновите стиль оценочных таблиц в соответствии с настройками панели ниже, но не беспокойтесь, если цвета немного не совпадают. Мы выберем «Скрыть название метрики» (в настоящее время на панели мониторинга отображается «Количество записей»), чтобы мы могли разместить на его месте свой собственный текст и сделать значение этих метрик более понятным для пользователей панели мониторинга. 41e5c8035b09e55f.png 6. Добавьте текст над таблицами показателей, чтобы пользователи понимали, что означают эти метрики. На панели инструментов нажмите значок «Текст». Нарисуйте прямоугольник на холсте, а затем введите текст в этот прямоугольник.

66016180009f92f.png

Ваша панель управления должна выглядеть следующим образом: 27f6ec27f3b39816.png

6. Создание фильтров

Фильтры в Data Studio позволяют уточнять или сокращать данные, отображаемые на диаграмме. Фильтр определяется путем задания критериев, аналогично оператору WHERE в SQL. Фильтры могут быть нацелены на определенный диапазон значений для одного или нескольких измерений вашего набора данных, например, ограничивать данные определенным диапазоном дат. Вы можете применять фильтры на разных уровнях:

  • На уровне диаграммы: фильтр применяется только к одной конкретной диаграмме.
  • На уровне группы: фильтр применяется к группе выбранных диаграмм.
  • Фильтрация на уровне страницы: фильтруются все диаграммы на этой странице.
  • На уровне отчета: фильтруются все диаграммы в отчете.

Теперь, когда основная часть панели управления готова, давайте добавим элемент управления фильтром, который позволит пользователям интерактивно выбирать один или несколько районов, которые они хотели бы видеть в визуализации отчета при его просмотре.

  1. В меню Data Studio щелкните элемент управления «Фильтр».

1a87123245ba52b4.png 2. Щелкните внутри холста панели мониторинга, чтобы разместить элемент управления фильтром, как вы это делали ранее при добавлении диаграмм. 3. Убедитесь, что измерение фильтра установлено на «окрестность» на панели данных , если это еще не так. 4. Выберите фильтр, щелкнув по нему на панели мониторинга. Затем щелкните «Упорядочить» в верхней строке меню и выберите «Сделать на уровне страницы» . Если этот параметр недоступен, значит, фильтр уже установлен на уровне страницы и будет фильтровать все диаграммы на этой странице при изменении.

Таким образом, у вас готова к использованию полноценная панель управления!

7. Протестируйте и поделитесь.

Тестирование вашей панели управления

Теперь, когда панель управления готова, давайте посмотрим на нее с точки зрения пользователя, чтобы убедиться, что все работает должным образом.

Нажмите кнопку «Просмотр» в правом верхнем углу, и вы сможете увидеть панель управления с точки зрения ваших зрителей.

d4d3065d022ff92a.png

Поделитесь своей панелью управления.

Как только все будет выглядеть так, как вы хотите, вы готовы поделиться своей панелью мониторинга. Data Studio упрощает обмен панелями мониторинга, используя привычный интерфейс обмена, который используется в Google Sheets, Docs и других продуктах G Suite.

Для начала измените название панели мониторинга, чтобы пользователям было проще её найти. Щёлкните по названию отчёта ("Без названия") в верхнем левом углу и измените его на "Запросы в службу 311 Сан-Франциско по районам".

Нажатие кнопки «Поделиться» в правом верхнем углу откроет интерфейс для обмена данными с рядом опций, включая отправку отдельным пользователям по электронной почте, отправку по домену или предоставление доступа всем пользователям. Последняя настройка особенно полезна, если вы хотите встроить отчет на общедоступный веб-сайт.

752a2679c7d6b8ec.png

Следующие шаги

Ознакомьтесь с другими практическими заданиями , выполнив поиск по запросу "Data Studio" в верхней части страницы, чтобы узнать больше о том, как инструменты бизнес-аналитики Google Cloud могут удовлетворить ваши потребности. Следите за будущими практическими заданиями, посвященными новейшему инструменту бизнес-аналитики Google Cloud — Looker !

Вы также можете ускорить работу своих панелей мониторинга, используя до 100 ГБ оперативной памяти с помощью BigQuery BI Engine . BI Engine — это быстрая служба анализа данных в оперативной памяти, которая позволяет пользователям интерактивно исследовать сложные наборы данных внутри BigQuery со временем ответа на запросы менее секунды и высокой параллельностью. Она легко интегрируется с Data Studio для ускорения исследования и анализа данных, делая ваши панели мониторинга еще более эффективными для пользователей.