1. Введение
Сегодня утро понедельника, и финансовый директор только что отправил вам сообщение. Средняя стоимость заказа в этом месяце снизилась на 7%, но общая выручка осталась на прежнем уровне. Что-то не сходится, и совет директоров хочет получить ответы к пятнице.
Ваша компания, Cymbal Pets, является одним из крупнейших онлайн-ритейлеров товаров для животных в США. Необходимые вам данные разбросаны по трем сервисам Google Cloud: транзакционные данные в BigQuery , записи о клиентах и товарах в Cloud SQL и маркетинговые файлы в Cloud Storage . Обычно для проведения подобного межсервисного анализа требуется переключение между консолями, написание шаблонного кода для подключения и ручное объединение результатов.
В этом практическом задании вы будете использовать Google Cloud Data Agent Kit (DAK) в среде разработки Antigravity IDE для исследования аномалии с помощью естественного языка. Вы описываете, что ищете, а ИИ-агент обрабатывает соединения, SQL-запросы и межсервисные объединения между BigQuery, Cloud SQL и Cloud Storage. После того, как вы решите задачу, вы попросите агента создать конвейер dbt , который позволит реализовать ваши результаты, отладить реальную ошибку моделирования данных и предоставить финансовому директору рекомендацию, подкрепленную прогнозом.
Что вы будете делать
- С помощью каталога знаний вы можете находить данные в BigQuery , Cloud SQL и Cloud Storage .
- Исследуйте аномалию , запрашивая данные из нескольких сервисов в рамках одного диалога с помощью инструментов MCP.
- Создайте конвейер dbt для подготовки и объединения данных между сервисами с использованием моделей подготовки и автоматизированных тестов.
- Устранение проблемы моделирования данных : агент самостоятельно диагностирует и исправляет ошибку в механизме разветвления данных.
- Прогнозируйте будущие тенденции и предоставляйте рекомендации на основе данных с помощью
AI.FORECASTот BigQuery.
Что вам понадобится
- Веб-браузер, например Chrome.
- Проект Google Cloud с включенной функцией выставления счетов.
- Базовые знания SQL и Google Cloud Console.
Данный практический семинар предназначен для специалистов среднего уровня по работе с данными (инженеров-аналитиков, аналитиков данных, специалистов по обработке данных).
Стоимость ресурсов, созданных в рамках этого практического занятия, должна составлять менее 5 долларов.
2. Перед началом работы
В этом разделе вы запустите скрипт настройки, который подготовит всю вашу тестовую среду: набор данных BigQuery с данными о заказах, экземпляр Cloud SQL Postgres с данными о клиентах и продуктах, а также хранилище Cloud Storage с записями рекламных кампаний. Выполнение скрипта занимает около 8-10 минут, при этом узким местом является подготовка Cloud SQL.
Запустить Cloud Shell
Для запуска скрипта настройки вы будете использовать Google Cloud Shell .
- В верхней части консоли Google Cloud нажмите кнопку «Активировать Cloud Shell» .

- После подключения укажите идентификатор проекта и подтвердите свою среду:
gcloud config set project <<YOUR_PROJECT_ID>>
export PROJECT_ID=$(gcloud config get-value project)
Вы должны увидеть сообщение, похожее на следующее:
Your active configuration is: [cloudshell-####] Updated property [core/project]
Клонируйте репозиторий
Клонируйте репозиторий codelab в свою среду Cloud Shell:
cd ~/
git clone --filter=blob:none --no-checkout https://github.com/GoogleCloudPlatform/devrel-demos.git
cd ~/devrel-demos
git sparse-checkout init --cone
git sparse-checkout set codelabs/agentic-data-labs
git checkout main
cd codelabs/agentic-data-labs/
Запустите скрипт установки.
Скрипт настройки подготовит всю вашу лабораторную среду за несколько минут. Он включает в себя активацию API, загрузку и расширение данных BigQuery, загрузку рекламных материалов в GCS, а затем автоматически запускает фоновый процесс для подготовки и настройки Cloud SQL Postgres в фоновом режиме, пока вы запускаете практическое занятие.
Этот скрипт автоматически генерирует пароль для Cloud SQL и сохраняет его в файле .env .
cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x setup.sh setup_sql.sh
./setup.sh
После завершения процесса вы увидите сводку по вашей текущей среде:
╔══════════════════════════════════════════════════════╗
║ Base Setup complete! ║
╚══════════════════════════════════════════════════════╝
Your core BigQuery and GCS assets are ready.
Cloud SQL is currently provisioning in the background and will be fully ready by Step 4.
BigQuery: YOUR_PROJECT_ID.cymbal_pets
├── orders
└── order_items
GCS: gs://YOUR_PROJECT_ID-cymbal-pets-raw
└── promo_events.json
Пока вы продолжаете выполнение следующих шагов лабораторной работы, база данных создается и заполняется в фоновом режиме. Вы можете в любое время отслеживать этот процесс в отдельной панели терминала, используя:
tail -f /tmp/cloudsql_setup.log
Обратите внимание на архитектуру данных: транзакционные данные (заказы и позиции заказов) хранятся в BigQuery, а операционные данные (клиенты, профили домашних животных и товары) — в Cloud SQL. Такое разделение отражает то, как данные часто распределяются между сервисами в реальных организациях, и именно это делает межсервисное исследование интересным.
Краткое содержание раздела: Вы запустили скрипт настройки для инициализации вашей тестовой среды и запустили фоновое выделение ресурсов базы данных.
3. Настройка IDE и Data Agent Kit
Откройте Antigravity IDE
Не нужно ждать завершения работы Cloud SQL! Просто откройте Antigravity IDE и подключите её к своему проекту в Google Cloud.
- Если вы еще этого не сделали, скачайте и установите Antigravity IDE со страницы загрузки Google Antigravity .
- Запустите настольное приложение Antigravity IDE .
- Создайте на локальном компьютере новую пустую папку (например, с именем
agentic-data-labs) и откройте её в IDE, выбрав «Открыть папку» . Она будет служить вашей локальной рабочей областью для этого практического задания.

Установите расширение Data Agent Kit.
Расширение Google Cloud Data Agent Kit обеспечивает глубокую интеграцию с сервисами данных Google Cloud непосредственно в вашем редакторе, позволяя взаимодействовать с BigQuery, Cloud SQL, Cloud Storage и другими сервисами без переключения контекста.
- В среде разработки Antigravity IDE щелкните значок «Расширения» на панели активности в левой части экрана (он выглядит как четыре квадрата).
- В строке поиска в верхней части панели расширений введите
Google Cloud Data Agent Kit. - Найдите расширение под названием Google Cloud Data Agent Kit , опубликованное на сайте
googlecloudtools - Нажмите кнопку «Установить» .
- Возможно, появится запрос: «Доверяете ли вы издателю 'googlecloudtools' и его расширениям?». Нажмите «Доверять издателям и установить» , чтобы продолжить.

После установки в левой части панели активности среды разработки Antigravity IDE появится новый значок Google Cloud Data Agent Kit .
Аутентификация и настройка расширения
После установки подключите расширение к своему проекту в Google Cloud.
- Автоматически должна открыться страница регистрации под названием «Добро пожаловать в Google Cloud Data Agent Kit». Если вы не вошли в свою учетную запись Cloud, следуйте инструкциям, чтобы разрешить доступ.
- В разделе «Сводка конфигурации» найдите поле «Проект». Щелкните раскрывающийся список и выберите свой проект Google Cloud. Установите регион как
us-central1. Затем выберите «Настроить серверы MCP» .

- В панели «Конфигурация MCP» включите BigQuery и Cloud SQL . Затем нажмите «Начать» .

Изучите параметры конфигурации.
После завершения настройки вы попадете на страницу "Начало работы с Google Cloud Data Agent Kit".
- В разделе «Настройка и конфигурация» нажмите «Начать» .
- Откроется панель конфигурации агента данных . Изучите вкладки:
- Проект и регион: Проверьте выбранный идентификатор проекта и убедитесь, что необходимые API (API облачного хранилища, API BigQuery, API каталога и API администрирования Cloud SQL) включены.
- BigQuery: Настройте местоположение по умолчанию для ваших запросов BigQuery. Используйте регион
us-central1. - Настройка серверов MCP: Просмотрите список включенных серверов MCP (BigQuery, Notebooks, Cloud SQL и т. д.), которые позволяют агентам ИИ безопасно взаимодействовать с вашими данными.
- Навыки: Изучите встроенные навыки , которые предоставляют агентам специализированные возможности для решения сложных задач обработки данных.

Краткое содержание раздела: Вы открыли Antigravity IDE, подключили его к своему проекту Google Cloud, настроили удаленные серверы MCP Data Agent Kit и проверили соединение, выполнив запрос к BigQuery.
4. Изучите свои данные
Давайте разберемся в ситуации. Вот что происходит: финансовый директор говорит, что средняя стоимость заказа в прошлом месяце снизилась на 7%, но общая выручка осталась на прежнем уровне. Прежде чем просить агента провести расследование, вам следует сначала понять, с какими данными вы работаете.
В этом разделе вы вручную изучите панель Data Agent Kit, чтобы получить общее представление о её работе. Понимание ваших данных до начала запросов к ним — это критически важный первый шаг в любом исследовании.
Изучите таблицы BigQuery
- В панели Data Agent Kit, в разделе CATALOG , разверните свой проект → BigQuery →
cymbal_pets. - Щёлкните по таблице
orders. Откроется новая вкладка с подробным описанием таблицы. - Изучите вкладки в левой части окна просмотра таблиц:
- Данные : Предварительный просмотр строк. Прокрутите набор данных и изучите столбцы.
- Схема : Проверьте названия и типы столбцов. Обратите внимание на такие поля, как
order_typeиpromo_code, которые станут важными позже. - Другие вкладки (Подробности, Аналитика, Профиль данных и т. д.) : Доступ к метаданным, истории происхождения данных и сведениям о качестве, которые вы обычно находите в консоли Google Cloud, — и все это, не выходя из редактора.

- Теперь щелкните по таблице
order_itemsи просмотрите ее схему. Обратите внимание на поляquantityиprice.
Изучите таблицы Cloud SQL.
Скрипт установки также разместил данные о клиентах, питомцах и товарах в базе данных PostgreSQL в Cloud SQL.
- В панели Data Agent Kit в разделе CATALOG нажмите на Universal Search .
- В поле поиска введите
pet_profilesи нажмите Enter . - В результатах поиска щелкните по результату «Таблица PostgreSQL для
pet_profiles» (в экземпляре Cloud SQL вашего проекта). Обратите внимание, что боковая панель автоматически развернется, показывая вам точное местоположение таблицы в дереве базы данных. Теперь щелкните по таблицеcustomers, расположенной прямо над ней в дереве, чтобы открыть ее подробную информацию и изучить вкладки «Схема» и «Подробности» .

Изучите облачное хранилище файлов.
Наконец, данные о маркетинговых и рекламных кампаниях сохраняются в облачном хранилище в виде необработанных JSON-файлов.
- В левой панели Data Agent Kit разверните раздел CLOUD STORAGE . Найдите необработанный сегмент вашего проекта (
YOUR_PROJECT_ID-cymbal-pets-raw). - Щёлкните по файлу
promo_events.jsonвнутри хранилища. Откроется новая вкладка редактора, позволяющая просматривать исходное содержимое JSON-строок маркетинговых кампаний непосредственно в IDE.

Подведите итоги
Вот что вы теперь знаете о ситуации с данными:
Услуга | Таблицы | Что там есть? |
BigQuery | | Примерно 1,9 млн заказов, примерно 4,3 млн позиций, период 2023-2025 гг. |
Облачный SQL | | Примерно 92 тыс. клиентов, примерно 7,6 тыс. профилей домашних животных, 206 товаров. |
Облачное хранилище | | записи рекламных кампаний |
Данные распределены по трем сервисам. В традиционном рабочем процессе вам пришлось бы устанавливать соединения, писать код интеграции и вручную объединять результаты. На следующем шаге вы позволите агенту ИИ выполнить все это в рамках одного диалога.
Краткое содержание раздела: Вы использовали панель Data Agent Kit для ручного изучения архитектуры данных в BigQuery, Cloud SQL и Cloud Storage. Теперь вы знаете, где находятся данные и какие поля доступны, поэтому вы готовы начать исследование.
5. Следуйте за цифрами.
Теперь начинается расследование. Вы воспользуетесь панелью чата, чтобы попросить агента ИИ получить данные о средней стоимости заказа (AOV) из BigQuery. AOV — это бизнес-показатель, отражающий среднюю сумму, потраченную на один заказ. Агент выполнит запрос от вашего имени с помощью MCP Tools, и вы сможете увидеть каждый выполненный им SQL-запрос.
Проанализируйте тенденцию изменения средней стоимости заказа.
- В панели чата в правой части IDE введите следующую команду и нажмите Enter :
Calculate our monthly average order value from August 2024 through January 2025 using the orders and order_items tables in BigQuery. - Подтверждение разрешений на доступ к данным. Следует проявлять осторожность при выполнении запросов к вашим базам данных агентами искусственного интеллекта. Data Agent Kit позволяет вам контролировать ситуацию, запрашивая явное разрешение перед доступом к данным. При появлении запроса вы можете выбрать:
- Учитывайте следующее время: подтверждает однократное использование (идеально подходит для аудита запросов с высоким риском).
- Всегда разрешать: Одобряет дальнейшее использование данного инструмента в течение сессии.
- Нет: Полностью блокирует действие.
list_table_idsилиexecute_sql_readonly). Вы также можете «всегда разрешать» их.

- Наблюдайте за работой оператора. Панель чата одновременно служит журналом прозрачности всех действий оператора. Вместо черного ящика оператор показывает вам свои рассуждения и действия в режиме реального времени.
- После завершения работы агента нажмите на выпадающее меню « Работа выполнена в течение Xm» под вашим запросом, чтобы развернуть полный журнал работы. Здесь вы можете точно узнать, как агент получил ваш ответ:
- Исследовано: Разверните эти элементы, чтобы увидеть, как агент читает файлы, просматривает папки или вызывает инструменты MCP (например,
datacloud_bigquery_remote / list_table_idsиexecute_sql_readonly). Вы можете просмотреть точные JSON-аргументы, переданные инструментам, и выполненный SQL-запрос. - Ran: Разверните эти элементы, чтобы увидеть все команды терминала, выполненные агентом, например,
gcloud config list.
- Исследовано: Разверните эти элементы, чтобы увидеть, как агент читает файлы, просматривает папки или вызывает инструменты MCP (например,

- Просмотрите результаты. Агент должен вернуть таблицу ежемесячных значений среднего чека. Посмотрите на цифры сами: в предыдущие месяцы он колебался около ~110 долларов, а в январе опустился примерно до ~103 долларов. Именно на эту аномалию указал финансовый директор.
Детализация по каналам
Общий средний чек снизился, но откуда это взялось? Давайте разберемся.
- В панели чата введите:
January looks lower than the prior months. Break down January's AOV by order_type to see what's going on? - Агент выполняет еще один запрос BigQuery, на этот раз группируя по
order_type. Внимательно изучите результаты. Вы должны увидеть нечто поразительное: средний чек онлайн и офлайн остается стабильным на уровне около 110 долларов. Но появился новый канал, B2B-оптовая торговля , со значительно более низким средним чеком (около 75 долларов). Этот новый канал снижает средний чек. - Агент может по собственной инициативе предложить провести исследование B2B-клиентов. Если этого не произойдет, ничего страшного. Вы сделаете это на следующем этапе.
Краткое содержание раздела: Вы сами заметили снижение среднего чека в январе, используя нейтральные данные, а затем, проанализировав данные по типу заказа, определили, что B2B-Wholesale является новым каналом, снижающим усредненный показатель. Теперь вам нужно выяснить, кто эти B2B-клиенты.
6. Пересечение границ предоставления услуг
Вы определили B2B-Wholesale как аномальный канал в BigQuery, но данные о клиентах хранятся в Cloud SQL. С помощью Data Agent Kit вы можете продолжить этот процесс, и он обработает границу между сервисами.
Изучите клиентов B2B.
- В панели чата введите:
Who are these B2B customers? Their profiles should be in our Cloud SQL database. Check for: - Who they are - When they signed up - Whether they're new or existing customers - Внимательно следите за панелью чата. На этот раз должно появиться другое окно инструмента MCP . Теперь агент запрашивает данные из Cloud SQL вместо BigQuery. Агент подключается к экземпляру Cloud SQL Postgres
cymbal-pets-opsи выполняет запрос к таблицеcustomers. Нажмите « Показать подробности» , чтобы увидеть SQL-запрос. - Проанализируйте результаты. В ходе анализа должно быть выявлено несколько ключевых моментов:
- У всех B2B-клиентов
customer_type = 'Business' - Все они зарегистрировались в течение последних 30 дней (январь 2025 года).
- В значениях
last_nameотображаются названия компаний, такие как «Pet Supply Co», «Animal Care LLC» и «Happy Paws Inc». - Их около 100 человек, и до этого месяца такой группы не существовало.
- У всех B2B-клиентов
Введите промокод
- Агент может самостоятельно заметить, что многие B2B-заказы в BigQuery имеют значение
promo_codeBIGORDER25. Если он сам сообщит об этом наблюдении, отлично. Расследование, естественно, продвигается. Если же агент не упомянет промокод, напомните ему об этом:I noticed a promo_code field on the orders table in BigQuery. Check what promo codes appear on the B2B-Wholesale orders? - Агент снова отправляет запрос в BigQuery и обнаруживает, что примерно 92% заказов B2B-оптовой торговли имеют
promo_code = 'BIGORDER25'. Практически вся активность в сфере B2B связана с одной рекламной кампанией. Теперь агенту должно быть любопытно узнать, откуда взялся этот промокод. Он может спросить, есть ли где-нибудь еще в системе данные о рекламных акциях. (Есть, в облачном хранилище.)
Краткое содержание раздела: Агент запросил данные в Cloud SQL и обнаружил, что все B2B-клиенты — это новые компании, зарегистрировавшиеся в январе 2025 года. В сочетании с данными BigQuery, показавшими, что примерно 92% их заказов имеют promo_code = 'BIGORDER25' , след теперь указывает на рекламную кампанию. Пора найти источник.
7. Найдите недостающую деталь.
Две услуги уже недоступны, осталась одна. Вы знаете, что произошло (заказы B2B снижают средний чек) и кто в этом виноват (новые бизнес-клиенты за последние 30 дней). Теперь вам нужно выяснить причину , и ответ кроется в облачном хранилище.
Проверьте хранилище GCS.
- В панели чата введите:
Good catch on the promo code. We might have promotional campaign data in our GCS bucket. Can you check what's there? - У агента нет предварительно настроенного инструмента MCP для облачного хранилища, поэтому он автоматически переключается на использование своего терминального инструмента для выполнения команд
gcloud storage. Он запросит разрешение на выполнение таких команд, какgcloud storage ls. Разрешите эти команды, затем разверните журнал Ran в панели чата, чтобы увидеть точные команды CLI, которые он использовал для чтения и анализа файлаpromo_events.json. - Агент должен выявить в файле три рекламные кампании:
Вот оно. ПромокодКампания
Промо-код
Скидка
Цель
Даты
Летняя распродажа товаров для домашних животных
PETSUMMER15Скидка 15%
Все
Июнь 2024 г.
Оптовая торговля B2B
BIGORDER25Скидка 25%
B2B
Январь 2025 г.
Праздничный бонус для участников программы лояльности
LOYAL10скидка 10%
Участники программы лояльности
Декабрь 2024 г.
BIGORDER25привязан к акции под названием B2B Wholesale Push : скидка 25% для B2B-клиентов при минимальном заказе 50 единиц. Это неопровержимое доказательство.
Соберите всё воедино
- Попросите агента обобщить всю найденную информацию:
Put it all together. What happened to our average order value? - Агент предоставляет четкий, структурированный синтез, связывающий все три источника данных. Он должен объяснять что-то вроде:
- Падение среднего чека реально, но это не означает снижение объемов существующего бизнеса. Средний чек как в онлайн, так и в офлайн-магазинах остается стабильным на уровне около 110 долларов.
- В январе 2025 года появился новый канал оптовой торговли B2B , насчитывающий около 25 000 заказов со значительно более низким средним чеком (примерно 75-100 долларов).
- Клиентами B2B являются 100 новых бизнес-аккаунтов , которые зарегистрировались в течение последних 30 дней (Cloud SQL).
- Данная акция проводится в рамках рекламной кампании («B2B Wholesale Push»), предлагающей скидку 25% на оптовые заказы с минимальным объемом 50 единиц (облачное хранилище).
- Выручка остаётся на прежнем уровне, поскольку большой объём заказов B2B компенсирует снижение цен. Однако маржа на единицу продукции значительно снижена (примерно на 65%) из-за 25% оптовой скидки, что серьёзно угрожает общей прибыльности с учётом затрат на доставку и операционных расходов.
Краткое содержание раздела: Вы обнаружили неопровержимое доказательство в облачном хранилище: рекламная кампания B2B, предлагавшая скидку 25% на оптовые заказы. Агент обобщил результаты анализа всех трех сервисов в четкую картину. Этап расследования завершен. Далее вы примените полученные результаты на практике.
8. Создайте конвейер
Вы раскрыли дело. Теперь финансовый директор хочет, чтобы этот анализ обновлялся автоматически. В этом разделе вы попросите агента создать проект dbt , который подготовит данные из BigQuery и создаст таблицу фактов для текущего анализа AOV.
Здесь агент переходит из роли следователя в роль инженера . Вы увидите, как он создает структуру целого проекта DBT и запускает весь конвейер обработки данных, и все это из одной командной строки.
Создание каркаса для проекта dbt
- В панели чата введите следующую подсказку. Она намеренно ориентирована на достижение цели, а не на пошаговое выполнение. Вы сообщаете агенту, чего хотите, а не как это создать:
I want to productionize our AOV analysis so it updates automatically. Build a dbt project that: 1. Creates staging models for the BigQuery tables (orders and order_items) and a mart called fct_order_analysis that calculates AOV by channel and month 2. Add a uniqueness test on order_id and run dbt build - Обратите внимание на самокоррекцию: если вы развернете журнал "Работано для Ns" , вы можете увидеть, как агент проверяет наличие
dbtи, обнаружив его отсутствие, автоматически выполняет команды для создания виртуальной среды Python (.venv). Он сам настраивает среду!

- Ознакомьтесь с планом реализации: агент сгенерирует формальный план реализации. Вы можете просмотреть предлагаемые файлы и архитектуру, добавить комментарии при необходимости и нажать «Продолжить» , чтобы агент выполнил план.

- Следите за панелью чата, пока агент выполняет свой план, записывая необходимые файлы
.sqlи конфигурации YAML. После завершения и успешной компиляции проекта будет представлено краткое описание изменений. Нажмите «Принять все» , чтобы добавить эти файлы в свою рабочую область.

- Изучите созданный проект dbt в окне проводника слева. Вы должны увидеть структуру, похожую на следующую:
dbt/ ├── models/ │ ├── marts/ │ │ └── fct_order_analysis.sql │ └── staging/ │ ├── schema.yml │ ├── sources.yml │ ├── stg_order_items.sql │ └── stg_orders.sql ├── dbt_project.yml └── profiles.yml

- Щелкните по файлам модели
.sql, чтобы просмотреть SQL-код, сгенерированный агентом. Обратите внимание на то, как он обрабатывает:- Модели для подготовки : чистые, переименованные столбцы со ссылками на источники.
- Модель «умного магазина» : логика объединения и расчет AOV по каналам.
- Проверьте панель чата, чтобы убедиться, что агент подтвердил создание всех моделей и прохождение всех тестов. Результаты AOV из хранилища должны подтвердить то, что вы обнаружили во время расследования:
- Online: ~$110 - Offline: ~$110 - B2B-Wholesale: ~$75 to $77
Краткое содержание раздела: Агент создал проект dbt на основе одной целенаправленной задачи: сгенерировал модели для промежуточного хранения и хранилища данных, успешно выполнил dbt build и подтвердил аномалию AOV. Далее вы предложите агенту сложную задачу, чтобы посмотреть, как он справится со сложными задачами.
9. При сбое тестов агент выполняет отладку.
Конвейер обработки данных работает, но использует только данные BigQuery. Команда разработчиков хочет обогатить анализ данными о профилях клиентов и их питомцев из Cloud SQL, чтобы рекомендовать продукты, исходя из диетических потребностей. Это означает, что агенту необходимо преодолеть барьер Cloud SQL и обработать сложную ошибку моделирования данных — классическое «расширение» в многомерном моделировании.
В зависимости от используемой модели и её возможностей анализа, агент обработает этот запрос одним из двух способов: проактивно избегая ошибки (Вариант А) или самовосстанавливаясь после сбоя теста (Вариант Б). Давайте посмотрим, какой путь выберет ваш агент!
Инициировать запрос
- В панели чата введите:
Enrich fct_order_analysis with customer data and pet profile data from our Cloud SQL database. Include customer type and each customer's pets and dietary needs so we can recommend products. Keep the uniqueness test on order_id and run dbt build. - Наблюдайте за работой агента. Он обнаружит таблицы Cloud SQL, определит, как связать данные с BigQuery (с помощью федеративного запроса или материализованного копирования), создаст новые промежуточные модели и изменит
fct_order_analysis.sql.
Вариант А: Проактивный агент (предотвращение ошибок)
Если вы используете продвинутую модель рассуждений, агент может обнаружить сдвиг зерна еще до написания какого-либо кода . Он понимает, что, поскольку у клиента может быть несколько питомцев, прямое соединение приведет к дублированию заказов и немедленно завершится неудачей проверки уникальности, запрошенной вами для order_id .
- Обратите внимание на проактивную агрегацию : в пояснении в панели чата или в пошаговом руководстве агент может отметить, что он предварительно агрегировал данные о питомцах перед их объединением, чтобы предотвратить «классическое разветвление». Обычно это делается путем объединения нескольких питомцев для каждого клиента с помощью функции агрегации (например,
ARRAY_AGG()илиSTRING_AGG()). - Проверьте результаты :
dbt buildвыполняется успешно с первой попытки, поскольку агент заблаговременно защитил детализацию таблицы фактов. Вы можете убедиться в этом, проверив сгенерированный артефакт Walkthrough, который часто показывает успешный результат теста вместе с результатами запроса.

Если ваш агент это сделал, поздравляем! Вы стали свидетелем проактивного подхода к разработке ИИ. Уделите немного времени, чтобы просмотреть сгенерированный SQL-код в файле fct_order_analysis.sql , чтобы увидеть, как он структурировал агрегацию, а затем перейдите к следующему разделу: «Предоставьте ответ ».
Вариант B: Самовосстанавливающийся агент (отладка и диагностика)
Если модель сначала выполнит наивное прямое левое соединение, сам SQL-запрос будет выполнен успешно, но автоматизированный набор dbt test обнаружит сдвиг зернистости!
- Обратите внимание на сбой теста : вы увидите сообщение о сбое в журналах хода выполнения в панели чата:
Проверка уникальности поCompleted with 1 error Failure in test unique_fct_order_analysis_order_id Got 287 results, configured to fail if != 0
order_idвыявила дублирующиеся записи, поскольку клиенты с несколькими питомцами распределили заказы веером. - Позвольте агенту провести диагностику и самовосстановление : Поскольку тест не пройден, попросите агента выполнить отладку. В панели чата введите:
The uniqueness test failed. Can you figure out why and fix it? - Посмотрите на процесс диагностики : агент запросит данные, обнаружит связь «один ко многим» в
pet_profiles, объяснит, что прямое соединение изменяет детализацию с одной строки на заказ на одну строку на заказ на питомца , и перепишет модель для предварительной агрегации профилей питомцев:-- Pre-aggregating pets per customer to resolve fan-out LEFT JOIN ( SELECT customer_id, COUNT(*) AS num_pets, STRING_AGG(DISTINCT pet_type, ', ') AS pet_types, STRING_AGG(DISTINCT dietary_needs, ', ') AS dietary_needs FROM pet_profiles GROUP BY customer_id ) pet_agg ON c.customer_id = pet_agg.customer_id - Проверка исправления : агент снова запускает
dbt build, и на этот раз все модели материализуются, и все тесты проходят успешно!
Краткий обзор раздела: Независимо от того, удалось ли вашему агенту предотвратить ошибку или успешно устранить ее самостоятельно после сбоя теста, вы видели, как он преодолевает барьер Cloud SQL, интегрирует данные профилей клиентов и питомцев и поддерживает идеальную детализацию таблиц фактов. Теперь конвейер обработки данных надежен, завершен и полностью протестирован!
10. Дайте ответ.
Сегодня четверг. Неделя началась с обеспокоенного финансового директора и разрозненных данных по трем облачным сервисам. Теперь у вас есть первопричина и производственный конвейер. Пришло время предоставить ответ, а также перспективную рекомендацию, подкрепленную количественным прогнозом.
Напишите краткое изложение для руководителей.
- В панели чата введите:
Write an executive summary covering: - Main findings and the quantitative margin impact - Project AOV for the subsequent quarter if the B2B program continues at its current trajectory - A data-driven recommendation - Наблюдайте за работой агента.
- Проанализируйте резюме агента. Типичный и хорошо структурированный ответ должен включать в себя следующее:
- Основной вывод : в январе средний чек снизился исключительно из-за нового канала B2B-оптовой торговли. Онлайн и офлайн продажи остаются стабильными на уровне около 110 долларов.
- Первопричина : Акция "B2B Wholesale Push" (скидка 25% на оптовые заказы) привлекла 100 новых клиентов, что привело к оформлению примерно 25 000 заказов.
- Влияние на маржу : Оптовые заказы снизили среднюю прибыль на единицу продукции примерно на 65% (с ~7,50 до ~2,60 долларов).
- Выручка : Общая выручка остается неизменной, поскольку высокий объем продаж B2B компенсирует снижение цен.
Прогнозирование среднего чека с помощью AI.FORECAST
- Агент также должен составить прогноз на будущее. Найдите вызов инструмента MCP, в котором агент выполняет запрос
AI.FORECASTк BigQuery. Этот запрос использует встроенную базовую модель TimesFM для прогнозирования среднего чека на 90 дней вперед на основе исторических тенденций. Запрос должен прогнозировать средний чек на 90 дней вперед в двух сценариях: продолжение кампании (структурно заниженный средний чек) против завершения кампании (восстановление до ~110 долларов).
- Проанализируйте стратегические рекомендации агента. Надежный набор рекомендаций может включать в себя:
- Реструктуризация скидок : Введение минимальных или максимальных оптовых скидок для защиты маржи на уровне отдельных единиц продукции.
- Ужесточить минимальные объемы заказа : предотвратить злоупотребление розничными покупателями оптовыми ценами.
- Раздельная отчетность : отслеживайте показатели розничной торговли и B2B независимо друг от друга, чтобы избежать искажения данных о результатах розничной торговли.
Полная история
То, что началось в понедельник как экстренная тревога из-за падения средней стоимости заказа на 7%, имеет четкое решение для финансового директора:
- Состояние розничной торговли : Основные каналы розничной торговли остаются здоровыми и стабильными на исходном уровне.
- Приток оптовых продаж : Снижение среднего чека полностью обусловлено новым каналом оптовой торговли B2B и кампанией
BIGORDER25. - Влияние на маржу : 25-процентная оптовая скидка значительно снизила маржу на единицу продукции, поставив под угрозу прибыльность, несмотря на стагнацию выручки.
- Стратегический прогноз : Согласно прогнозу
AI.FORECAST, реструктуризация оптовых сегментов рынка восстановит средний чек.
Вы предлагаете основанные на данных рекомендации по установлению минимальных предельных значений маржи в оптовой торговле и разделению отчетности для розничной и B2B-секторов.
Краткое содержание раздела: Вы попросили агента написать краткое изложение с анализом рентабельности, сгенерировать прогноз AI.FORECAST и предоставить рекомендации, основанные на данных. Расследование завершено.
11. Уборка
Чтобы избежать постоянных расходов на ваш аккаунт Google Cloud, удалите ресурсы, созданные в этом практическом задании, запустив скрипт очистки.
- В панели Терминала внизу окна Antigravity IDE (или в Cloud Shell) перейдите в каталог codelab и выполните следующую команду:
cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x teardown.sh
./teardown.sh
- Скрипт отобразит все ресурсы, которые планирует удалить, и запросит подтверждение перед продолжением:
- Экземпляр Cloud SQL (
cymbal-pets-ops): это самый дорогостоящий ресурс. - Набор данных BigQuery (
cymbal_pets): Все таблицы и модели - Сегмент облачного хранилища (
gs://YOUR_PROJECT_ID-cymbal-pets-raw) - BigQuery connection (
cymbal-pets-cloudsql)
- Экземпляр Cloud SQL (
- Type
yto confirm. The teardown takes about 2-3 minutes.
[INFO] Deleting Cloud SQL instance cymbal-pets-ops... [ OK ] Cloud SQL instance deleted. [INFO] Deleting BigQuery dataset cymbal_pets... [ OK ] BigQuery dataset deleted. [INFO] Deleting GCS bucket gs://YOUR_PROJECT_ID-cymbal-pets-raw... [ OK ] GCS bucket deleted.
12. Congratulations!
You've successfully completed The Cymbal Pets Investigation ! You went from a vague CFO question to a fully operationalized, forecast-backed recommendation, using an AI agent that works across your entire Google Cloud data estate.
What you accomplished
- 🔍 Explored across services : Discovered and previewed assets in BigQuery , Cloud SQL , and Cloud Storage using the Data Agent Kit 's Knowledge Catalog .
- 🕵️♂️ Investigated with AI : Queried multiple services in a single chat pane conversation using MCP Tools to trace the AOV anomaly to a bulk B2B promotional campaign.
- 🔧 Built a production pipeline : Scaffolded a complete dbt project to clean, join, and test transactional and customer data.
- 🐛 Debugged a fan-out bug : Observed the agent automatically diagnose a granularity issue and refactor the dbt SQL model to pre-aggregate customer pet profiles.
- 📈 Forecasted and recommended : Used BigQuery's built-in
AI.FORECASTto model AOV trends and delivered a data-driven recommendation to the CFO.
Ключевые понятия
Концепция | What You Learned |
Инструменты MCP | Secure, auditable connections that let the AI agent query services like BigQuery, Cloud SQL, Spanner, and other databases on your behalf, with every call visible in the Chat pane |
Agent Skills | Pre-built instruction sets (like |
Cross-service investigation | The agent queries multiple Google Cloud services in a single conversation — no connection setup, no context-switching between consoles |
Goal-oriented prompting | Telling the agent what you want ("build a dbt project that calculates AOV by channel") rather than how , and letting it choose the implementation approach |
Data Agent Kit | The extension that binds everything together — MCP Tools, Agent Skills, and data discovery — giving you access to your entire Google Cloud data estate from within your IDE of choice |
Следующие шаги
- Read the Data Agent Kit documentation to learn more about its capabilities
- Learn about BigQuery ML and AI functions including
AI.FORECAST,AI.GENERATE, andAI.EMBED - Try building your own cross-service investigation with the Antigravity IDE on your own data