Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Análise com o Kit de Agente de Dados e o IDE Antigravity

1. Introdução

É segunda-feira de manhã, e o CFO acabou de mandar uma mensagem para você. O valor médio do pedido caiu 7% este mês, mas a receita total está estável. Algo não está certo, e o conselho quer respostas até sexta-feira.

Sua empresa, a Cymbal Pets, é uma das maiores varejistas on-line de produtos para animais de estimação nos EUA. Os dados necessários estão espalhados por três serviços do Google Cloud: dados de transações no BigQuery, registros de clientes e produtos no Cloud SQL e arquivos de marketing no Cloud Storage. Normalmente, para fazer uma investigação entre serviços como essa, é preciso alternar entre consoles, escrever modelos de conexão e juntar os resultados manualmente.

Neste codelab, você vai usar o Google Cloud Data Agent Kit (DAK) no IDE do Antigravity para investigar a anomalia usando linguagem natural. Você descreve o que está procurando, e o agente de IA processa as conexões, o SQL e as junções entre serviços no BigQuery, Cloud SQL e Cloud Storage. Depois de resolver o caso, peça ao agente para criar um pipeline dbt que operacionalize suas descobertas, depure um bug real de modelagem de dados e entregue uma recomendação baseada em previsão ao CFO.

Atividades deste laboratório

Descubra recursos de dados no BigQuery, no Cloud SQL e no Cloud Storage usando o Knowledge Catalog.
Investigue uma anomalia consultando vários serviços em uma única conversa usando as ferramentas do MCP
Crie um pipeline do dbt para organizar e unir dados entre serviços com modelos de organização e testes automatizados.
Depure um problema de modelo de dados enquanto o agente faz um autodiagnóstico e refatora um bug de distribuição de dados
Preveja tendências futuras e ofereça uma recomendação orientada por dados usando o AI.FORECAST do BigQuery.

O que é necessário

Um navegador da web, como o Chrome
Tenha um projeto do Google Cloud com o faturamento ativado.
Conhecimento básico de SQL e do console do Google Cloud

Este codelab é destinado a profissionais de dados intermediários (engenheiros de análise, analistas de dados, cientistas de dados).

Os recursos criados neste codelab custam menos de US $5.

2. Antes de começar

Nesta seção, você vai executar um script de configuração que provisiona todo o ambiente do laboratório: um conjunto de dados do BigQuery com dados de pedidos, uma instância do Cloud SQL Postgres com dados de clientes e produtos e um bucket do Cloud Storage com registros de campanhas promocionais. O script leva cerca de 8 a 10 minutos para ser concluído, com o provisionamento do Cloud SQL como gargalo.

Iniciar o Cloud Shell

Você vai usar o Google Cloud Shell para executar o script de configuração.

Clique em Ativar o Cloud Shell na parte de cima do console do Google Cloud.

Abrir o Cloud Shell

Depois de se conectar, defina o ID do projeto e confirme o ambiente:

gcloud config set project <<YOUR_PROJECT_ID>>
export PROJECT_ID=$(gcloud config get-value project)

Você verá uma mensagem semelhante a:

Your active configuration is: [cloudshell-####]
Updated property [core/project]

Clone o repositório

Clone o repositório do codelab no ambiente do Cloud Shell:

cd ~/
git clone --filter=blob:none --no-checkout https://github.com/GoogleCloudPlatform/devrel-demos.git
cd ~/devrel-demos
git sparse-checkout init --cone
git sparse-checkout set codelabs/agentic-data-labs
git checkout main
cd codelabs/agentic-data-labs/

Executar o script de configuração

O script de configuração prepara todo o ambiente do laboratório em alguns minutos. Ele lida com a ativação de APIs, o carregamento e o aumento de dados do BigQuery, o upload de recursos promocionais para o GCS e, em seguida, gera automaticamente um worker em segundo plano para provisionar e configurar o Cloud SQL Postgres em segundo plano enquanto você inicia o codelab.

O script gera automaticamente uma senha do Cloud SQL e a salva no arquivo .env.

cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x setup.sh setup_sql.sh
./setup.sh

Quando terminar, você verá um resumo do seu ambiente em primeiro plano:

╔══════════════════════════════════════════════════════╗
║   Base Setup complete!                               ║
╚══════════════════════════════════════════════════════╝

Your core BigQuery and GCS assets are ready.
Cloud SQL is currently provisioning in the background and will be fully ready by Step 4.

  BigQuery:   YOUR_PROJECT_ID.cymbal_pets
              ├── orders
              └── order_items

  GCS:        gs://YOUR_PROJECT_ID-cymbal-pets-raw
              └── promo_events.json

Enquanto você continua com as próximas etapas do laboratório, o banco de dados é provisionado e propagado em segundo plano. É possível monitorar o progresso a qualquer momento em um painel de terminal separado usando:

tail -f /tmp/cloudsql_setup.log

Observe a arquitetura de dados: os dados transacionais (pedidos e itens de pedidos) ficam no BigQuery, enquanto os dados operacionais (clientes, perfis de animais de estimação e produtos) ficam no Cloud SQL. Essa divisão reflete como os dados são distribuídos entre os serviços em organizações reais, e é isso que torna uma investigação entre serviços interessante.

Resumo da seção:você executou o script de configuração para inicializar o ambiente de laboratório e iniciou o provisionamento do banco de dados em segundo plano.

3. Configurar o IDE e o Data Agent Kit

Abra o IDE do Antigravity

Não é necessário esperar que o Cloud SQL termine. Abra o IDE Antigravity e conecte-o ao seu projeto do Google Cloud.

Se ainda não tiver feito isso, faça o download e instale o IDE do Antigravity na página de download do Google Antigravity.
Inicie o aplicativo para computador IDE do Antigravity.
Crie uma pasta vazia na sua máquina local (por exemplo, agentic-data-labs) e abra-a no ambiente de desenvolvimento integrado escolhendo Abrir pasta. Ele vai funcionar como seu espaço de trabalho local para o codelab.

Configurar a pasta do projeto do IDE do Antigravity

Instalar a extensão do Data Agent Kit

A extensão Google Cloud Data Agent Kit oferece integração avançada com os serviços de dados do Google Cloud diretamente no seu editor. Assim, é possível interagir com o BigQuery, o Cloud SQL, o Cloud Storage e muito mais sem mudar de contexto.

No IDE Antigravity, clique no ícone Extensões na barra de atividades, no lado esquerdo da tela (parece quatro quadrados).
Na barra de pesquisa na parte de cima do painel "Extensões", digite Google Cloud Data Agent Kit.
Localize a extensão chamada Google Cloud Data Agent Kit publicada por googlecloudtools
Clique no botão Install.
Uma mensagem pode aparecer perguntando: "Você confia no editor 'googlecloudtools' e nas extensões dele?". Clique em Confiar em editores e instalar para continuar.

Instalar a extensão do Data Agent Kit

Depois de instalado, um novo ícone do Google Cloud Data Agent Kit vai aparecer na barra de atividades, no canto esquerdo do IDE do Antigravity.

Autenticar e configurar a extensão

Após a instalação, conecte a extensão ao seu projeto do Google Cloud.

Uma página de integração intitulada "Bem-vindo ao Google Cloud Data Agent Kit" será aberta automaticamente. Se você não estiver conectado à sua conta do Cloud, siga as instruções para permitir o acesso.
Na seção Resumo da configuração, localize o campo do projeto. Clique no menu suspenso e selecione seu projeto do Google Cloud. Defina sua região como us-central1. Em seguida, selecione Configurar servidores MCP.

Configuração inicial da extensão do Data Agent Kit

No painel Configuração da MCP, clique para ativar o BigQuery e o Cloud SQL. Em seguida, clique em Começar.

Configurar servidores MCP

Conheça as opções de configuração

Quando a configuração for concluída, você vai acessar a página "Começar a usar o Google Cloud Data Agent Kit".

Em "Configuração", clique em Começar.
O painel Configuração do agente de dados será aberto. Confira as guias:
- Projeto e região:verifique o ID do projeto selecionado e se as APIs necessárias (API Cloud Storage, API BigQuery, API Catalog e API Cloud SQL Admin) estão ativadas.
- BigQuery:configure o local padrão para suas consultas do BigQuery. Use a região us-central1.
- Configurar servidores MCP:veja os servidores MCP ativados (BigQuery, Notebooks, Cloud SQL etc.) que permitem que os agentes de IA interajam com seus dados de forma segura.
- Habilidades:conheça as habilidades pré-criadas que oferecem aos agentes recursos especializados para tarefas complexas de dados.

Painel de configurações do agente de dados

Resumo da seção:você abriu o IDE Antigravity, conectou-o ao seu projeto do Google Cloud, configurou os servidores MCP remotos do Data Agent Kit e verificou a conexão executando uma consulta no BigQuery.

4. Descobrir seus dados

É hora de preparar o cenário. A situação é a seguinte: o CFO diz que o valor médio do pedido caiu 7% no mês passado, mas a receita total ficou estável. Antes de pedir que o agente investigue, entenda com quais dados você está trabalhando.

Nesta seção, você vai explorar manualmente o painel do Data Agent Kit para conhecer o ambiente. Entender seus dados antes de começar a consultá-los é uma primeira etapa essencial em qualquer investigação.

Conhecer as tabelas do BigQuery

No painel do Data Agent Kit, em CATALOG, expanda seu projeto → BigQuery → cymbal_pets.
Clique na tabela orders. Uma nova guia será aberta mostrando os detalhes da tabela.
Confira as guias no lado esquerdo do visualizador de tabelas:
- Dados: pré-visualize as linhas reais. Role o conjunto de dados e examine as colunas.
- Esquema: analise os nomes e tipos de colunas. Observe campos como order_type e promo_code, que serão importantes mais tarde.
- Outras guias (Detalhes, Insights, Perfil de dados etc.): Acesse metadados, linhagem de dados e detalhes de qualidade que você normalmente encontra no console do Google Cloud, tudo sem sair do editor.

Tabela de pedidos do BigQuery

Agora clique na tabela order_items e analise o esquema dela. Observe os campos quantity e price.

Conheça as tabelas do Cloud SQL

O script de configuração também colocou dados de clientes, animais de estimação e produtos em um banco de dados PostgreSQL no Cloud SQL.

No painel "Data Agent Kit", clique em Pesquisa universal na seção CATÁLOGO.
Na caixa de pesquisa, digite pet_profiles e pressione Enter.
Nos resultados da pesquisa, clique no resultado da tabela do PostgreSQL para pet_profiles (na instância do Cloud SQL do seu projeto). Observe que o acordeão da barra lateral se expande automaticamente, mostrando exatamente onde a tabela está na árvore do banco de dados. Agora clique na tabela customers localizada logo acima na árvore para abrir os detalhes dela e explore as guias Esquema e Detalhes.

Esquema do Cloud SQL

Conhecer os arquivos do Cloud Storage

Por fim, os registros de campanhas de marketing e promocionais são armazenados como arquivos JSON brutos no Cloud Storage.

No painel do Data Agent Kit à esquerda, expanda a seção CLOUD STORAGE. Localize o bucket bruto do seu projeto (YOUR_PROJECT_ID-cymbal-pets-raw).
Clique no arquivo promo_events.json dentro do bucket. Uma nova guia do editor é aberta, permitindo que você veja o conteúdo bruto de linhas JSON das campanhas de marketing diretamente no ambiente de desenvolvimento integrado.

Prévia de promo_events.json do Cloud Storage

Fazer um inventário

Agora você já sabe o seguinte sobre o cenário de dados:

Serviço	Tabelas	O que há lá
BigQuery	`orders`, `order_items`	~1,9 milhão de pedidos, ~4,3 milhões de itens de linha, período de 2023 a 2025
Cloud SQL	`customers`, `pet_profiles`, `products`	~92 mil clientes, ~7,6 mil perfis de animais de estimação, 206 produtos
Cloud Storage	`promo_events.json`	Registros de campanhas promocionais

Os dados são distribuídos em três serviços. Em um fluxo de trabalho tradicional, você precisaria configurar conexões, escrever código de integração e unir resultados manualmente. Na próxima etapa, você vai deixar o agente de IA cuidar de tudo isso em uma única conversa.

Resumo da seção:você usou o painel do Data Agent Kit para analisar manualmente a arquitetura de dados no BigQuery, no Cloud SQL e no Cloud Storage. Agora você sabe onde os dados estão e quais campos estão disponíveis. Portanto, pode começar a investigação.

5. Acompanhe os números

Agora a investigação começa. Você vai usar o painel de chat para pedir ao agente de IA que extraia dados do valor médio do pedido (AOV, na sigla em inglês) do BigQuery. O VMP é uma métrica de negócios que representa o valor médio em dólares gasto por pedido. O agente vai consultar em seu nome usando as ferramentas do MCP, e você poderá ver todas as consultas SQL executadas.

Extrair a tendência do valor médio do pedido

No painel de chat à direita do ambiente de desenvolvimento integrado, digite o seguinte comando e pressione Enter:

Calculate our monthly average order value from August 2024 through January 2025
using the orders and order_items tables in BigQuery.

Aprovar permissões de acesso a dados. É bom ter cautela em relação aos agentes de IA que executam consultas nos seus bancos de dados. O Data Agent Kit mantém você no controle, pausando para pedir permissão explícita antes de acessar os dados. Quando solicitado, escolha:
- Permitir desta vez:aprova um único uso, ideal para auditar consultas de alto risco.
- Sempre permitir:aprova o uso contínuo dessa ferramenta específica para a sessão.
- Não:bloqueia a ação completamente.
Para ter a melhor experiência no laboratório, selecione Sim, e sempre permitir.Observação:as permissões são concedidas por ferramenta. Em breve, você vai receber mais algumas solicitações à medida que o agente usar novas ferramentas, como list_table_ids ou execute_sql_readonly. Você pode "sempre permitir" essas solicitações também.

Solicitação de permissão da ferramenta MCP

Assista o agente trabalhar. O painel de chat também funciona como um registro de transparência de tudo o que o agente faz. Em vez de uma caixa preta, o agente mostra o raciocínio e as ações em tempo real.
Quando o agente terminar, clique no menu suspenso Trabalhou por Xm abaixo do comando para abrir o registro de trabalho completo. Aqui você pode inspecionar exatamente como ele gerou a resposta:
- Explorado:expanda esses itens para ver o agente lendo arquivos, navegando por pastas ou chamando ferramentas do MCP (como datacloud_bigquery_remote / list_table_ids e execute_sql_readonly). É possível conferir os argumentos JSON exatos transmitidos às ferramentas e o SQL executado.
- Executado:expanda esses itens para conferir os comandos de terminal executados pelo agente, como gcloud config list.

Registro de transparência do agente mostrando chamadas de ferramentas do MCP

Analise os resultados. O agente precisa retornar uma tabela de valores de AOV mensais. Confira os números: os meses anteriores ficam em torno de US$110, e janeiro cai para cerca de US$103. Essa é a anomalia sinalizada pelo CFO.

Detalhamento por canal

O VMA geral caiu, mas de onde vem essa queda? Vamos descobrir.

No painel "Chat", digite:

January looks lower than the prior months. 
Break down January's AOV by order_type to see what's going on?

O agente executa outra consulta do BigQuery, desta vez agrupando por order_type. Analise os resultados com atenção.Você vai notar algo surpreendente: o VMA on-line e off-line permanece estável em US$110. Mas há um novo canal, B2B-Wholesale, com um VMP muito menor (cerca de US$75). Esse novo canal está reduzindo a média combinada.
O agente pode sugerir proativamente a investigação dos clientes B2B. Se não for, não tem problema. Você vai fazer isso na próxima etapa.

Resumo da seção:você identificou a queda no VMP de janeiro por conta própria com uma extração de dados neutra e depois detalhou por "order_type" para identificar B2B-Wholesale como o novo canal que reduziu a média combinada. Agora você precisa descobrir quem são esses clientes B2B.

6. Atravessar o limite do serviço

Você identificou B2B-Wholesale como o canal anômalo no BigQuery, mas os dados do cliente estão no Cloud SQL. Com o Data Agent Kit, você pode continuar a mesma conversa, e ele processa o limite do serviço.

Investigar os clientes B2B

No painel de chat, digite:

Who are these B2B customers? Their profiles should be in our Cloud SQL database. 
Check for:
- Who they are
- When they signed up
- Whether they're new or existing customers

Observe com atenção o painel de chat. Desta vez, uma ferramenta MCP diferente vai aparecer. O agente agora está consultando o Cloud SQL em vez do BigQuery.Ele se conecta à instância do Cloud SQL Postgres cymbal-pets-ops e executa uma consulta na tabela customers. Clique em Mostrar detalhes para ver o SQL.
Analise os resultados. O agente precisa apresentar várias descobertas importantes:
- Todos os clientes B2B têm customer_type = 'Business'
- Todos fizeram a inscrição nos últimos 30 dias (janeiro de 2025)
- Os valores de last_name são nomes de empresas como "Pet Supply Co", "Animal Care LLC" e "Happy Paws Inc".
- São cerca de 100 pessoas, uma coorte que não existia antes deste mês.

O agente pode perceber por conta própria que muitos pedidos B2B no BigQuery têm um valor promo_code de BIGORDER25. Se ele fizer essa observação, ótimo. A investigação está progredindo naturalmente.Se o agente não mencionar o código promocional, faça uma sugestão:
```
I noticed a promo_code field on the orders table in BigQuery. 
Check what promo codes appear on the B2B-Wholesale orders?
```
O agente consulta o BigQuery novamente e descobre que aproximadamente 92% dos pedidos B2B no atacado têm promo_code = 'BIGORDER25'. Quase toda a atividade B2B está vinculada a uma única campanha promocional.O agente precisa saber de onde veio esse código promocional. Ele pode perguntar se há dados promocionais em outro lugar no ambiente. (Existe no Cloud Storage.)

Resumo da seção:o agente consultou o Cloud SQL para revelar que os clientes B2B são todas as novas empresas que se inscreveram em janeiro de 2025. Combinado com a descoberta do BigQuery de que aproximadamente 92% dos pedidos têm promo_code = 'BIGORDER25', o rastreamento agora aponta para uma campanha promocional. Hora de encontrar a fonte.

7. Encontre a peça que falta

Dois serviços concluídos, falta um. Você sabe o que aconteceu (os pedidos B2B estão reduzindo o AOV) e quem está fazendo isso (novos clientes comerciais dos últimos 30 dias). Agora você precisa descobrir por quê, e a resposta está no Cloud Storage.

Verificar o bucket do GCS

No painel de chat, digite:

Good catch on the promo code. 
We might have promotional campaign data in our GCS bucket. 
Can you check what's there?

O agente não tem uma ferramenta MCP pré-configurada para o Cloud Storage. Por isso, ele muda automaticamente para o uso da ferramenta de terminal para executar comandos gcloud storage. Ele vai pedir permissão para executar comandos como gcloud storage ls. Permita esses comandos e expanda o registro Executado no painel de chat para conferir os comandos exatos da CLI usados para ler e analisar o arquivo promo_events.json.

O agente precisa identificar três campanhas promocionais no arquivo:

Campanha	Código promocional	Desconto	Destino	Datas
Promoção de cuidados para pets de verão	`PETSUMMER15`	15% de desconto	Todos	Junho de 2024
B2B Wholesale Push (em inglês)	`BIGORDER25`	25% de desconto	B2B	Janeiro de 2025
Bônus de fim de ano para membros do programa de fidelidade	`LOYAL10`	10% de desconto	Membros do programa de fidelidade	Dec 2024

Aí está. O código promocional BIGORDER25 está associado a uma campanha chamada B2B Wholesale Push: 25% de desconto para clientes B2B com um pedido mínimo de 50 unidades. Essa é a prova definitiva.

Atividade prática

Peça ao agente para sintetizar tudo o que ele encontrou:

Put it all together. 
What happened to our average order value?

O agente oferece uma síntese clara e estruturada que conecta todas as três fontes de dados. Ele precisa explicar algo como:
1. A queda no VMP é real, mas não é um declínio nos negócios atuais. O VMP on-line e off-line permanece estável em US$110.
2. Um novo canal B2B de atacado surgiu em janeiro de 2025, com cerca de 25.000 pedidos e um VMP muito menor (US$ 75 a US$ 100).
3. Os clientes B2B são 100 novas contas empresariais que se inscreveram nos últimos 30 dias (Cloud SQL).
4. A atividade é impulsionada por uma campanha promocional ("B2B Wholesale Push") que oferece 25% de desconto em pedidos em massa com um mínimo de 50 unidades (Cloud Storage).
5. A receita fica estável porque o alto volume de pedidos B2B compensa os preços mais baixos. No entanto, as margens unitárias são muito reduzidas (erodidas em cerca de 65%) com o desconto de 25% no atacado, o que ameaça seriamente a lucratividade geral quando os custos operacionais e de frete são considerados.
É nesse momento que a investigação começa. A pergunta do CFO tem uma resposta clara: o VMA caiu porque um programa B2B orientado a marketing inundou janeiro com pedidos de alto volume e baixo preço. A empresa atual está íntegra.

Resumo da seção:você encontrou a prova no Cloud Storage: uma campanha promocional B2B que oferece 25% de desconto em pedidos em massa. O agente sintetizou descobertas dos três serviços em uma narrativa clara. A fase de investigação foi concluída. Em seguida, você vai operacionalizar essas descobertas.

8. Criar o pipeline

Você resolveu o caso. Agora, o CFO quer que essa análise seja atualizada automaticamente. Nesta seção, você vai pedir ao agente para criar um projeto dbt que organiza os dados do BigQuery e produz uma tabela de fatos para análise contínua do VMP.

É aí que o agente muda de investigador para engenheiro. Ele vai criar um projeto dbt inteiro e executar o pipeline completo, tudo com um único comando.

Estruturar o projeto do dbt

No painel de chat, digite o seguinte comando. Ele é propositalmente orientado por metas, e não por etapas. Você está dizendo ao agente o que quer, não como criar:

I want to productionize our AOV analysis so it updates automatically. Build a dbt project that:
1. Creates staging models for the BigQuery tables (orders and order_items) and a mart called fct_order_analysis that calculates AOV by channel and month
2. Add a uniqueness test on order_id and run dbt build

Observação de autocorreção:se você abrir o registro "Worked for Ns", poderá ver o agente verificar dbt e, ao descobrir que ele está faltando, executar automaticamente comandos para criar um ambiente virtual Python (.venv). Ele está cuidando da configuração do ambiente para você.

Agente configurando o ambiente virtual

Analise o plano de implementação:o agente vai gerar um plano de implementação formal. Você pode analisar os arquivos e a arquitetura propostos, adicionar comentários se necessário e clicar em Continuar para permitir que o agente execute o plano.

Plano de implementação do agente

Observe o painel de chat enquanto o agente executa o plano, gravando os arquivos .sql e as configurações YAML necessários. Quando ele terminar e compilar o projeto com sucesso, vai apresentar um resumo das mudanças. Clique em Aceitar tudo para adicionar esses arquivos ao seu espaço de trabalho.

Aceitar mudanças no código do agente

Explore o projeto dbt recém-gerado no Explorer à esquerda. Você vai ver uma estrutura semelhante a esta:

dbt/
├── models/
│   ├── marts/
│   │   └── fct_order_analysis.sql
│   └── staging/
│       ├── schema.yml
│       ├── sources.yml
│       ├── stg_order_items.sql
│       └── stg_orders.sql
├── dbt_project.yml
└── profiles.yml

Estrutura do projeto dbt no Explorador de Arquivos

Clique nos arquivos de modelo .sql para analisar o SQL gerado pelo agente. Preste atenção em como ele lida com:
- Modelos de teste: colunas limpas e renomeadas com referências de origem
- O modelo de mart: a lógica de junção e o cálculo do AOV por canal

Confira no painel de chat se o agente confirmou que todos os modelos foram materializados e todos os testes foram aprovados. Os resultados do VMA da loja precisam confirmar o que você descobriu durante a investigação:
```
- Online: ~$110
- Offline: ~$110
- B2B-Wholesale: ~$75 to $77
```

Resumo da seção:o agente criou um projeto do dbt com base em um único comando orientado a metas: modelos de teste e de data mart estruturados, executou um dbt build com êxito e confirmou a anomalia do valor médio do pedido. Em seguida, você vai fazer uma pergunta mais complexa para ver como o agente lida com isso.

9. Quando os testes falham, o agente depura

O pipeline funciona, mas usa apenas dados do BigQuery. A equipe de produtos quer enriquecer a análise com dados de perfil de clientes e animais de estimação do Cloud SQL para recomendar produtos com base nas necessidades alimentares. Isso significa que o agente precisa fazer uma ponte entre o limite do Cloud SQL e processar um bug sutil de modelo de dados, uma junção de "distribuição de dados" clássica de modelagem dimensional.

Dependendo do modelo que você está usando e das capacidades de raciocínio dele, o agente vai processar essa solicitação de uma das duas maneiras: evitando proativamente o bug (opção A) ou autocorreção após uma falha no teste (opção B). Vamos ver qual caminho seu agente vai seguir!

Acionar a solicitação

No painel de chat, digite:

Enrich fct_order_analysis with customer data and pet profile data from our Cloud SQL database. 
Include customer type and each customer's pets and dietary needs so we can recommend products. 
Keep the uniqueness test on order_id and run dbt build.

Assista o agente trabalhar. Ele vai descobrir as tabelas do Cloud SQL, descobrir como transferir os dados para o BigQuery (por consulta federada ou cópia materializada), criar novos modelos de staging e modificar fct_order_analysis.sql.

Opção A: o agente proativo (evitar bugs)

Se você estiver usando um modelo de raciocínio avançado, o agente poderá detectar a mudança de granularidade antes de escrever qualquer código. Ele percebe que, como um cliente pode ter vários animais de estimação, uma junção direta vai duplicar os pedidos e falhar imediatamente no teste de exclusividade solicitado em order_id.

Observe a agregação proativa: na explicação do painel de chat ou no artefato de tutorial, o agente pode observar que ele pré-agregou os dados de animais de estimação antes de juntá-los para evitar uma "distribuição de dados" clássica. Normalmente, isso é feito ao recolher vários animais de estimação por cliente usando uma função de agregação (por exemplo, ARRAY_AGG() ou STRING_AGG()).
Verifique os resultados: o dbt build é executado e aprovado na primeira tentativa porque o agente protegeu proativamente a granularidade da tabela de fatos. Para verificar isso, confira o artefato de tutorial gerado, que geralmente mostra a saída do teste bem-sucedido ao lado dos resultados da consulta.

Tutorial mostrando agregação proativa e testes bem-sucedidos

Se o seu agente fez isso, parabéns! Você viu a engenharia de IA proativa. Analise o SQL gerado em fct_order_analysis.sql para ver como ele estruturou a agregação e pule para a próxima seção, Fornecer a resposta.

Opção B: o agente de recuperação automática (depuração e diagnóstico)

Se o modelo escrever primeiro uma junção à esquerda direta e simples, a consulta SQL será executada com sucesso, mas o conjunto automatizado dbt test vai detectar a mudança de granularidade.

Observe a falha do teste: ela vai aparecer nos registros de progresso da execução do painel de chat:
```
Completed with 1 error

Failure in test unique_fct_order_analysis_order_id
Got 287 results, configured to fail if != 0
```
O teste de exclusividade em order_id encontrou entradas duplicadas porque os clientes com vários animais de estimação espalharam os pedidos.
Deixe o agente diagnosticar e se recuperar: como o teste falhou, peça ao agente para depurar. No painel de chat, digite:
```
The uniqueness test failed. Can you figure out why and fix it?
```

Assista ao diagnóstico: o agente vai consultar os dados, descobrir a relação de um para muitos em pet_profiles, explicar que a junção direta muda a granularidade de uma linha por pedido para uma linha por pedido por animal de estimação e reescrever o modelo para pré-agregar os perfis de animais de estimação:

-- Pre-aggregating pets per customer to resolve fan-out
LEFT JOIN (
  SELECT
    customer_id,
    COUNT(*) AS num_pets,
    STRING_AGG(DISTINCT pet_type, ', ') AS pet_types,
    STRING_AGG(DISTINCT dietary_needs, ', ') AS dietary_needs
  FROM pet_profiles
  GROUP BY customer_id
) pet_agg ON c.customer_id = pet_agg.customer_id

Verificar a correção: o agente executa dbt build novamente, e desta vez todos os modelos são materializados e todos os testes são aprovados.

Resumo da seção:seja evitando proativamente o bug ou se recuperando após uma falha no teste, o agente demonstrou capacidade de transpor o limite do Cloud SQL, integrar dados de perfil de clientes e animais de estimação, além de manter a granularidade perfeita da tabela de fatos. O pipeline agora está robusto, completo e totalmente testado.

10. Entregar a resposta

É quinta-feira. Você começou a semana com um CFO preocupado e dados espalhados por três serviços de nuvem. Agora você tem a causa raiz e um pipeline de produção. É hora de dar a resposta, junto com uma recomendação prospectiva apoiada por uma previsão quantitativa.

Escreva o resumo executivo

No painel de chat, digite:

Write an executive summary covering:
- Main findings and the quantitative margin impact
- Project AOV for the subsequent quarter if the B2B program continues at its current trajectory
- A data-driven recommendation

Assista o agente trabalhar.
Observação sobre formatos de saída e variação:os modelos de linguagem grandes não são deterministas. Dependendo do modelo ativo, o agente pode gerar o resumo executivo diretamente no painel de chat ou criar um arquivo Markdown dedicado (como executive_summary_cfo.md ou output.txt) e vincular no chat.

Os números exatos, os totais calculados (como possível perda de margem ou quedas médias no VPA) e o layout de formatação vão variar de execução para execução. O que importa é a lógica estrutural principal das descobertas.
Analise o resumo executivo do agente. Uma resposta típica e bem estruturada deve abordar:
- Principal descoberta: o AOV de janeiro caiu apenas devido ao novo canal B2B-Wholesale. On-line e off-line permanecem estáveis em US$110.
- Causa principal: a promoção "B2B Wholesale Push" (25% de desconto em pedidos em massa) atraiu 100 novas contas, gerando cerca de 25.000 pedidos.
- Impacto na margem: os pedidos no atacado reduziram o lucro médio por unidade em cerca de 65% (de US$7,50 para US$2,60).
- Receita: receita geral estável, já que o alto volume de B2B compensa os preços mais baixos.

Prever o VMA com AI.FORECAST

O agente também precisa gerar uma projeção para o futuro. Procure uma chamada da ferramenta MCP em que o agente executa uma consulta AI.FORECAST no BigQuery. Isso usa o modelo de fundação TimesFM integrado para projetar o VMA em 90 dias com base em tendências históricas. A consulta deve projetar o VMA em 90 dias em dois cenários: continuação da campanha (VMA estruturalmente deprimido) x encerramento da campanha (recuperação para ~$110).

Incentivo (se o agente não usar AI.FORECAST): se o agente fornecer uma projeção qualitativa em vez de quantitativa, tente:

Use BigQuery's AI.FORECAST function to generate a 90-day forecast with confidence intervals.

Analise as recomendações estratégicas do agente. Um conjunto robusto de recomendações pode incluir:
- Reestruture os descontos: implemente preços mínimos de margem ou limite os descontos em massa para proteger as margens no nível da unidade.
- Imponha MOQs mais rigorosos: evite que compradores de varejo abusem dos preços de atacado.
- Relatórios separados: acompanhe as divisões de varejo e B2B de forma independente para não mascarar a performance do varejo.

A história completa

O que começou na segunda-feira como um simulado de incêndio devido a uma queda de 7% no valor médio do pedido tem uma resolução clara para o CFO:

Saúde do varejo: os principais canais de varejo permanecem íntegros e estáveis no nível de referência.
Aumento no atacado: a queda no VMC é totalmente devido ao novo canal de atacado B2B e à campanha BIGORDER25.
Impacto na margem: o desconto por atacado de 25% reduziu muito as margens unitárias, ameaçando a lucratividade apesar da receita estável.
Previsão estratégica: uma projeção AI.FORECAST mostra que a reestruturação dos níveis de atacado vai restaurar o VMP combinado.

Você oferece uma recomendação baseada em dados para estabelecer limites mínimos de margem no atacado e relatórios separados de varejo/B2B.

Resumo da seção:você pediu para o agente escrever um resumo executivo com análise de margem, gerar uma projeção AI.FORECAST e fornecer uma recomendação baseada em dados. A investigação foi concluída.

11. Limpeza

Para evitar cobranças contínuas na sua conta do Google Cloud, exclua os recursos criados neste codelab executando o script de encerramento.

No painel Terminal na parte de baixo do IDE do Antigravity (ou no Cloud Shell), acesse o diretório do codelab e execute:

cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x teardown.sh
./teardown.sh

O script vai mostrar todos os recursos que planeja excluir e pedir confirmação antes de continuar:
- Instância do Cloud SQL (cymbal-pets-ops): é o recurso mais caro.
- Conjunto de dados do BigQuery (cymbal_pets): todas as tabelas e modelos
- Bucket do Cloud Storage (gs://YOUR_PROJECT_ID-cymbal-pets-raw)
- Conexão do BigQuery (cymbal-pets-cloudsql)
Digite y para confirmar. A desmontagem leva cerca de 2 a 3 minutos.

[INFO]  Deleting Cloud SQL instance cymbal-pets-ops...
[ OK ]  Cloud SQL instance deleted.
[INFO]  Deleting BigQuery dataset cymbal_pets...
[ OK ]  BigQuery dataset deleted.
[INFO]  Deleting GCS bucket gs://YOUR_PROJECT_ID-cymbal-pets-raw...
[ OK ]  GCS bucket deleted.

12. Parabéns!

Você concluiu A investigação dos bichinhos de estimação de Cymbal. Você passou de uma pergunta vaga do CFO para uma recomendação totalmente operacionalizada e respaldada por previsões, usando um agente de IA que funciona em todo o patrimônio de dados do Google Cloud.

O que você realizou

🔍 Explorado em vários serviços: ativos descobertos e visualizados em BigQuery, Cloud SQL e Cloud Storage usando o Knowledge Catalog do Data Agent Kit.
🕵️‍♂️ Investigação com IA: consultou vários serviços em uma única conversa no painel de chat usando as ferramentas do MCP para rastrear a anomalia do VMA até uma campanha promocional B2B em massa.
🔧 Criou um pipeline de produção: gerou um projeto completo do dbt para limpar, unir e testar dados transacionais e dados do cliente.
🐛 Depuração de um bug de distribuição de dados: o agente diagnosticou automaticamente um problema de granularidade e refatorou o modelo SQL dbt para pré-agregar perfis de animais de estimação dos clientes.
📈 Previsto e recomendado: usamos o AI.FORECAST integrado do BigQuery para modelar tendências de AOV e entregamos uma recomendação baseada em dados ao CFO.

Principais conceitos

Conceito	O que você aprendeu
Ferramentas do MCP	Conexões seguras e auditáveis que permitem que o agente de IA consulte serviços como BigQuery, Cloud SQL, Spanner e outros bancos de dados em seu nome, com cada chamada visível no painel de chat
Habilidades do agente	Conjuntos de instruções pré-criados (como `dbt-bigquery` ou `discovering-gcp-data-assets`) que ensinam ao agente as práticas recomendadas específicas do domínio sem que você precise pedir
Investigação entre serviços	O agente consulta vários serviços do Google Cloud em uma única conversa, sem configuração de conexão nem troca de contexto entre consoles.
Comandos orientados a metas	Dizer ao agente o que você quer ("crie um projeto do dbt que calcule o VMP por canal") em vez de como, e deixar que ele escolha a abordagem de implementação
Data Agent Kit	A extensão que une tudo: ferramentas do MCP, habilidades do agente e descoberta de dados. Assim, você tem acesso a todos os seus dados do Google Cloud no IDE de sua preferência.

Próximas etapas

Leia a documentação do Data Agent Kit para saber mais sobre os recursos dele.
Saiba mais sobre as funções de IA e do BigQuery ML, incluindo AI.FORECAST, AI.GENERATE e AI.EMBED.
Crie sua própria investigação entre serviços com o IDE do Antigravity usando seus dados

Análise com o Kit de Agente de Dados e o IDE Antigravity

1. Introdução

Atividades deste laboratório

O que é necessário

2. Antes de começar

Iniciar o Cloud Shell

Clone o repositório

Executar o script de configuração

3. Configurar o IDE e o Data Agent Kit

Abra o IDE do Antigravity

Instalar a extensão do Data Agent Kit

Autenticar e configurar a extensão

Conheça as opções de configuração

4. Descobrir seus dados

Conhecer as tabelas do BigQuery

Conheça as tabelas do Cloud SQL

Conhecer os arquivos do Cloud Storage

Fazer um inventário

5. Acompanhe os números

Extrair a tendência do valor médio do pedido

Detalhamento por canal

6. Atravessar o limite do serviço

Investigar os clientes B2B

Conectar o código promocional

7. Encontre a peça que falta

Verificar o bucket do GCS

Atividade prática

8. Criar o pipeline

Estruturar o projeto do dbt

9. Quando os testes falham, o agente depura

Acionar a solicitação

Opção A: o agente proativo (evitar bugs)

Opção B: o agente de recuperação automática (depuração e diagnóstico)

10. Entregar a resposta

Escreva o resumo executivo

Prever o VMA com AI.FORECAST

A história completa

11. Limpeza

12. Parabéns!

O que você realizou

Principais conceitos

Próximas etapas