Teste de interface automatizado com a CLI do Antigravity (AGY), BrowserMCP, Playwright e o agente do navegador

1. Introdução

A revolução da IA agêntica está transformando a maneira como criamos softwares, tornando todo o processo incrivelmente legal, emocionante e acessível. Tarefas e projetos que antes levavam meses para serem concluídos pelos desenvolvedores agora podem ser realizados em uma única sessão usando ferramentas agênticas.

Uma área propícia a essa transformação agêntica é o teste de aplicativos da Web. Tradicionalmente, testar apps da Web é uma tarefa difícil e uma batalha constante contra a fragilidade. Mas e se você pudesse evitar essa complexidade completamente? E se você pudesse simplesmente dizer a um agente o que testar em linguagem natural e deixar que ele pensasse em como executar isso?

b09119516acbc09e.png

Neste codelab, vamos mostrar como usar a CLI do Antigravity com habilidades do agente e ferramentas multimodais do MCP, como o BrowserMCP. Você vai aprender a criar e executar testes de interface automatizados usando linguagem natural, mostrando como as ferramentas agênticas podem lidar com tarefas complexas e dar superpoderes a você como criador.

É importante ressaltar que, embora este codelab se concentre nos casos de uso específicos de automação de interface e controle remoto do navegador, os princípios básicos e o vasto mundo de possibilidades que eles desbloqueiam são realmente importantes. Ao ensinar os agentes a usar CLIs locais e servidores MCP, podemos delegar fluxos de trabalho complexos que, de outra forma, não teríamos tempo ou experiência especializada para lidar.

O que você aprenderá

  • O que é a CLI do Antigravity e como ela se encaixa no ecossistema do Antigravity.
  • O que é o Protocolo de Contexto de Modelo (MCP) e por que ele é revolucionário.
  • Como o BrowserMCP permite que agentes de IA controlem navegadores da Web.
  • Como executar testes automatizados de interface com a CLI do Antigravity.
  • Entender as habilidades dos agentes e as vantagens delas.
  • Ensinar um agente a usar o Playwright com uma habilidade.
  • Entender o agente de navegador integrado do Antigravity.
  • Outros casos de uso para o controle do navegador.

O que você vai fazer

Este codelab usa a CLI do Antigravity, ferramentas do MCP, habilidades de agente e um aplicativo de demonstração do React.

Você vai:

  • Configure o ambiente de desenvolvimento.
  • Conheça um aplicativo de demonstração que precisa ser testado.
  • Use a CLI do Antigravity para interagir com o aplicativo pelo BrowserMCP.
  • Ensine seu agente a usar o Playwright com uma habilidade do agente.

2. O ecossistema do Antigravity

Em maio de 2026, o Google lançou o novo pacote Antigravity. Essa foi uma grande revisão do Antigravity, que foi dividido nestes quatro produtos:

  • O Antigravity 2.0, que agora é o ambiente dedicado de "criador" centrado em agentes no seu computador. Ele não inclui um IDE. Em vez disso, agora interagimos apenas com o gerenciador de agentes. Essa plataforma tem como objetivo inaugurar a era de "ideia para produto" usando agentes, sem se preocupar com o código. Muitos criadores de conteúdo que não têm experiência em programação vão adorar isso.
  • O IDE do Antigravity, que oferece o ambiente de programação mais familiar do VS Code, com suporte da estrutura do agente do Antigravity. Nele, é possível fazer o desenvolvimento assistido por agente, e o código sempre aparece. Os programadores vão se sentir em casa.
  • SDK do Antigravity, que oferece o arnês e as ferramentas que alimentam o Antigravity, mas expostos como um SDK do agente Python. Ao importar de google.antigravity, podemos aproveitar as funcionalidades do Antigravity de maneira programática.
  • CLI do Antigravity, que é a próxima evolução da incrível CLI do Gemini. Ele ainda é um ambiente de terminal para interagir com os modelos do Gemini. Mas a nova CLI do Antigravity foi criada em Go, e isso é perceptível. Ela é muito mais rápida que a CLI do Gemini, tanto na inicialização quanto no uso geral. Ele usa a mesma estrutura de software do agente do Antigravity 2.0 e do IDE, o que permite configurações comuns em toda a suíte Antigravity.

Embora este laboratório se concentre no uso da CLI do Antigravity, tudo nele também pode ser feito com o Agy IDE ou o Agy 2.0.

3. Pré-requisitos

Antes de começarmos, vamos verificar se você tem tudo o que precisa.

Ferramentas

Este laboratório pressupõe que você já tenha:

Para usar a CLI do Antigravity, você precisa fazer a autenticação com o Google. Na primeira vez que você iniciar o agy, ele vai pedir automaticamente para fazer Login do Google no navegador da Web padrão. Essa opção vem com uma cota sem custo financeiro generosa de uso do Gemini e não exige um projeto na nuvem do Google Cloud. Se você tiver uma chave de API do Gemini ou um projeto do Google Cloud, também poderá configurar isso.

As instruções presumem que você está trabalhando em um ambiente Linux (ou WSL) ou macOS. Se você estiver no Windows (como eu), siga as instruções usando o WSL.

O BrowserMCP não funciona no Google Cloud Shell porque só se conecta a um navegador local em execução na mesma máquina.

Configurar o ambiente de desenvolvimento

Criei um repositório de demonstração no GitHub. Ele inclui um aplicativo de exemplo que podemos usar para nossos testes de UI. Clone o repositório executando este comando no terminal local:

git clone https://github.com/derailed-dash/agentic-ui-testing
cd agentic-ui-testing

Há um Makefile para facilitar a configuração do ambiente e o lançamento do app de demonstração. Execute-o para inicializar o ambiente:

make install

# Or if you don't have make
npm install --prefix demo-app

4. Nosso aplicativo de demonstração

O app que vamos testar hoje é o Dazbo Omni-Dash, um painel futurista com tema escuro para gerenciar a telemetria de segurança. (Sim, foi vibe coded!)

3b004164e4db3f8e.png

Por que esse app?

Ele foi criado para oferecer uma superfície de teste realista com:

  • Autenticação simulada: um fluxo de login que exige credenciais específicas.
  • Conteúdo dinâmico: cards de telemetria e registros de segurança que simulam dados em tempo real.
  • Estados interativos: menus de navegação e entradas de formulário que mudam com base na ação do usuário.
  • Tecnologia moderna: criado com React e Vite para uma experiência rápida e responsiva.

Como iniciar o app

Para iniciar o aplicativo, execute:

make dev

# Or if you don't have make
npm run dev --prefix demo-app

O servidor de desenvolvimento deve ser iniciado rapidamente, e o app vai estar disponível em http://localhost:5173.

dbd4ccd437f0ef92.png

Basta clicar no link para abrir o aplicativo no navegador. Basta deixar esse processo em execução no terminal. Vamos executar os comandos de terminal subsequentes em uma sessão separada.

5. O desafio dos testes de interface

É notório que os testes de UI tradicionais são difíceis de fazer corretamente e ainda mais difíceis de manter. Os problemas comuns incluem:

  • Alta curva de aprendizado: exige que os desenvolvedores invistam muito tempo para dominar linguagens complexas específicas do domínio e peculiaridades específicas da estrutura (como Selenium ou Playwright) apenas para automatizar uma interação básica.
  • Seletores e automação frágeis: os scripts tradicionais dependem de estruturas DOM rígidas (como div > div > button) ou rótulos de texto específicos. O que acontece se você renomear um botão "Sair" para "Desconectar"? Ou mover um botão para um menu completamente diferente? Ou mudar a estrutura do seu HTML? As ferramentas de teste tradicionais falham quando você faz essas coisas, o que leva à manutenção constante de scripts.
  • Teste "Flakiness": testes que são aprovados em um minuto e falham no seguinte devido a problemas de tempo, condições de disputa ou recursos de carregamento lento.
  • Paridade de ambiente: dificuldade em replicar estados de aplicativos e sobrecarga de limpeza de dados de teste.

7afb2d2f08c71c32.png

Objetivo x implementação

Para resolver esses problemas, precisamos de uma maneira de testar que se concentre na intenção, e não na implementação.

Ao usar ferramentas de IA agêntica, podemos criar uma automação repetível completamente isolada de pequenos ajustes na interface e mudanças estruturais. Em vez de codificar nomes, rótulos ou a hierarquia exata de objetos, o agente executa ações com base na intenção do usuário em linguagem natural. Se um botão se mover ou o rótulo mudar um pouco, os recursos multimodais do agente permitirão que ele localize o elemento e conclua a tarefa com sucesso.

6. MCP ao resgate

O Protocolo de Contexto de Modelo (MCP) é um padrão aberto que permite que modelos e agentes de IA interajam com ferramentas, APIs e dados externos. É como um adaptador universal que permite que modelos e agentes encontrem e executem as ferramentas a que têm acesso.

Tradicionalmente, a integração de modelos de linguagem grandes (LLMs) com dados e ferramentas externos exigia que os desenvolvedores escrevessem conexões de API personalizadas e codificadas para cada nova fonte de dados, criando um problema de integração "M x N" insustentável em que cada novo modelo e ferramenta multiplica o trabalho de manutenção. O Protocolo de Contexto de Modelo (MCP) resolve isso removendo a necessidade de escrever um código específico para orquestrar esses recursos. Em vez de codificar explicitamente fluxos de trabalho de execução complexos, os desenvolvedores podem confiar no LLM para interpretar as solicitações de linguagem natural de um usuário e decidir dinamicamente quais ferramentas usar.

Quando um usuário emite um comando em linguagem natural (como "Navegue até localhost:5173, faça login como "admin" e clique no botão "Enviar"), o LLM descobre os recursos disponíveis e gera uma solicitação estruturada para invocar uma ferramenta específica. O cliente do MCP atua como um tradutor, encaminhando essa solicitação ao servidor do MCP designado, que executa a ação ou busca os dados e retorna o contexto ao modelo. Isso permite que a IA aja de forma autônoma sem que o desenvolvedor precise codificar o caminho de execução específico.

86d97bfc6d81bee7.png

Como o MCP cria um padrão universal, muitas vezes descrito como o "USB-C para aplicativos de IA", ele desbloqueia uma enorme reutilização pronta para uso. Os desenvolvedores podem criar um servidor MCP uma vez, e qualquer apresentador de IA compatível com o MCP pode se conectar a ele instantaneamente, eliminando o problema de integração M x N. Não é mais necessário criar pontes de API personalizadas para cada plataforma. Em vez disso, você pode aproveitar o ecossistema de servidores MCP de código aberto pré-criados para serviços comuns, como GitHub, Slack, bancos de dados e muito mais, conectando-os diretamente aos seus fluxos de trabalho de agente. Essa arquitetura modular e plug-and-play garante que, se você mudar de provedor de LLM ou atualizar suas ferramentas mais tarde, a infraestrutura de integração principal vai permanecer completamente inalterada.

7. Automação com o BrowserMCP

O que é o BrowserMCP?

Esta é a primeira ferramenta que vamos usar hoje. O BrowserMCP é um servidor MCP que dá aos agentes de IA os "olhos" e as "mãos" necessários para interagir com um navegador da Web. Em resumo, ele imita a interação humana com um navegador. Ele é de código aberto, e você pode conferir o repositório do GitHub aqui. Consulte a documentação principal do BrowserMCP aqui.

9f43c65a25e21d2c.png

Confira alguns dos recursos:

  • Ele pode navegar até URLs.
  • Ele pode inspecionar o DOM.
  • Ele pode clicar em botões e digitar texto em formulários.
  • É possível arrastar e soltar.
  • Ele pode ler registros do console do navegador.
  • É rápido: a automação acontece localmente na sua máquina.

Instalar o MCP do navegador

Para usar o BrowserMCP, você precisa fazer duas coisas:

  1. Instale a extensão BrowserMCP no Chrome ou em qualquer navegador baseado no Chromium.
  2. Configure o servidor MCP manualmente na configuração do Antigravity.

Para instalar a extensão, siga as instruções aqui. Isso leva apenas alguns segundos. Depois de instalada, clique em "Conectar" na extensão para permitir que a guia atual seja controlada pelo seu agente. Obviamente, você quer que a guia atual seja aquela em que o aplicativo de demonstração está sendo executado.

6008c83a31bed7ea.png

Em seguida, vamos configurar o servidor MCP real no Antigravity. Para isso, adicione a definição do servidor browsermcp ao arquivo mcp_config.json global.

Crie ou edite o arquivo ~/.gemini/config/mcp_config.json e adicione a seguinte configuração:

{
  "mcpServers": {
    "browsermcp": {
      "command": "npx",
      "args": [
        "-y",
        "@browsermcp/mcp@latest"
      ]
    }
  }
}

Para um tutorial detalhado sobre como configurar servidores e habilidades do MCP no ecossistema do Antigravity, consulte estes recursos:

Teste com o BrowserMCP

Agora, a mágica. Primeiro, vamos iniciar a CLI do Antigravity (executando agy) em uma nova sessão de terminal. Lembre-se de que o aplicativo de demonstração está sendo executado na nossa sessão de terminal inicial. Na TUI interativa, digite /mcp para verificar a lista de ferramentas ativas e garantir que browsermcp esteja disponível.

Se você não iniciou o aplicativo de demonstração antes, faça isso agora:

make dev

Se ainda não tiver feito isso, abra o app no navegador Chrome e conecte a extensão BrowserMCP nessa guia. Siga o link do comando run. Em seguida, clique no ícone da extensão BrowserMCP e em "Conectar".

86aeb8303e5d18ad.png

Agora podemos usar a CLI do Agy para executar um teste. Copie e cole este comando na CLI:

Using BrowserMCP, connect to the application at http://localhost:5173. If the application is not showing a login screen, first logout. Then login as 'admin' with password 'password', and verify that the dashboard title says 'System Overview'. In the main dashboard, read the telemetry values shown, and present them back to me in a markdown table.

A CLI pode primeiro verificar se o aplicativo de demonstração está sendo executado na porta especificada. Em seguida, ela vai pedir que você confirme as ações que planeja realizar.

99d6dee1eb7f6bd1.png

Permite que a CLI execute todas as ferramentas do BrowserMCP para esta sessão. Em seguida, volte para o navegador e assista às interações automatizadas acontecerem.

Algumas observações sobre o comando acima:

  • Primeiro, pedimos ao agente para fazer logout, caso o aplicativo já esteja conectado. Não é necessário pedir que ele clique em um texto específico, como "Sair do Gateway". Ele é inteligente o suficiente para saber onde clicar.
  • Depois de fazer login e renderizar a página principal, o agente captura as informações de telemetria. Não é necessário dizer ao agente para procurar em blocos específicos ou corresponder a palavras específicas. Portanto, se estendermos ou mudarmos as informações mostradas nesta página, o comando ainda vai funcionar, e a saída ainda será capturada na nossa tabela Markdown.

Legal, né?

Por enquanto, terminamos com o BrowserMCP. Desconecte no navegador.

8. Automação com habilidades e Playwright

Limitações do BrowserMCP

O BrowserMCP é ótimo, mas tem algumas limitações. Exemplo:

  • Ele exige uma sessão de navegador aberta com a extensão BrowserMCP conectada. Ela não gera novas sessões.
  • Ele não é compatível com navegadores que não são baseados no Chromium.
  • Ele exige que um processo de navegador separado seja executado na mesma máquina em que o servidor MCP está sendo executado.
  • Ele não funciona com o sistema de arquivos local. Por exemplo, não é possível criar arquivos locais para evidenciar capturas de tela nem baixar e armazenar arquivos do aplicativo da Web, como PDFs para download.
  • Ele não é determinista. Ele tenta realizar as ações que você pede, mas o estado local, como um pop-up inesperado, pode interromper a interação.
  • Ele não oferece suporte à operação "sem interface gráfica", ou seja, não pode ser executado em um pipeline de CI/CD sem uma janela de navegador real.

Playwright

O Playwright é uma ferramenta muito mais sofisticada. É um framework de teste e automação de navegador de código aberto bem estabelecido. Ele pode fazer muitas coisas que o BrowserMCP não consegue, incluindo todos os itens que mencionei acima.

Ele é muito mais adequado para executar cenários de teste complexos, confiáveis e repetíveis. Ele é particularmente adequado para trabalhar com sessões de longa duração ou executar várias sessões independentes em paralelo.

Mas com essa capacidade adicional, a curva de aprendizado fica muito mais acentuada.

Habilidades

Felizmente, não precisamos aprender a usar o Playwright diretamente. Em vez disso, podemos usar uma habilidade do agente.

fdadb11ff7d25b75.png

Então, o que é uma habilidade de agente? Pense nisso como um pacote compacto de experiência no domínio que você pode entregar ao seu agente de IA quando ele precisar fazer algo específico. Ele contém instruções, práticas recomendadas e, às vezes, até scripts auxiliares personalizados para uma tarefa específica.

A parte mais inteligente é a divulgação progressiva. Em vez de inserir todos os documentos de API e regras de framework de teste imagináveis no comando inicial do sistema do LLM, o que consome sua janela de contexto e gasta tokens sem parar, o agente só lê a habilidade quando realmente precisa dela. Ele mantém o contexto de referência simples e direto, buscando o "como fazer" detalhado na hora certa. E sim, uma habilidade pode incluir instruções sobre como usar servidores MCP específicos para realizar o trabalho.

Pense na cena do filme Matrix: o agente olha para um problema, percebe que precisa conhecer o Playwright, baixa a habilidade e, de repente, diz: "Eu sei kung fu". Pronto. Especialista instantâneo.

Para saber mais sobre habilidades, confira o seguinte:

Por que as habilidades são perfeitas para o Playwright

Usar uma skill aqui é uma ótima escolha. O Playwright é incrivelmente poderoso, mas sua sintaxe pode ser complicada. Ao dar ao agente uma skill de Playwright, não precisamos nos preocupar com nosso LLM alucinando com sintaxe desatualizada ou escrevendo seletores frágeis. Estamos fornecendo a ele um guia completo e confiável sobre como usar o Playwright corretamente.

Vou usar a CLI do Playwright e a habilidade associada.

Com essa abordagem, instalamos a CLI do Playwright localmente e damos ao nosso agente o conhecimento necessário para usá-la. Para evitar confusão: não estou instalando nenhum servidor MCP do Playwright.

Instalando

Primeiro, vamos instalar a CLI do Microsoft Playwright de código aberto. Se ainda não tiver feito isso, saia da CLI interativa digitando /quit``. Em seguida, no terminal:

# Pre-req: nodejs installed
npm install -g @playwright/cli@latest # Install Playwright CLI globally
npm install @playwright/test # Install Playwright test framework

npx playwright install-deps # Install dependencies
npx playwright install chromium chrome # Install browser binaries in Linux / WSL

Agora vamos adicionar a habilidade. Esse comando vai baixar a subpasta de habilidade diretamente do GitHub para a pasta de habilidades do Gemini:

mkdir -p ~/.gemini/skills
npx degit microsoft/playwright-cli/skills/playwright-cli ~/.gemini/skills/playwright-cli

Agora podemos testar.

# Launch Playwright CLI with visible browser
playwright-cli open https://playwright.dev --headed

Isso vai gerar uma sessão do navegador aberta no URL especificado.

Também quero que o Gemini possa usar o Playwright no modo "headed", ou seja, com uma interface visível. Mas a skill não diz ao Gemini como fazer isso. Por isso, adicionei estas linhas a ~/.gemini/skills/playwright-cli/SKILL.md na seção Core:

# Add the following under the "playwright-cli open" command

# Run in headed mode so we can see the browser
playwright-cli open https://playwright.dev --headed

Como testar com o Playwright

Como antes, precisamos iniciar o aplicativo, caso ele ainda não esteja em execução. Faça isso na sessão inicial do terminal:

make dev

Em seguida, na outra sessão do terminal, desative temporariamente o BrowserMCP para que o agente não fique confuso sobre quais ferramentas usar. Reinicie a CLI do Antigravity (agy). É possível desativar temporariamente o servidor browsermcp diretamente pela TUI:

  1. Digite /mcp na caixa de comando para abrir o painel de gerenciamento do MCP.
  2. Use as teclas de seta (para cima/para baixo) para selecionar browsermcp e pressione Enter/Return.
  3. Mova para a direita para selecionar "Desativar" e pressione "Enter" para desativar.

a032a59a430662e3.png

Agora vamos pedir ao agente para navegar até nosso aplicativo com o Playwright. Mas, ao contrário do BrowserMCP, não precisamos iniciar o navegador primeiro. O Playwright fará isso para nós com um processo local.

Insira este comando na CLI do Agy:

Using Playwright, connect to the application at http://localhost:5173. Then login as 'admin' with password 'password', and verify that the dashboard title says 'System Overview'. Take a screenshot of the dashboard and save it to output/dashboard.png. In the main dashboard, read the telemetry values shown, and present them back to me in a markdown table.

Como sempre, a CLI vai pedir permissão antes de executar qualquer ferramenta.

O que há de diferente aqui?

  • Não precisamos iniciar o navegador primeiro.
  • Não precisamos iniciar e conectar uma extensão do navegador.
  • Não precisamos pedir que o agente faça logout primeiro. O teste é instanciado de uma sessão "limpa".
  • Podemos fazer capturas de tela e salvá-las como arquivos locais.

Pouco depois, você vai encontrar um arquivo dashboard.png na pasta de saída.

As chamadas de função serão executadas na CLI do Agy, mas não na interface do navegador. Isso acontece porque o Playwright é executado no "modo headless" por padrão.

Mas se você executar novamente com esse comando revisado, também poderá ver a interface:

Using Playwright, connect to the application at http://localhost:5173 in **headed** mode, and keep the browser open when you're done. Login as 'admin' with password 'password', and verify that the dashboard title says 'System Overview'. Take a screenshot of the dashboard and save it to output/dashboard.png. In the main dashboard, read the telemetry values shown and record them. Then wait 3 seconds, read them again. Now present the data back to me in a markdown table.

A saída da CLI Agy será parecida com esta:

c8d69d883439b7c7.png

Incrível, não é?

9. Agente de navegador integrado do Antigravity

O Google Antigravity vem equipado com um agente de navegador integrado ( subagente do navegador) que oferece automação de navegador pronta para uso, sem exigir a instalação de uma ferramenta separada, como a CLI do Playwright.

Como funciona

Para controlar o navegador, o agente integrado funciona diretamente pelo protocolo Chrome DevTools (CDP, na sigla em inglês), eliminando a necessidade de extensões ou plug-ins intermediários no Antigravity 2.0 e no ambiente de desenvolvimento integrado.

Quando iniciado, o Antigravity se conecta à sua instância do Chrome por uma porta de depuração local em uma conexão WebSocket. As instruções de alto nível do agente são traduzidas diretamente em comandos de CDP de baixo nível que:

  • Manipular o DOM da página (como clicar em elementos ou inserir texto).
  • Controla o estado do navegador e aciona a navegação.
  • Capturar frames e dados visuais em tempo real.

Ao combinar o controle direto da CDP com a análise visual e multimodal, o subagente pega sua meta de alto nível (por exemplo, "verifique se o painel mostra os valores de telemetria corretos"), analisa a página visualmente para descobrir quais ações são necessárias e as executa. Ele também grava vídeos e faz capturas de tela das ações automaticamente, salvando-os diretamente no seu espaço de trabalho como Artefatos para servir como prova visual da execução do teste.

Disponibilidade da ferramenta

O agente de navegador integrado ainda não é compatível com a CLI do Antigravity (CLI Agy) que prioriza o terminal. No entanto, você pode usar o recurso imediatamente na IDE do Antigravity e no Antigravity 2.0. Esperamos que o suporte ao agente do navegador chegue à CLI do Agy em uma versão futura.

Observação para usuários do WSL: agora é muito mais fácil fazer o agente do navegador funcionar no Antigravity com o WSL. Em vez de lidar com roteamento de rede e encaminhamento de portas complexos, basta ativar o modo de rede "espelhado" na configuração do WSL. Para um tutorial completo, consulte o guia Resolvendo a fricção do WSL com o Google Antigravity: Agy 2.0 e Agy IDE Edition (em inglês).

10. Outros casos de uso da automação de navegador

A automação de navegador não se limita a garantir que o botão de login funcione antes de uma implantação na sexta-feira à tarde. Quando você percebe que pode conectar um LLM diretamente a um navegador, um mundo totalmente novo de projetos autônomos e criados em casa se abre.

Se você estiver criando seus próprios agentes de IA, confira algumas maneiras de usar ferramentas como o BrowserMCP ou a CLI do Playwright para fazer o trabalho pesado:

  • O assistente de pesquisa pessoal:imagine apontar seu agente para um URL específico e pedir que ele pesquise um tema, mas o site exige login e navegação por menus complexos. Em vez de escrever um web scraper personalizado que vai parar de funcionar na semana que vem, basta pedir que o agente faça login, navegue até os dados e resuma tudo para você.
  • O integrador "Swivel-Chair":todos nós temos aqueles sistemas legados de intranet que não têm APIs. Você sabe quais são: quando é preciso copiar manualmente os dados do sistema A e colar em um formulário no sistema B. Um agente com automação de navegador pode atuar como uma cola universal, lendo a tela do sistema legado e preenchendo o formulário no novo.
  • Triagem e correção automatizadas:recebeu um alerta P1 do seu sistema de monitoramento às 3h? O agente pode abrir automaticamente o URL do painel específico, ler os gráficos ou registros (usando os recursos de visão multimodal) e postar um resumo diretamente no seu canal do Slack, economizando minutos preciosos durante um incidente.

A vantagem dessa abordagem é que você não fica mais limitado às APIs disponíveis. Se um humano consegue fazer isso em um navegador, seu agente também consegue.

11. Conclusão

Parabéns! Você acabou de criar e executar testes de interface automatizados e robustos apenas dizendo a um agente de IA o que você queria que ele fizesse em inglês simples. Sem seletores de CSS frágeis nem scripts de configuração complexos.

Você aprendeu:

  • Testar a interface não precisa ser difícil: ao focar na intenção do teste em vez da implementação frágil do DOM, podemos reduzir muito o trabalho de manutenção.
  • O Protocolo de Contexto de Modelo (MCP) oferece aos seus agentes acesso universal e plug-and-play a ferramentas, dados e ambientes.
  • O BrowserMCP é uma ferramenta incrível para trazer recursos de agente para suas sessões locais do Chrome.
  • Habilidades e a CLI do Playwright desbloqueiam um novo nível de testes de automação repetíveis e determinísticos, tudo com tecnologia de divulgação progressiva.
  • O subagente de navegador do Antigravity vai além ao introduzir navegação autônoma e multimodal e gravação de artefatos direto da caixa.

Agora, vá em frente e automatize as coisas chatas!

12. Links úteis

Se você quiser se aprofundar nas ferramentas e nos conceitos abordados hoje, confira estes recursos:

Código do repositório

Ferramentas e frameworks principais

Conceitos e habilidades de agente

Outro