Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Como analisar pôsteres de filmes no BigQuery com modelos remotos

1. Introdução

Neste laboratório, você vai aprender a usar o BigQuery Machine Learning para inferência com modelos remotos ( modelos do Gemini) para analisar imagens de pôsteres de filmes e gerar resumos dos filmes com base nos pôsteres diretamente no seu data warehouse do BigQuery.

Acima: uma amostra das imagens de pôsteres de filmes que você vai analisar.

O BigQuery é uma plataforma de análise de dados totalmente gerenciada e pronta para IA que ajuda a aumentar o valor dos dados e opera com vários mecanismos, formatos e nuvens. Um dos principais recursos dele é o BigQuery Machine Learning para inferência, que permite criar e executar modelos de machine learning (ML) usando consultas do GoogleSQL.

O Gemini é uma família de modelos de IA generativa desenvolvida pelo Google para casos de uso multimodais.

Como executar modelos de ML usando consultas do GoogleSQL

Em geral, para executar ML ou inteligência artificial (IA) em grandes conjuntos de dados, é preciso utilizar programação detalhada e ter conhecimento de frameworks de ML. Isso limita o desenvolvimento de soluções a um pequeno grupo de especialistas em cada empresa. Com o BigQuery Machine Learning para inferência, os profissionais de SQL podem usar as habilidades e ferramentas de SQL atuais para criar modelos e gerar resultados com LLMs e APIs de IA do Google Cloud.

Pré-requisitos

Conhecimentos básicos sobre o Console do Google Cloud
Experiência com o BigQuery é um diferencial

O que você vai aprender

Como configurar seu ambiente e sua conta para usar APIs
Como criar uma conexão a recursos do Cloud no BigQuery
Como criar um conjunto de dados e uma tabela de objetos no BigQuery para imagens de pôsteres de filmes
Como criar os modelos remotos do Gemini no BigQuery
Como pedir ao modelo do Gemini para fornecer resumos de filmes para cada pôster
Como gerar embeddings de texto para o filme representado em cada pôster
Como usar o BigQuery VECTOR_SEARCH para combinar imagens de pôsteres de filmes com filmes muito semelhantes no conjunto de dados

O que é necessário

Uma conta e um projeto do Google Cloud com o faturamento ativado
Um navegador da Web, como o Chrome

2. Configuração e requisitos

Configuração de ambiente autoguiada

Faça login no Console do Google Cloud e crie um novo projeto ou reutilize um existente. Crie uma conta do Gmail ou do Google Workspace, se ainda não tiver uma.

O Nome do projeto é o nome de exibição para os participantes do projeto. É uma string de caracteres não usada pelas APIs do Google e pode ser atualizada quando você quiser.
O ID do projeto precisa ser exclusivo em todos os projetos do Google Cloud e não pode ser mudado após a definição. O console do Cloud gera automaticamente uma string exclusiva. Em geral, não importa o que seja. Na maioria dos codelabs, é necessário fazer referência ao ID do projeto, normalmente identificado como PROJECT_ID. Se você não gostar do ID gerado, crie outro aleatório. Se preferir, teste o seu e confira se ele está disponível. Ele não pode ser mudado após essa etapa e permanece durante o projeto.
Para sua informação, há um terceiro valor, um Número do projeto, que algumas APIs usam. Saiba mais sobre esses três valores na documentação.

Em seguida, ative o faturamento no console do Cloud para usar os recursos/APIs do Cloud. A execução deste codelab não vai ser muito cara, se tiver algum custo. Para encerrar os recursos e evitar cobranças além deste tutorial, exclua os recursos criados ou exclua o projeto. Novos usuários do Google Cloud estão qualificados para o programa de US$ 300 de avaliação sem custos.

Inicie o Cloud Shell

Embora o Google Cloud e o Spanner possam ser operados remotamente do seu laptop, neste codelab usaremos o Google Cloud Shell, um ambiente de linha de comando executado no Cloud.

No Console do Google Cloud, clique no ícone do Cloud Shell na barra de ferramentas superior à direita:

O provisionamento e a conexão com o ambiente levarão apenas alguns instantes para serem concluídos: Quando o processamento for concluído, você verá algo como:

Essa máquina virtual contém todas as ferramentas de desenvolvimento necessárias. Ela oferece um diretório principal persistente de 5 GB, além de ser executada no Google Cloud. Isso aprimora o desempenho e a autenticação da rede. Neste codelab, todo o trabalho pode ser feito com um navegador. Você não precisa instalar nada.

3. Antes de começar

Há algumas etapas de configuração para trabalhar com modelos do Gemini no BigQuery, incluindo ativar APIs, criar uma conexão a recursos do Cloud e conceder à conta de serviço da conexão a recursos do Cloud determinadas permissões. Essas etapas são únicas por projeto e serão abordadas nas próximas seções.

Ativar APIs

No Cloud Shell, verifique se o ID do projeto está configurado:

gcloud config set project [YOUR-PROJECT-ID]

Defina a variável de ambiente PROJECT_ID:

PROJECT_ID=$(gcloud config get-value project)

Configure a região padrão para usar com os modelos da Vertex AI. Leia mais sobre os locais disponíveis para a Vertex AI. No exemplo, usamos a região us-central1.

gcloud config set compute/region us-central1

Defina a variável de ambiente REGION:

REGION=$(gcloud config get-value compute/region)

Ative todos os serviços necessários:

gcloud services enable bigqueryconnection.googleapis.com \
                       aiplatform.googleapis.com

Saída esperada depois de executar todos os comandos acima:

student@cloudshell:~ (test-project-001-402417)$ gcloud config set project test-project-001-402417
Updated property [core/project].
student@cloudshell:~ (test-project-001-402417)$ PROJECT_ID=$(gcloud config get-value project)
Your active configuration is: [cloudshell-14650]
student@cloudshell:~ (test-project-001-402417)$ 
student@cloudshell:~ (test-project-001-402417)$ gcloud services enable bigqueryconnection.googleapis.com \
                       aiplatform.googleapis.com
Operation "operations/acat.p2-4470404856-1f44ebd8-894e-4356-bea7-b84165a57442" finished successfully.

4. criar uma conexão de recursos do Cloud

Nesta tarefa, você vai criar uma conexão a recursos do Cloud, que permite ao BigQuery acessar arquivos de imagem no Cloud Storage e fazer chamadas para a Vertex AI.

No console do Google Cloud, acesse o Menu de navegação ( ) e clique em BigQuery.

Para criar uma conexão, clique em + ADICIONAR e selecione Conexões com fontes de dados externas.

Na lista Tipo de conexão, selecione Modelos remotos, funções remotas e BigLake (recurso do Cloud) da Vertex AI.
No campo ID da conexão, digite gemini_conn.
Em Tipo de local, selecione Multirregional e, no menu suspenso, selecione a opção multirregional EUA.
Mantenha os valores padrão nas outras configurações.

Clique em Criar conexão.
Clique em ACESSAR CONEXÃO.
No painel "Informações da conexão", copie o ID da conta de serviço para um arquivo de texto para usá-lo na próxima tarefa. Observe também que a conexão foi adicionada à seção Conexões externas do projeto no BigQuery Explorer.

5. conceder permissões do IAM à conta de serviço da conexão

Nesta tarefa, você vai conceder permissões do IAM à conta de serviço da conexão de recursos do Cloud usando um papel para permitir que ela acesse os serviços da Vertex AI.

No console do Google Cloud, no menu de navegação, clique em IAM e administrador.
Clique em Permitir acesso.
No campo Novos principais, digite o ID da conta de serviço que você copiou anteriormente.
No campo "Selecionar papel", digite Vertex AI e selecione o papel Usuário da Vertex AI.

Clique em Salvar. Agora, o ID da conta de serviço tem o papel de usuário da Vertex AI.

6. criar o conjunto de dados e a tabela de objetos no BigQuery para imagens de pôsteres de filmes

Nesta tarefa, você vai criar um conjunto de dados para o projeto e uma tabela de objetos nele para armazenar as imagens de pôsteres.

O conjunto de dados de imagens de pôsteres de filmes usado neste tutorial está armazenado em um bucket público do Cloud Storage: gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters

crie um conjunto de dados

Você vai criar um conjunto de dados para armazenar objetos do banco de dados, incluindo tabelas e modelos, usados neste tutorial.

No console do Google Cloud, selecione o menu de navegação ( ) e clique em BigQuery.
No painel Explorer, ao lado do nome do projeto, selecione Ver ações ( ) e clique em Criar conjunto de dados.
No painel Criar conjunto de dados, digite as seguintes informações:

ID do conjunto de dados: gemini_demo
Tipo de local: selecione Multirregional
Multirregional: selecione EUA.

Deixe os demais campos com os valores padrão.

Clique em Criar conjunto de dados.

Como resultado, o conjunto de dados gemini_demo é criado e listado no projeto no Explorador do BigQuery.

Criar a tabela de objetos

O BigQuery não armazena apenas dados estruturados, mas também pode acessar dados não estruturados (como as imagens de pôsteres) usando tabelas de objetos.

Para criar uma tabela de objetos, basta apontar para um bucket do Cloud Storage. A tabela resultante tem uma linha para cada objeto do bucket com o caminho de armazenamento e os metadados.

Para criar a tabela de objetos, você vai usar uma consulta SQL.

Clique em + para Criar uma consulta SQL.
No editor de consultas, cole a consulta abaixo.

CREATE OR REPLACE EXTERNAL TABLE
  `gemini_demo.movie_posters`
WITH CONNECTION `us.gemini_conn`
OPTIONS (
  object_metadata = 'SIMPLE',
  uris = ['gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters/*']
  );

Execute a consulta. Como resultado, uma tabela de objetos movie_posters é adicionada ao conjunto de dados gemini_demo e carregada com o URI (o local no Cloud Storage) de cada imagem de pôster de filme.
No Explorador, clique em movie_posters e confira o esquema e os detalhes. Você pode consultar a tabela para analisar registros específicos.

7. criar o modelo remoto do Gemini no BigQuery

Agora que a tabela de objetos foi criada, você pode começar a trabalhar com ela. Nesta tarefa, você vai criar um modelo remoto para o Gemini 1.5 Flash e disponibilizá-lo no BigQuery.

Criar o modelo remoto do Gemini 1.5 Flash

Clique em + para Criar uma consulta SQL.
No editor de consultas, cole a consulta abaixo e a execute.

CREATE OR REPLACE MODEL `gemini_demo.gemini_1_5_flash`
REMOTE WITH CONNECTION `us.gemini_conn`
OPTIONS (endpoint = 'gemini-1.5-flash')

O modelo gemini_1_5_flash é criado e adicionado ao conjunto de dados gemini_demo na seção de modelos.

No Explorador, clique no modelo gemini_1_5_flash e confira os detalhes.

8. Pedir que o modelo do Gemini forneça resumos de filmes para cada pôster

Nesta tarefa, você vai usar o modelo remoto do Gemini que acabou de criar para analisar as imagens dos pôsteres de filmes e gerar resumos para cada um deles.

É possível enviar solicitações ao modelo usando a função ML.GENERATE_TEXT, referenciando o modelo nos parâmetros.

Analisar as imagens com o modelo Gemini 1.5 Flash

Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE TABLE
`gemini_demo.movie_posters_results` AS (
SELECT
    uri,
    ml_generate_text_llm_result
FROM
    ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_1_5_flash`,
    TABLE `gemini_demo.movie_posters`,
    STRUCT( 0.2 AS temperature,
        'For the movie represented by this poster, what is the movie title and year of release? Answer in JSON format with two keys: title, year. title should be string, year should be integer. Do not use JSON decorators.' AS PROMPT,
        TRUE AS FLATTEN_JSON_OUTPUT)));

Quando a consulta é executada, o BigQuery solicita ao modelo do Gemini cada linha da tabela de objetos, combinando a imagem com o comando estático especificado. A tabela movie_posters_results é criada.

Agora vamos conferir os resultados. Crie e execute uma nova consulta com a seguinte instrução SQL:

SELECT * FROM `gemini_demo.movie_posters_results`

Como resultado, são exibidas linhas para cada pôster de filme com o URI (o local do Cloud Storage da imagem do pôster) e um resultado JSON com o título do filme e o ano de lançamento dele fornecidos pelo modelo Gemini 1.5 Flash.

Você pode usar a próxima consulta para recuperar esses resultados de uma forma mais legível por humanos. Essa consulta usa SQL para extrair o título do filme e o ano de lançamento dessas respostas em novas colunas.

Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE TABLE
  `gemini_demo.movie_posters_results_formatted` AS (
  SELECT
    uri,
    JSON_VALUE(ml_generate_text_llm_result, "$.title") AS title,
    JSON_VALUE(ml_generate_text_llm_result, "$.year") AS year
  FROM
    `gemini_demo.movie_posters_results` results )

A tabela movie_posters_result_formatted é criada.

Você pode usar a consulta abaixo para a tabela a fim de conferir as linhas criadas.

SELECT * FROM `gemini_demo.movie_posters_results_formatted`

Observe como os resultados da coluna URI permanecem os mesmos, mas o JSON foi convertido nas colunas title e year para cada linha.

Pedir ao modelo Gemini 1.5 Flash para fornecer resumos de filmes

E se você quisesse mais informações sobre cada um desses filmes, como um resumo de texto? Esse caso de uso de geração de conteúdo é perfeito para um modelo de LLM, como o Gemini 1.5 Flash.

É possível executar a consulta abaixo para usar o Gemini 1.5 Flash e fornecer resumos de filmes para cada pôster:

SELECT
  uri,
  title,
  year,
  prompt,
  ml_generate_text_llm_result
  FROM
 ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_1_5_flash`,
   (
   SELECT
     CONCAT('Provide a short summary of movie titled ',title, ' from the year ',year,'.') AS prompt,
     uri,
     title,
     year
   FROM
     `gemini_demo.movie_posters_results_formatted`
   LIMIT
     20 ),
   STRUCT(0.2 AS temperature,
     TRUE AS FLATTEN_JSON_OUTPUT));

Observe o campo ml_generate_text_llm_result dos resultados, que inclui um breve resumo do filme.

9. gerar embeddings de texto usando um modelo remoto

Agora você pode combinar os dados estruturados que criou com outros dados estruturados no seu data warehouse. O conjunto de dados públicos do IMDB disponível no BigQuery contém uma grande quantidade de informações sobre filmes, incluindo classificações de espectadores e algumas amostras de avaliações de usuários em formato livre. Esses dados podem ajudar você a aprofundar sua análise dos pôsteres e entender como os filmes foram recebidos.

Para unir dados, você precisa de uma chave. Nesse caso, os títulos de filmes gerados pelo modelo do Gemini podem não corresponder perfeitamente aos títulos no conjunto de dados do IMDB.

Nesta tarefa, você vai gerar embeddings de texto dos títulos e anos dos filmes dos dois conjuntos de dados e usar a distância entre esses embeddings para unir o título mais próximo do IMDB com os títulos dos pôsteres do conjunto de dados recém-criado.

Criar o modelo remoto

Para gerar os embeddings de texto, crie um novo modelo remoto apontando para o endpoint text-multilingual-embedding-002.

Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE MODEL `gemini_demo.text_embedding`
REMOTE WITH CONNECTION `us.gemini_conn`
OPTIONS (endpoint = 'text-multilingual-embedding-002')

O modelo text_embedding é criado e aparece no Explorer abaixo do conjunto de dados gemini_demo.

Gerar embeddings de texto para o título e o ano associados aos pôsteres

Agora você vai usar esse modelo remoto com a função ML.GENERATE_EMBEDDING para criar um embedding para cada título e ano de pôster de filme.

Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE TABLE
  `gemini_demo.movie_posters_results_embeddings` AS (
  SELECT
    *
  FROM
    ML.GENERATE_EMBEDDING(
    MODEL `gemini_demo.text_embedding`,
    (
    SELECT
      CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content,
      title,
      year,
      uri
    FROM
      `gemini_demo.movie_posters_results_formatted` ),
    STRUCT(TRUE AS flatten_json_output)));

O resultado é a criação da tabela movie_poster_results_embeddings, que contém os embeddings do conteúdo de texto concatenado para cada linha da tabela gemini_demo.movie_posters_results_formatted.

É possível conferir os resultados da consulta usando a nova consulta abaixo:

SELECT * FROM `gemini_demo.movie_posters_results_embeddings`

É possível encontrar os embeddings (vetores representados por números) de cada filme gerado pelo modelo.

Gerar embeddings de texto para um subconjunto do conjunto de dados IMDB

Você vai criar uma nova visualização de dados de um conjunto de dados público do IMDB que contém apenas os filmes lançados antes de 1935 (o período conhecido dos filmes das imagens dos pôsteres).

Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE VIEW
  `gemini_demo.imdb_movies` AS (
  WITH
    reviews AS (
      SELECT
        reviews.movie_id AS movie_id,
        title.primary_title AS title,
        title.start_year AS year,
        reviews.review AS review
      FROM
        `bigquery-public-data.imdb.reviews` reviews
      LEFT JOIN
        `bigquery-public-data.imdb.title_basics` title
      ON
        reviews.movie_id = title.tconst)
  SELECT
    DISTINCT(movie_id),
    title,
    year
  FROM
    reviews
  WHERE
    year < 1935)

Como resultado, é criada uma nova visualização com uma lista de IDs, títulos e anos de lançamento de filmes distintos baseada na tabela bigquery-public-data.imdb.reviews para todos os filmes no conjunto de dados lançados antes de 1935.

Agora, você vai criar embeddings para o subconjunto de filmes do IMDB usando um processo semelhante ao da seção anterior. Crie e execute uma nova consulta com a seguinte instrução SQL:

CREATE OR REPLACE TABLE
  `gemini_demo.imdb_movies_embeddings` AS (
  SELECT
    *
  FROM
    ML.GENERATE_EMBEDDING( MODEL `gemini_demo.text_embedding`,
      (
      SELECT
        CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content,
        title,
        year,
        movie_id
      FROM
        `gemini_demo.imdb_movies` ),
      STRUCT(TRUE AS flatten_json_output) )
  WHERE
    ml_generate_embedding_status = '' );

Como resultado da consulta, é criada uma tabela que contém os embeddings do conteúdo de texto da tabela gemini_demo.imdb_movies.

Fazer a correspondência entre as imagens dos pôsteres de filmes e o `movie_id` do IMDB usando a função `VECTOR_SEARCH` do BigQuery

Agora, você pode unir as duas tabelas usando a função VECTOR_SEARCH.

Crie e execute uma nova consulta com a seguinte instrução SQL:

SELECT
  query.uri AS poster_uri,
  query.title AS poster_title,
  query.year AS poster_year,
  base.title AS imdb_title,
  base.year AS imdb_year,
  base.movie_id AS imdb_movie_id,
  distance
FROM
 VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`,
   'ml_generate_embedding_result',
   TABLE `gemini_demo.movie_posters_results_embeddings`,
   'ml_generate_embedding_result',
   top_k => 1,
   distance_type => 'COSINE');

A consulta usa a função VECTOR_SEARCH para encontrar o vizinho mais próximo na tabela gemini_demo.imdb_movies_embeddings para cada linha na tabela gemini_demo.movie_posters_results_embeddings. O vizinho mais próximo é encontrado usando a métrica de distância de cosseno, que determina o quão semelhantes são dois embeddings.

Essa consulta pode ser usada para encontrar no conjunto de dados IMDB o filme mais parecido com cada um daqueles identificados pelo Gemini 1.5 Flash nos pôsteres. Por exemplo, é possível usar essa consulta para encontrar a correspondência mais próxima do filme "Au Secours!" no conjunto de dados público IMDB, que faz referência ao filme pelo título em inglês, "Help!".

Crie e execute uma nova consulta para mesclar algumas informações adicionais sobre as classificações de filmes fornecidas no conjunto de dados público IMDB:

SELECT
  query.uri AS poster_uri,
  query.title AS poster_title,
  query.year AS poster_year,
  base.title AS imdb_title,
  base.year AS imdb_year,
  base.movie_id AS imdb_movie_id,
  distance,
  imdb.average_rating,
  imdb.num_votes
FROM
  VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`,
    'ml_generate_embedding_result',
    TABLE `gemini_demo.movie_posters_results_embeddings`,
    'ml_generate_embedding_result',
    top_k => 1,
    distance_type => 'COSINE') DATA
LEFT JOIN
  `bigquery-public-data.imdb.title_ratings` imdb
ON
  base.movie_id = imdb.tconst
ORDER BY
  imdb.average_rating DESC

Essa consulta é semelhante à anterior. Ela ainda usa representações numéricas especiais chamadas de embeddings de vetor para encontrar filmes semelhantes a um determinado pôster de filme. No entanto, ela também mescla a classificação média e o número de votos de cada filme que é o vizinho mais próximo com base em uma tabela separada do conjunto de dados público IMDB.

10. Parabéns

Parabéns por concluir o codelab. Você criou uma tabela de objetos para as imagens de pôsteres no BigQuery, criou um modelo remoto do Gemini, usou o modelo para pedir ao Gemini que analisasse imagens e fornecesse resumos de filmes, gerou embeddings de texto para títulos de filmes e usou esses embeddings para corresponder imagens de pôsteres de filmes ao título relacionado no conjunto de dados do IMDB.

O que vimos

Como configurar seu ambiente e sua conta para usar APIs
Como criar uma conexão a recursos do Cloud no BigQuery
Como criar um conjunto de dados e uma tabela de objetos no BigQuery para imagens de pôsteres de filmes
Como criar os modelos remotos do Gemini no BigQuery
Como pedir ao modelo do Gemini para fornecer resumos de filmes para cada pôster
Como gerar embeddings de texto para o filme representado em cada pôster
Como usar o BigQuery VECTOR_SEARCH para combinar imagens de pôsteres de filmes com filmes muito semelhantes no conjunto de dados

Próximas etapas / Saiba mais

11. Pesquisa

Como você usará este tutorial?

Apenas leitura

Leitura e exercícios