Diese Seite wurde von der Cloud Translation API übersetzt.

Build a Smart Shopping Assistant with AlloyDB und Vertex AI Agent Builder – Part 1

1. Übersicht

In der heutigen schnelllebigen Einzelhandelsbranche ist es von entscheidender Bedeutung, einen hervorragenden Kundenservice zu bieten und gleichzeitig personalisierte Einkaufserlebnisse zu ermöglichen. Wir führen Sie durch die technische Erstellung einer KI-gestützten Chat-Anwendung, die Kundenfragen beantworten, die Produktsuche unterstützen und Suchergebnisse anpassen soll. Diese innovative Lösung kombiniert die Leistungsfähigkeit von AlloyDB für die Datenspeicherung, eine interne Analyse-Engine für den Kontext, Gemini (Large Language Model) für die Relevanzprüfung und den Agent Builder von Google für die schnelle Einrichtung eines intelligenten Konversationsassistenten.

Die Herausforderung: Heutige Einzelhändler erwarten sofortige Antworten und Produktvorschläge, die ihren individuellen Vorlieben entsprechen. Traditionelle Suchmethoden bieten diese Personalisierungsmöglichkeit oft nicht.

Die Lösung: Unsere KI-gestützte Chat-Anwendung löst diese Herausforderung. Sie nutzt eine umfangreiche Wissensdatenbank, die aus Ihren Einzelhandelsdaten abgeleitet wurde, um die Absicht der Kunden zu verstehen, intelligent darauf zu reagieren und hoch relevante Ergebnisse zu liefern.

Aufgaben

In diesem Lab (Teil 1) lernen Sie Folgendes:

AlloyDB-Instanz erstellen und E-Commerce-Dataset laden
pgvector- und generative AI-Modellerweiterungen in AlloyDB aktivieren
Einbettungen aus der Produktbeschreibung generieren
Kosinus-Ähnlichkeitssuche in Echtzeit für den Suchtext von Nutzern durchführen
Lösung in serverlosen Cloud Run Functions bereitstellen

Im zweiten Teil des Labs werden die Schritte in Agent Builder behandelt.

Voraussetzungen

Ein Browser, z. B. Chrome oder Firefox
Google Cloud-Projekt mit aktivierter Abrechnungsfunktion.

2. Architektur

Datenfluss: Sehen wir uns genauer an, wie Daten durch unser System fließen:

Datenaufnahme:

Als Erstes werden die Einzelhandelsdaten (Inventar, Produktbeschreibungen, Kundeninteraktionen) in AlloyDB aufgenommen.

Analytics-Engine:

Wir verwenden AlloyDB als Analyse-Engine, um Folgendes auszuführen:

Kontextextraktion: Die Engine analysiert die in AlloyDB gespeicherten Daten, um Beziehungen zwischen Produkten, Kategorien, Kundenverhalten usw. zu ermitteln.
Erstellung von Einbettungen: Einbettungen (mathematische Darstellungen von Text) werden sowohl für die Abfrage des Nutzers als auch für die in AlloyDB gespeicherten Informationen generiert.
Vektorsuche: Die Engine führt eine Ähnlichkeitssuche durch und vergleicht die Einbettung der Suchanfrage mit den Einbettungen von Produktbeschreibungen, Rezensionen und anderen relevanten Daten. So werden die 25 wichtigsten „Nähesten Nachbarn“ ermittelt.

Gemini-Validierung:

Diese potenziellen Antworten werden zur Bewertung an Gemini gesendet. Gemini prüft, ob sie wirklich relevant und sicher für die Freigabe an den Nutzer sind.

Antwortgenerierung:

Die validierten Antworten werden in einem JSON-Array strukturiert und die gesamte Engine wird in einer serverlosen Cloud Run-Funktion verpackt, die vom Agent Builder aufgerufen wird.

Konversationelle Interaktion:

Agent Builder präsentiert die Antworten in natürlicher Sprache, um einen Dialog zwischen Nutzer und Bot zu ermöglichen. Dieser Teil wird in einem Folge-Lab behandelt.

3. Hinweis

Projekt erstellen

Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.
Sie verwenden Cloud Shell, eine Befehlszeilenumgebung, die in Google Cloud ausgeführt wird und bq bereits vorinstalliert hat. Klicken Sie oben in der Google Cloud Console auf „Cloud Shell aktivieren“.

Bild der Schaltfläche „Cloud Shell aktivieren“

Nachdem Sie eine Verbindung zu Cloud Shell hergestellt haben, prüfen Sie mit dem folgenden Befehl, ob Sie bereits authentifiziert sind und das Projekt auf Ihre Projekt-ID festgelegt ist:

gcloud auth list

Führen Sie in Cloud Shell den folgenden Befehl aus, um zu prüfen, ob der gcloud-Befehl Ihr Projekt kennt.

gcloud config list project

Wenn Ihr Projekt nicht festgelegt ist, verwenden Sie den folgenden Befehl, um es festzulegen:

gcloud config set project <YOUR_PROJECT_ID>

Aktivieren Sie die erforderlichen APIs.

gcloud services enable alloydb.googleapis.com \
                       compute.googleapis.com \
                       cloudresourcemanager.googleapis.com \
                       servicenetworking.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \
                       cloudfunctions.googleapis.com \
                       aiplatform.googleapis.com

Alternativ können Sie in der Console nach den einzelnen Produkten suchen oder diesen Link verwenden.

Wenn eine API fehlt, können Sie sie jederzeit während der Implementierung aktivieren.

Weitere Informationen zu gcloud-Befehlen und deren Verwendung finden Sie in der Dokumentation.

4. Datenbank einrichten

In diesem Lab verwenden wir AlloyDB als Datenbank für die Einzelhandelsdaten. Alle Ressourcen wie Datenbanken und Protokolle werden in clusters gespeichert. Jeder Cluster hat eine primäre Instanz, die einen Zugriffspunkt auf die Daten bietet. Die tatsächlichen Daten werden in Tabellen gespeichert.

Erstellen Sie einen AlloyDB-Cluster, eine Instanz und eine Tabelle, in die das E-Commerce-Dataset geladen wird.

Cluster und Instanz erstellen

Rufen Sie in der Cloud Console die Seite „AlloyDB“ auf. Die meisten Seiten in der Cloud Console lassen sich ganz einfach über die Suchleiste der Console finden.
Wählen Sie auf dieser Seite CLUSTER ERSTELLEN aus:

Daraufhin wird ein Bildschirm wie der unten gezeigte angezeigt. Erstellen Sie einen Cluster und eine Instanz mit den folgenden Werten:

cluster id: "shopping-cluster"
Passwort: „alloydb“
Mit PostgreSQL 15 kompatibel
Region: „us-central1“
Netzwerk: „default“

Wenn Sie das Standardnetzwerk auswählen, wird ein Bildschirm wie der unten angezeigt. Wählen Sie VERKNÜPFUNG EINSTELLEN aus.
Wählen Sie dort „Automatisch zugewiesenen IP-Bereich verwenden“ aus und klicken Sie auf „Weiter“. Nachdem Sie sich die Informationen angesehen haben, wählen Sie VERBINDUNG ERSTELLEN aus.
Sobald Ihr Netzwerk eingerichtet ist, können Sie mit dem Erstellen des Clusters fortfahren. Klicken Sie auf „CLUSTER ERSTEHEN“, um die Einrichtung des Clusters abzuschließen (siehe unten):

Ändern Sie die Instanz-ID in „shopping-instance"“.

Die Clustererstellung dauert etwa 10 Minuten. Wenn der Vorgang erfolgreich war, sollte ein Bildschirm ähnlich diesem angezeigt werden:

5. Datenaufnahme

Jetzt fügen Sie eine Tabelle mit den Daten zum Geschäft hinzu. Rufen Sie AlloyDB auf, wählen Sie den primären Cluster und dann AlloyDB Studio aus:

Möglicherweise müssen Sie warten, bis die Instanz erstellt wurde. Melden Sie sich dann mit den Anmeldedaten an, die Sie beim Erstellen des Clusters erstellt haben. Verwenden Sie die folgenden Daten für die Authentifizierung bei PostgreSQL:

Nutzername: „postgres“
Datenbank: „postgres“
Passwort: „alloydb“

Nachdem Sie sich erfolgreich in AlloyDB Studio authentifiziert haben, werden SQL-Befehle in den Editor eingegeben. Über das Pluszeichen rechts neben dem letzten Fenster können Sie weitere Editorfenster hinzufügen.

Sie geben Befehle für AlloyDB in Editorfenstern ein und verwenden nach Bedarf die Optionen „Ausführen“, „Formatieren“ und „Löschen“.

Erweiterungen aktivieren

Für diese App verwenden wir die Erweiterungen pgvector und google_ml_integration. Mit der pgvector-Erweiterung können Sie Vektoreinbettungen speichern und darin suchen. Die Erweiterung google_ml_integration bietet Funktionen, mit denen Sie auf Vertex AI-Vorhersageendpunkte zugreifen und Vorhersagen in SQL abrufen können. Aktivieren Sie diese Erweiterungen, indem Sie die folgenden DDLs ausführen:

CREATE EXTENSION IF NOT EXISTS google_ml_integration CASCADE;
CREATE EXTENSION IF NOT EXISTS vector;

Wenn Sie die in Ihrer Datenbank aktivierten Erweiterungen prüfen möchten, führen Sie den folgenden SQL-Befehl aus:

select extname, extversion from pg_extension;

Tabelle erstellen

Erstellen Sie eine Tabelle mit der folgenden DDL-Anweisung:

CREATE TABLE
 apparels ( id BIGINT,
   category VARCHAR(100),
   sub_category VARCHAR(50),
   uri VARCHAR(200),
   image VARCHAR(100),
   content VARCHAR(2000),
   pdt_desc VARCHAR(5000),
   embedding vector(768) );

Wenn der Befehl erfolgreich ausgeführt wurde, sollte die Tabelle in der Datenbank angezeigt werden. Unten sehen Sie einen Beispiel-Screenshot:

Daten aufnehmen

Für dieses Lab haben wir Testdaten mit etwa 200 Einträgen in dieser SQL-Datei. Er enthält die id, category, sub_category, uri, image und die content. Die anderen Felder werden später im Lab ausgefüllt.

Kopieren Sie die 20 Zeilen/Insert-Anweisungen von dort, fügen Sie sie in einen leeren Editortab ein und wählen Sie „AUSFÜHREN“ aus.

Maximieren Sie den Bereich „Explorer“, bis Sie die Tabelle „apparels“ sehen, um den Tabelleninhalt zu sehen. Klicken Sie auf das Dreipunkt-Menü ⋮, um die Option „Tabelle abfragen“ zu sehen. Eine SELECT-Anweisung wird in einem neuen Editor-Tab geöffnet.

Berechtigung gewähren

Führen Sie die folgende Anweisung aus, um dem Nutzer postgres Ausführungsrechte für die Funktion embedding zu gewähren:

GRANT EXECUTE ON FUNCTION embedding TO postgres;

Dem AlloyDB-Dienstkonto die Rolle „Vertex AI User“ gewähren

Rufen Sie das Cloud Shell-Terminal auf und geben Sie den folgenden Befehl ein:

PROJECT_ID=$(gcloud config get-value project)

gcloud projects add-iam-policy-binding $PROJECT_ID \
  --member="serviceAccount:service-$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)")@gcp-sa-alloydb.iam.gserviceaccount.com" \
--role="roles/aiplatform.user"

6. Kontext

Kehren Sie zur Seite „AlloyDB-Instanz“ zurück.

Zum Erstellen eines Symbols benötigen wir ein context, also alle Informationen, die wir in ein einzelnes Feld aufnehmen möchten. Dazu erstellen wir eine Produktbeschreibung (pdt_desc). In unserem Fall verwenden wir alle Informationen zu den einzelnen Produkten. Wenn Sie dies mit Ihren eigenen Daten tun, können Sie die Daten so gestalten, wie es für Ihr Unternehmen sinnvoll ist.

Führen Sie die folgende Anweisung in AlloyDB Studio Ihrer neu erstellten Instanz aus. Dadurch wird das Feld „pdt_desc“ mit Kontextdaten aktualisiert:

UPDATE
 apparels
SET
 pdt_desc = CONCAT('This product category is: ', category, ' and sub_category is: ', sub_category, '. The description of the product is as follows: ', content, '. The product image is stored at: ', uri)
WHERE
 id IS NOT NULL;

Mit dieser DML wird eine einfache Kontextzusammenfassung mit den Informationen aus allen in der Tabelle verfügbaren Feldern und anderen Abhängigkeiten (falls vorhanden) erstellt. Für eine präzisere Auswahl von Informationen und die Erstellung von Kontext können Sie die Daten so gestalten, wie es für Ihr Unternehmen sinnvoll ist.

7. Einbettungen für den Kontext erstellen

Für Computer ist es viel einfacher, Zahlen zu verarbeiten als Text. Ein Einbettungssystem wandelt Text in eine Reihe von Gleitkommazahlen um, die den Text unabhängig von Formulierung, Sprache usw. darstellen sollen.

Beschreiben Sie einen Ort am Meer. Die Bezeichnung kann „am Wasser“, „Strand“, „Fußweg vom Zimmer zum Meer“, „sur la mer“ oder „на берегу океана“ lauten. Diese Begriffe sehen alle unterschiedlich aus, aber ihre semantische Bedeutung oder in der Terminologie des Machine Learning ihre Einbettungen sollten sehr nah beieinander liegen.

Nachdem die Daten und der Kontext bereit sind, führen wir die SQL-Abfrage aus, um der Tabelle im Feld embedding die Einbettungen der Produktbeschreibung hinzuzufügen. Es gibt verschiedene Einbettungsmodelle, die Sie verwenden können. Wir verwenden text-embedding-004 von Vertex AI. Achten Sie darauf, im gesamten Projekt dasselbe Einbettungsmodell zu verwenden.

Hinweis: Wenn Sie ein Google Cloud-Projekt verwenden, das vor einiger Zeit erstellt wurde, müssen Sie möglicherweise weiterhin ältere Versionen des Text-Embedding-Modells wie „textembedding-gecko“ verwenden.

UPDATE
 apparels
SET
 embedding = embedding( 'text-embedding-004',
   pdt_desc)
WHERE
 TRUE;

Sehen Sie sich noch einmal die Tabelle apparels an, um einige Einbettungen zu sehen. Führen Sie die SELECT-Anweisung noch einmal aus, um die Änderungen zu sehen.

SELECT
 id,
 category,
 sub_category,
 content,
 embedding
FROM
 apparels;

Dadurch sollte der Einbettungsvektor, der wie ein Array von Gleitkommazahlen aussieht, für den Beispieltext in der Abfrage zurückgegeben werden, wie unten dargestellt:

Hinweis:Bei neu erstellten Google Cloud-Projekten im Rahmen des kostenlosen Tarifs kann es zu Kontingentproblemen bei der Anzahl der zulässigen Einbettungsanfragen pro Sekunde an die Einbettungsmodelle kommen. Wir empfehlen, eine Filterabfrage für die ID zu verwenden und dann beim Generieren des Embeds selektiv 1–5 Einträge auszuwählen.

8. Vektorsuche ausführen

Nachdem Tabelle, Daten und Einbettungen bereit sind, führen wir die Echtzeit-Vektorsuche für den Suchtext des Nutzers aus.

Angenommen, der Nutzer stellt folgende Frage:

„Ich möchte rosafarbene Damentops, nur aus reiner Baumwolle.“

Mit der folgenden Abfrage können Sie entsprechende Übereinstimmungen finden:

SELECT
id,
category,
sub_category,
content,
pdt_desc AS description
FROM
apparels
ORDER BY
embedding <=> embedding('text-embedding-004',
  'I want womens tops, pink casual only pure cotton.')::vector
LIMIT
5;

Sehen wir uns diese Abfrage genauer an:

In dieser Abfrage

Der Suchtext des Nutzers lautet: „Ich suche nach Damenoberteilen, rosa, lässig, nur reine Baumwolle.“
Wir konvertieren sie in der Methode embedding() mit dem Modell text-embedding-004 in Einbettungen. Dieser Schritt sollte Ihnen nach dem letzten Schritt bekannt vorkommen, in dem wir die Einbettungsfunktion auf alle Elemente in der Tabelle angewendet haben.
„<=>“ steht für die Verwendung der Distanzmethode KOSINISCHE ÄHNLICHKEIT. Alle verfügbaren Ähnlichkeitsmaße finden Sie in der Dokumentation von pgvector.
Wir konvertieren das Ergebnis der Einbettungsmethode in den Vektortyp, damit es mit den in der Datenbank gespeicherten Vektoren kompatibel ist.
Mit LIMIT 5 geben wir an, dass wir 5 nächste Nachbarn für den Suchtext extrahieren möchten.

Das Ergebnis sieht so aus:

Wie Sie in den Ergebnissen sehen, stimmen die Übereinstimmungen ziemlich genau mit dem Suchtext überein. Ändern Sie die Farbe, um zu sehen, wie sich die Ergebnisse ändern.

Wichtiger Hinweis:

Angenommen, wir möchten die Leistung (Abfragezeit), Effizienz und den Rückruf dieses Vektorsuchergebnisses mit dem ScaNN-Index verbessern. In diesem Blogpost finden Sie eine Anleitung, wie Sie den Unterschied zwischen den Ergebnissen mit und ohne Index vergleichen können. Hier sind die Schritte zum Erstellen eines Index:

Da wir bereits Cluster, Instanz, Kontext und Einbettungen erstellt haben, müssen wir nur noch die ScaNN-Erweiterung mit der folgenden Anweisung installieren:

CREATE EXTENSION IF NOT EXISTS alloydb_scann;

Als Nächstes erstellen wir den Index (ScaNN):

CREATE INDEX apparel_index ON apparels

USING scann (embedding cosine)

WITH (num_leaves=54);

In der obigen DDL ist „apparel_index“ der Name des Index.

„apparels“ ist meine Tabelle

„scann“ ist die Indexmethode.

„embedding“ ist die Spalte in der Tabelle, die ich indexieren möchte.

„cosine“ ist die Entfernungsmethode, die ich für den Index verwenden möchte.

„54“ ist die Anzahl der Partitionen, die auf diesen Index angewendet werden sollen. Legen Sie einen Wert zwischen 1 und 1048576 fest. Weitere Informationen zur Auswahl dieses Werts finden Sie unter ScaNN-Index optimieren.

Ich habe die QUADRATWURZEL der Anzahl der Datenpunkte verwendet, wie im ScaNN-Repository empfohlen. Bei der Partitionierung sollte „num_leaves“ ungefähr der Quadratwurzel der Anzahl der Datenpunkte entsprechen.

Prüfen Sie mit der folgenden Abfrage, ob der Index erstellt wurde:

SELECT * FROM pg_stat_ann_indexes;

Führen Sie die Vektorsuche mit derselben Abfrage aus, die wir ohne Index verwendet haben:

select * from apparels

ORDER BY embedding <=> CAST(embedding('textembedding-gecko', 'white tops for girls without any print') as vector(768))

LIMIT 20

Die obige Abfrage ist dieselbe, die wir im Lab in Schritt 8 verwendet haben. Jetzt ist das Feld jedoch indexiert.

Testen Sie mit einer einfachen Suchanfrage mit und ohne Index (indem Sie den Index löschen):

white tops for girls without any print

Der obige Suchtext in der Vektorsuchabfrage für die INDEXIERTEN Einbettungsdaten führt zu hochwertigen Suchergebnissen und Effizienz. Die Effizienz wird durch den Index erheblich verbessert (in Bezug auf die Ausführungszeit: 10,37 ms ohne ScaNN und 0,87 ms mit ScaNN). Weitere Informationen zu diesem Thema finden Sie in diesem Blog.

9. Abgleichsbestätigung mit dem LLM

Bevor wir fortfahren und einen Dienst erstellen, der die besten Übereinstimmungen für eine Anwendung zurückgibt, prüfen wir mit einem generativen KI-Modell, ob diese potenziellen Antworten wirklich relevant und sicher für die Weitergabe an den Nutzer sind.

Prüfen, ob die Instanz für Gemini eingerichtet ist

Prüfen Sie zuerst, ob die Google ML-Integration für Ihren Cluster und Ihre Instanz bereits aktiviert ist. Geben Sie in AlloyDB Studio den folgenden Befehl ein:

show google_ml_integration.enable_model_support;

Wenn der Wert „an“ lautet, können Sie die nächsten beiden Schritte überspringen und direkt mit der Einrichtung der AlloyDB- und Vertex AI-Modellintegration fortfahren.

Rufen Sie die primäre Instanz Ihres AlloyDB-Clusters auf und klicken Sie auf PRÄMIRE INSTANZ BEARBEITEN.

Gehen Sie in den erweiterten Konfigurationsoptionen zum Abschnitt „Flags“. und google_ml_integration.enable_model_support flag muss auf „on“ festgelegt sein, wie unten dargestellt:

Wenn die Option nicht aktiviert ist, klicken Sie auf „An“ und dann auf die Schaltfläche INSTANZ AKTUALISIEREN. Dieser Schritt dauert einige Minuten.

Integration von AlloyDB- und Vertex AI-Modellen

Sie können jetzt eine Verbindung zu AlloyDB Studio herstellen und die folgende DML-Anweisung ausführen, um den Gemini-Modellzugriff über AlloyDB einzurichten. Geben Sie dabei an der entsprechenden Stelle Ihre Projekt-ID ein. Möglicherweise werden Sie vor der Ausführung des Befehls auf einen Syntaxfehler hingewiesen. Er sollte aber trotzdem ausgeführt werden.

Zuerst erstellen wir die Gemini 1.5-Modellverbindung, wie unten dargestellt. Ersetzen Sie im folgenden Befehl $PROJECT_ID durch Ihre Google Cloud-Projekt-ID.

CALL
 google_ml.create_model( model_id => 'gemini-1.5',
   model_request_url => 'https://us-central1-aiplatform.googleapis.com/v1/projects/$PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:streamGenerateContent',
   model_provider => 'google',
   model_auth_type => 'alloydb_service_agent_iam');

Mit dem folgenden Befehl in AlloyDB Studio können Sie die für den Zugriff konfigurierten Modelle prüfen:

select model_id,model_type from google_ml.model_info_view;

Schließlich müssen wir Datenbanknutzern die Berechtigung erteilen, die Funktion ml_predict_row auszuführen, um Vorhersagen über Google Vertex AI-Modelle auszuführen. Führen Sie dazu diesen Befehl aus:

GRANT EXECUTE ON FUNCTION ml_predict_row to postgres;

Hinweis: Wenn Sie ein vorhandenes Google Cloud-Projekt und einen vorhandenen Cluster/eine vorhandene Instanz von AlloyDB verwenden, die vor einiger Zeit erstellt wurden, müssen Sie möglicherweise die alten Verweise auf das gemini-1.5-Modell löschen und mit der obigen CALL-Anweisung neu erstellen. Führen Sie dann noch einmal „grant execute on function ml_predict_row“ aus, falls bei den nächsten Aufrufen von gemini-1.5 Probleme auftreten.

Antworten auswerten

Im nächsten Abschnitt verwenden wir zwar eine große Abfrage, um sicherzustellen, dass die Antworten auf die Abfrage angemessen sind, aber die Abfrage kann schwer verständlich sein. Wir sehen uns jetzt die einzelnen Teile an und wie sie in wenigen Minuten zusammenkommen.

Zuerst senden wir eine Anfrage an die Datenbank, um die fünf besten Übereinstimmungen mit einer Nutzerabfrage zu erhalten. Wir codieren die Abfrage hartcodiert, um es einfach zu halten. Keine Sorge, wir interpolieren sie später in die Abfrage. Wir fügen die Produktbeschreibung aus der Tabelle apparels hinzu und zwei neue Felder: eines, das die Beschreibung mit dem Index und eines, das die Beschreibung mit der ursprünglichen Anfrage kombiniert. Das wird alles in einer Tabelle namens xyz gespeichert (nur ein temporärer Tabellenname).

CREATE TABLE
 xyz AS
SELECT
 id || ' - ' || pdt_desc AS literature,
 pdt_desc AS content,
 'I want womens tops, pink casual only pure cotton.' AS  user_text
FROM
 apparels
ORDER BY
 embedding <=> embedding('text-embedding-004',
   'I want womens tops, pink casual only pure cotton.')::vector
LIMIT
 5;

Die Ausgabe dieser Abfrage sind die fünf Zeilen, die der Nutzerabfrage am ähnlichsten sind. Die neue Tabelle „xyz“ enthält fünf Zeilen mit den folgenden Spalten:

literature
content
user_text

Um zu ermitteln, wie gültig Antworten sind, verwenden wir eine komplizierte Abfrage, in der wir erklären, wie die Antworten bewertet werden. Dabei werden user_text und content in der Tabelle xyz als Teil der Abfrage verwendet.

"Read this user search text: ', user_text, 
' Compare it against the product inventory data set: ', content, 
' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match."

Mit dieser Abfrage prüfen wir dann die Güte der Antworten in der Tabelle xyz.

CREATE TABLE
  x AS
SELECT
  json_array_elements( google_ml.predict_row( model_id => 'gemini-1.5',
      request_body => CONCAT('{
 "contents": [ 
        { "role": "user", 
          "parts": 
             [ { "text": "Read this user search text: ', user_text, ' Compare it against the product inventory data set: ', content, ' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match." 
             } ]
         } 
] }'
)::json))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'
AS LLM_RESPONSE
FROM
    xyz;

Die predict_row gibt das Ergebnis im JSON-Format zurück. Mit dem Code „-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'"“ wird der tatsächliche Text aus dieser JSON-Datei extrahiert. Wenn Sie die tatsächlich zurückgegebene JSON-Datei sehen möchten, können Sie diesen Code entfernen.
Um das LLM-Feld zu erhalten, müssen Sie es einfach aus der Tabelle „x“ extrahieren:

SELECT 
LLM_RESPONSE 
FROM 
        x;

Das kann so in eine einzelne nächste Abfrage kombiniert werden:

Wenn Sie die obigen Abfragen ausgeführt haben, um die Zwischenergebnisse zu prüfen, müssen Sie die Tabellen „xyz“ und „x“ aus der AlloyDB-Datenbank löschen, bevor Sie diese Abfrage ausführen.

SELECT
 LLM_RESPONSE
FROM (
 SELECT
 json_array_elements( google_ml.predict_row( model_id => 'gemini-1.5',
     request_body => CONCAT('{
     "contents": [
       { "role": "user",
         "parts":
            [ { "text": "Read this user search text: ', user_text, ' Compare it against the product inventory data set: ', content, ' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match."
            } ]
        }
] }'
)::json))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'
AS LLM_RESPONSE
   FROM (
         SELECT
           id || ' - ' || pdt_desc AS literature,
           pdt_desc AS content,
         'I want womens tops, pink casual only pure cotton.' user_text
         FROM
           apparels
         ORDER BY
             embedding <=> embedding('text-embedding-004',
             'I want womens tops, pink casual only pure cotton.')::vector
         LIMIT
           5 ) AS xyz ) AS X;

Das mag zwar immer noch einschüchternd wirken, aber hoffentlich können Sie es jetzt etwas besser nachvollziehen. Die Ergebnisse geben an, ob eine Übereinstimmung vorliegt, wie hoch der Prozentsatz der Übereinstimmung ist und wie die Altersfreigabe begründet wird.

Beachten Sie, dass für das Gemini-Modell standardmäßig Streaming aktiviert ist. Daher ist die tatsächliche Antwort auf mehrere Zeilen verteilt:

10. Anwendung im Web bereitstellen

Sind Sie bereit, diese App im Web zu veröffentlichen? Führen Sie die folgenden Schritte aus, um diese Knowledge Engine mit Cloud Run-Funktionen serverlos zu machen:

Rufen Sie in der Google Cloud Console die Seite „Cloud Run-Funktionen“ auf, um eine neue Cloud Run-Funktion zu ERSTELLEN, oder verwenden Sie den Link https://console.cloud.google.com/functions/add.
Wählen Sie als Umgebung Cloud Run-Funktion aus. Geben Sie den Funktionsnamen „retail-engine“ ein und wählen Sie „us-central1“ als Region aus. Wählen Sie für die Authentifizierung die Option „Nicht authentifizierte Aufrufe zulassen“ aus und klicken Sie auf WEITER. Wählen Sie als Laufzeit Java 17 und als Quellcode Inline-Editor aus.
Standardmäßig wird der Einstiegspunkt auf „gcfv2.HelloHttpFunction“ festgelegt. Ersetzen Sie den Platzhaltercode in HelloHttpFunction.java und pom.xml Ihrer Cloud Run-Funktion durch den Code aus der Java-Datei bzw. der XML.
Denken Sie daran, den Platzhalter $PROJECT_ID und die AlloyDB-Anmeldedaten in der Java-Datei durch Ihre Werte zu ersetzen. Die AlloyDB-Anmeldedaten sind dieselben, die wir zu Beginn dieses Codelabs verwendet haben. Wenn Sie andere Werte verwendet haben, ändern Sie diese bitte in der Java-Datei.
Klicken Sie auf Bereitstellen.

Nach der Bereitstellung erstellen wir den VPC-Connector, damit die Cloud-Funktion auf unsere AlloyDB-Datenbankinstanz zugreifen kann.

WICHTIG:

Sobald Sie mit der Bereitstellung begonnen haben, sollten Sie die Funktionen in der Cloud Run Functions Console sehen können. Suchen Sie nach der neu erstellten Funktion (retail-engine), klicken Sie darauf und dann auf BEARBEITEN. Ändern Sie Folgendes:

Gehen Sie zu „Laufzeit, Build, Verbindungen und Sicherheitseinstellungen“.
Zeitlimit auf 180 Sekunden erhöhen
Rufen Sie den Tab „VERBINDUNGEN“ auf:

Achten Sie darauf, dass unter „Ingress-Einstellungen“ die Option „Gesamten Traffic zulassen“ ausgewählt ist.
Klicken Sie unter „Einstellungen für ausgehenden Traffic“ auf das Drop-down-Menü „Netzwerk“ und wählen Sie die Option „Neuen VPC-Connector hinzufügen“ aus. Folgen Sie dann der Anleitung im angezeigten Dialogfeld:

Geben Sie einen Namen für den VPC-Connector an und achten Sie darauf, dass die Region mit der Ihrer Instanz übereinstimmt. Lassen Sie den Wert für „Netzwerk“ als Standard bei und legen Sie „Subnetz“ als benutzerdefinierten IP-Bereich mit dem IP-Bereich 10.8.0.0 oder einem ähnlichen verfügbaren Bereich fest.
Maximieren Sie die Konfiguration „ANZEIGEN-SKALIERUNGS-EINSTELLUNGEN“ und prüfen Sie, ob die folgenden Einstellungen festgelegt sind:

Klicken Sie auf „ERSTELLEN“. Dieser Connector sollte jetzt in den Einstellungen für ausgehenden Traffic aufgeführt sein.
Wählen Sie den neu erstellten Connector aus.
Legen Sie fest, dass der gesamte Traffic über diesen VPC-Connector weitergeleitet werden soll.
Klicken Sie auf WEITER und dann auf Bereitstellen.

11. Anwendung testen

Sobald die aktualisierte Cloud-Funktion bereitgestellt wurde, sollte der Endpunkt im folgenden Format angezeigt werden:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/retail-engine

Sie können es über das Cloud Shell-Terminal mit dem folgenden Befehl testen:

gcloud functions call retail-engine --region=us-central1 --gen2 --data '{"search": "I want some kids clothes themed on Disney"}'

Alternativ können Sie die Cloud Run-Funktion so testen:

PROJECT_ID=$(gcloud config get-value project)

curl -X POST https://us-central1-$PROJECT_ID.cloudfunctions.net/retail-engine \
  -H 'Content-Type: application/json' \
  -d '{"search":"I want some kids clothes themed on Disney"}' \
  | jq .

Das Ergebnis:

Geschafft! So einfach ist es, mit dem Embeddings-Modell eine Ähnlichkeitsvektorsuche in AlloyDB-Daten durchzuführen.

Konversationsagent erstellen

Der Agent wird in Teil 2 dieses Labs erstellt.

12. Bereinigen

Wenn Sie Teil 2 dieses Labs abschließen möchten, überspringen Sie diesen Schritt, da das aktuelle Projekt dadurch gelöscht wird.

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in diesem Beitrag verwendeten Ressourcen in Rechnung gestellt werden:

Rufen Sie in der Google Cloud Console die Seite Ressourcen verwalten auf.
Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden, um das Projekt zu löschen.

13. Glückwunsch

Glückwunsch! Sie haben eine Ähnlichkeitssuche mit AlloyDB, pgvector und der Vektorsuche durchgeführt. Durch die Kombination der Funktionen von AlloyDB, Vertex AI und Vektorsuche haben wir einen großen Schritt nach vorn gemacht, um Kontext- und Vektorsuchen zugänglich, effizient und wirklich aussagekräftig zu machen. Im nächsten Teil dieses Labs werden die Schritte zum Erstellen von Kundenservicemitarbeitern behandelt.