AlloyDB ve Vertex AI Agent Builder ile Akıllı Alışveriş Asistanı Oluşturma - 1. Bölüm

AlloyDB ve Vertex AI Agent Builder ile Akıllı Alışveriş Asistanı oluşturma - 1. Bölüm

Bu codelab hakkında

Son güncelleme Ara 10, 2024

Yazan: Author: Abirami Sukumaran

1. Genel Bakış

Günümüzde, hızlı tempolu perakende ortamında kişiselleştirilmiş alışveriş deneyimleri sunarken olağanüstü müşteri hizmetleri sunmak büyük önem taşıyor. Müşteri sorularını yanıtlamak, ürün keşfine rehberlik etmek ve arama sonuçlarını özelleştirmek için tasarlanmış, bilgiye dayalı bir sohbet uygulaması oluşturma konusunda sizi teknik bir yolculuğa çıkaracağız. Bu yenilikçi çözüm, veri depolama için AlloyDB'nin gücünü, bağlamsal anlama için şirket içi bir analiz motorunu, alaka düzeyi doğrulaması için Gemini'yi (Büyük Dil Modeli) ve akıllı bir sohbet asistanı oluşturmak için Google'ın Agent Builder'ını bir araya getirir.

Sorun: Modern perakende müşterileri, anında yanıtlar ve benzersiz tercihlerine uygun ürün önerileri bekliyor. Geleneksel arama yöntemleri genellikle bu düzeyde kişiselleştirme sunamaz.

Çözüm: Bilgi odaklı sohbet uygulamamız bu sorunun üstesinden gelir. Müşteri amacını anlamak, akıllıca yanıt vermek ve son derece alakalı sonuçlar sunmak için perakende verilerinizden elde edilen zengin bir bilgi tabanından yararlanır.

Ne oluşturacaksınız?

Bu laboratuvarın (1. Bölüm) bir parçası olarak:

AlloyDB örneği oluşturma ve E-ticaret veri kümesini yükleme
AlloyDB'de pgvector ve üretken yapay zeka modeli uzantılarını etkinleştirme
Ürün açıklamasından yerleştirilmiş öğeler oluşturma
Kullanıcı arama metni için gerçek zamanlı kosinüs benzerlik araması yapma
Çözümü sunucusuz Cloud Run işlevlerinde dağıtma

Laboratuvarın ikinci bölümünde, Temsilci Oluşturucu adımları ele alınacaktır.

Şartlar

Chrome veya Firefox gibi bir tarayıcı
Faturalandırmanın etkin olduğu bir Google Cloud projesi.

2. Mimari

Veri Akışları: Verilerin sistemimizde nasıl hareket ettiğini daha yakından inceleyelim:

Besleme:

İlk adımımız, perakende verilerini (envanter, ürün açıklamaları, müşteri etkileşimleri) AlloyDB'ye beslemektir.

Analytics motoru:

Aşağıdakileri gerçekleştirmek için analiz motoru olarak AlloyDB'yi kullanacağız:

Bağlam ayıklama: Motor, geçerli olduğu durumlarda ürünler, kategoriler, müşteri davranışı vb. arasındaki ilişkileri anlamak için AlloyDB'de depolanan verileri analiz eder.
Yerleştirme Oluşturma: Hem kullanıcının sorgusu hem de AlloyDB'de depolanan bilgiler için yerleştirmeler (metnin matematiksel gösterimi) oluşturulur.
Vektör Arama: Motor, sorgu yerleştirmesini ürün açıklamalarının, yorumların ve diğer alakalı verilerin yerleştirmeleriyle karşılaştırarak benzerlik araması yapar. Bu işlem, en alakalı 25 "en yakın komşuyu" tanımlar.

Gemini Doğrulaması:

Bu olası yanıtlar, değerlendirme için Gemini'ye gönderilir. Gemini, bu bilgilerin gerçekten alakalı olup olmadığını ve kullanıcıyla paylaşmanın güvenli olup olmadığını belirler.

Yanıt Oluşturma:

Doğrulanmış yanıtlar bir JSON dizisi olarak yapılandırılır ve motorun tamamı, Agent Builder'dan çağrılan sunucusuz bir Cloud Run işlevi olarak paketlenir.

Sohbet etkileşimi:

Agent Builder, yanıtları kullanıcıya doğal dil biçiminde sunarak karşılıklı diyalog kurulmasını kolaylaştırır. Bu bölüm, bir sonraki laboratuvarda ele alınacaktır.

3. Başlamadan önce

Proje oluşturma

Google Cloud Console'daki proje seçici sayfasında bir Google Cloud projesi seçin veya oluşturun.
Cloud projenizde faturalandırmanın etkinleştirildiğinden emin olun. Projede faturalandırmanın etkin olup olmadığını nasıl kontrol edeceğinizi öğrenin .
Google Cloud'da çalışan ve bq ile önceden yüklenmiş bir komut satırı ortamı olan Cloud Shell'i kullanacaksınız. Google Cloud Console'un üst kısmından Cloud Shell'i etkinleştir'i tıklayın.

Cloud Shell'i etkinleştir düğmesi resmi

Cloud Shell'e bağlandıktan sonra aşağıdaki komutu kullanarak kimliğinizin doğrulanıp doğrulanmadığını ve projenin proje kimliğinize ayarlanıp ayarlanmadığını kontrol edin:

gcloud auth list

gcloud komutunun projeniz hakkında bilgi sahibi olduğunu onaylamak için Cloud Shell'de aşağıdaki komutu çalıştırın.

gcloud config list project

Projeniz ayarlanmadıysa ayarlamak için aşağıdaki komutu kullanın:

gcloud config set project <YOUR_PROJECT_ID>

Gerekli API'leri etkinleştirin.

gcloud services enable alloydb.googleapis.com \
                       compute.googleapis.com \
                       cloudresourcemanager.googleapis.com \
                       servicenetworking.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \
                       cloudfunctions.googleapis.com \
                       aiplatform.googleapis.com

gcloud komutunun alternatifi, her ürünü arayarak veya bu bağlantıyı kullanarak konsoldan geçmektir.

Atlanan bir API varsa uygulama sırasında istediğiniz zaman etkinleştirebilirsiniz.

gcloud komutları ve kullanımı için belgelere bakın.

4. Veritabanı kurulumu

Bu laboratuvarda, perakende verilerini depolamak için veritabanı olarak AlloyDB'yi kullanacağız. Veritabanları ve günlükler gibi tüm kaynakları tutmak için clusters kullanır. Her kümenin, verilere erişim noktası sağlayan bir birincil örneği vardır. Tablolar gerçek verileri içerir.

E-ticaret veri kümesinin yükleneceği bir AlloyDB kümesi, örneği ve tablosu oluşturalım.

Küme ve örnek oluşturma

Cloud Console'da AlloyDB sayfasına gidin. Cloud Console'daki çoğu sayfayı bulmanın kolay bir yolu, konsolun arama çubuğunu kullanarak arama yapmaktır.
Bu sayfada KÜME OLUŞTUR'u seçin:

Aşağıdakine benzer bir ekran görürsünüz. Aşağıdaki değerlerle bir küme ve örnek oluşturun:

cluster id: "shopping-cluster"
şifre: "alloydb"
PostgreSQL 15 ile uyumlu
Bölge: "us-central1"
Ağ oluşturma: "default"

Varsayılan ağı seçtiğinizde aşağıdaki gibi bir ekran görürsünüz. BAĞLANTIYI AYALA'yı seçin.
Buradan "Otomatik olarak atanmış bir IP aralığı kullan"ı seçip Devam'ı tıklayın. Bilgileri inceledikten sonra BAĞLANTI OLUŞTUR'u seçin.
Ağınız kurulduktan sonra kümenizi oluşturmaya devam edebilirsiniz. Kümenin kurulumunu aşağıda gösterildiği gibi tamamlamak için KÜME OLUŞTUR'u tıklayın:

Örnek kimliğini "shopping-instance"" olarak değiştirdiğinizden emin olun.

Küme oluşturma işleminin yaklaşık 10 dakika süreceğini unutmayın. İşlem başarıyla tamamlandığında aşağıdakine benzer bir ekran görürsünüz:

5. Veri kullanımı

Şimdi, mağazayla ilgili verileri içeren bir tablo ekleme zamanı. AlloyDB'ye gidin, birincil kümeyi ve ardından AlloyDB Studio'yu seçin:

Örneğinizin oluşturulmasının tamamlanmasını beklemeniz gerekebilir. Bu işlem tamamlandıktan sonra, kümeyi oluştururken oluşturduğunuz kimlik bilgilerini kullanarak AlloyDB'de oturum açın. PostgreSQL'de kimlik doğrulama için aşağıdaki verileri kullanın:

Kullanıcı adı : "postgres"
Veritabanı : "postgres"
Şifre : "alloydb"

AlloyDB Studio'da kimlik doğrulamayı başarıyla tamamladıktan sonra Düzenleyici'ye SQL komutları girilir. Son pencerenin sağındaki artı işaretini kullanarak birden fazla Düzenleyici penceresi ekleyebilirsiniz.

Gerektiği gibi Çalıştır, Biçimlendir ve Temizle seçeneklerini kullanarak AlloyDB komutlarını düzenleyici pencerelerine girersiniz.

Uzantılar'ı etkinleştirme

Bu uygulamayı oluşturmak için pgvector ve google_ml_integration uzantılarını kullanacağız. pgvector uzantısı, vektör yerleştirmelerini depolamanıza ve aramanıza olanak tanır. google_ml_integration uzantısı, SQL'de tahmin almak için Vertex AI tahmin uç noktalarına erişmek üzere kullandığınız işlevleri sağlar. Aşağıdaki DDL'leri çalıştırarak bu uzantıları etkinleştirin:

CREATE EXTENSION IF NOT EXISTS google_ml_integration CASCADE;
CREATE EXTENSION IF NOT EXISTS vector;

Veritabanında etkinleştirilen uzantıları kontrol etmek istiyorsanız şu SQL komutunu çalıştırın:

select extname, extversion from pg_extension;

Tablo oluşturma

Aşağıdaki DDL ifadesini kullanarak bir tablo oluşturun:

CREATE TABLE
 apparels ( id BIGINT,
   category VARCHAR(100),
   sub_category VARCHAR(50),
   uri VARCHAR(200),
   image VARCHAR(100),
   content VARCHAR(2000),
   pdt_desc VARCHAR(5000),
   embedding vector(768) );

Yukarıdaki komut başarıyla çalıştırıldığında tabloyu veritabanında görüntüleyebilirsiniz. Aşağıda örnek bir ekran görüntüsü verilmiştir:

Verileri besleme

Bu laboratuvarda, SQL dosyasında yaklaşık 200 kayıtlık test verileri var. id, category, sub_category, uri, image ve content içerir. Diğer alanlar laboratuvarda doldurulur.

Buradan 20 satırı/insert ifadesini kopyalayıp boş bir düzenleyici sekmesine yapıştırın ve ÇALIŞTIR'ı seçin.

Tablo içeriğini görmek için Gezgin bölümünü, giyim adlı tabloyu görene kadar genişletin. Tabloyu sorgulama seçeneğini görmek için üç noktayı (⋮) seçin. Yeni bir Düzenleyici sekmesinde bir SELECT ifadesi açılır.

İzin Ver

embedding işleviyle ilgili yürütme haklarını postgres kullanıcısına vermek için aşağıdaki ifadeyi çalıştırın:

GRANT EXECUTE ON FUNCTION embedding TO postgres;

AlloyDB hizmet hesabına Vertex AI Kullanıcı ROLÜ verme

Cloud Shell terminaline gidip aşağıdaki komutu verin:

PROJECT_ID=$(gcloud config get-value project)

gcloud projects add-iam-policy-binding $PROJECT_ID \
  --member="serviceAccount:service-$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)")@gcp-sa-alloydb.iam.gserviceaccount.com" \
--role="roles/aiplatform.user"

6. Bağlam

AlloyDB örneği sayfasına dönün.

Yer paylaşımı oluşturmak için context'ye (yani tek bir alana eklemek istediğimiz tüm bilgilere) sahip olmamız gerekir. Bunu, bir ürün açıklaması (pdt_desc olarak adlandıracağız) oluşturarak yapacağız. Bizim durumumuzda her ürünle ilgili tüm bilgileri kullanacağız ancak bunu kendi verilerinizle yaparken verileri işletmeniz için anlamlı bulduğunuz herhangi bir şekilde mühendislik yapabilirsiniz.

Yeni oluşturulan örneğinizin AlloyDB stüdyosunda aşağıdaki ifadeyi çalıştırın. Bu işlem, pdt_desc alanını bağlam verileriyle günceller:

UPDATE
 apparels
SET
 pdt_desc = CONCAT('This product category is: ', category, ' and sub_category is: ', sub_category, '. The description of the product is as follows: ', content, '. The product image is stored at: ', uri)
WHERE
 id IS NOT NULL;

Bu DML, tablodaki tüm alanlardan ve diğer bağımlılıklardan (kullanım alanınızda varsa) alınan bilgileri kullanarak basit bir bağlam özeti oluşturur. Daha hassas bir bilgi ve bağlam oluşturmak için verileri işletmeniz için anlamlı bulduğunuz herhangi bir şekilde tasarlayabilirsiniz.

7. Bağlam için yerleştirilmiş öğeler oluşturma

Bilgisayarların sayıları işlemesi metinleri işlemekten çok daha kolaydır. Yerleştirme sistemi, metni nasıl ifade edildiğine, hangi dilin kullanıldığına vb. bakılmaksızın metni temsil etmesi gereken bir dizi kayan noktalı sayıya dönüştürür.

Deniz kıyısındaki bir yeri açıklamayı deneyin. Bu terimler "deniz kıyısında", "deniz kenarında", "odanızdan okyanusa yürüyüş mesafesinde", "sur la mer", "на берегу океана" vb. gibi farklı şekillerde adlandırılabilir. Bu terimlerin tümü farklı görünse de anlamsal anlamları veya makine öğrenimi terminolojisinde yer paylaşımları birbirine çok yakın olmalıdır.

Veriler ve bağlam hazır olduğunda, ürün açıklamasının yerleştirilmelerini embedding alanındaki tabloya eklemek için SQL'i çalıştıracağız. Kullanabileceğiniz çeşitli yerleştirme modelleri vardır. Vertex AI'ın text-embedding-004 aracını kullanıyoruz. Proje boyunca aynı yerleştirme modelini kullandığınızdan emin olun.

Not: Bir süre önce oluşturulmuş mevcut bir Google Cloud projesi kullanıyorsanız textembedding-gecko gibi metin yerleştirme modelinin eski sürümlerini kullanmaya devam etmeniz gerekebilir.

UPDATE
 apparels
SET
 embedding = embedding( 'text-embedding-004',
   pdt_desc)
WHERE
 TRUE;

Bazı yerleştirmeleri görmek için apparels tablosuna tekrar bakın. Değişiklikleri görmek için SELECT ifadesini yeniden çalıştırdığınızdan emin olun.

SELECT
 id,
 category,
 sub_category,
 content,
 embedding
FROM
 apparels;

Bu işlem, sorgudaki örnek metin için aşağıdaki gibi bir kayan nokta dizisi gibi görünen embedding vektörünü döndürür:

Not: Ücretsiz katman kapsamında yeni oluşturulan Google Cloud projeleri, yerleştirme modellerine saniye başına izin verilen yerleşme isteği sayısıyla ilgili kota sorunlarıyla karşılaşabilir. Kimlik için bir filtre sorgusu kullanmanızı ve ardından yerleştirmeyi oluştururken 1-5 kayıt seçmenizi öneririz.

8. Vektör araması yapma

Tablo, veriler ve yerleştirmeler hazır olduğuna göre kullanıcı arama metni için gerçek zamanlı vektör araması gerçekleştirelim.

Kullanıcının şu soruyu sorduğunu varsayalım:

"Kadın üst giyim, pembe, gündelik, yalnızca saf pamuk istiyorum."

Aşağıdaki sorguyu çalıştırarak bu terimle eşleşen öğeleri bulabilirsiniz:

SELECT
id,
category,
sub_category,
content,
pdt_desc AS description
FROM
apparels
ORDER BY
embedding <=> embedding('text-embedding-004',
  'I want womens tops, pink casual only pure cotton.')::vector
LIMIT
5;

Bu sorguyu ayrıntılı olarak inceleyelim:

Bu sorguda,

Kullanıcının arama metni: "Kadın üst giyim, pembe, günlük, yalnızca saf pamuk istiyorum."
Bu modeli text-embedding-004 yönteminde text-embedding-004 modelini kullanarak yerleştirmelere dönüştürüyoruz.embedding() Bu adım, tablodaki tüm öğelere yerleştirme işlevini uyguladığımız son adımdan sonra tanıdık gelecektir.
"<=>", KOSİNÜS BENZERLİĞİ uzaklık yönteminin kullanıldığını gösterir. Kullanılabilen tüm benzerlik ölçümlerini pgvector dokümanlarında bulabilirsiniz.
Yerleştirme yönteminin sonucunu, veritabanında depolanan vektörlerle uyumlu hale getirmek için vektör türüne dönüştürüyoruz.
LIMIT 5, arama metnine en yakın 5 komşuyu ayıklamak istediğimizi gösterir.

Sonuç şu şekilde görünür:

Sonuçlarınızda görebileceğiniz gibi, eşleşmeler arama metnine oldukça yakındır. Sonuçların nasıl değiştiğini görmek için rengi değiştirmeyi deneyin.

Önemli Not:

Şimdi, ScaNN dizini kullanarak bu Vektör Arama sonucunun performansını (sorgu süresi), verimliliğini ve hatırlama oranını artırmak istediğimizi varsayalım. Dizinle ve dizin olmadan elde edilen sonuçlar arasındaki farkı karşılaştırmak için lütfen bu blog'daki adımları okuyun. Kolaylık sağlamak için burada dizin oluşturma adımlarını listeliyoruz:

Küme, örnek, bağlam ve yerleştirilmeler zaten oluşturulduğundan, aşağıdaki ifadeyi kullanarak ScaNN uzantısını yüklememiz yeterlidir:

CREATE EXTENSION IF NOT EXISTS alloydb_scann;

Ardından dizini (ScaNN) oluşturacağız:

CREATE INDEX apparel_index ON apparels

USING scann (embedding cosine)

WITH (num_leaves=54);

Yukarıdaki DDL'de apparel_index, dizinin adıdır.

"apparels" tablomdur

"scann" dizin yöntemidir

"embedding", dizine eklemek istediğim tablodaki sütundur.

"cosine", dizinle kullanmak istediğim mesafe yöntemidir.

"54", bu dizin için uygulanacak bölüm sayısıdır. 1 ile 1048576 arasında bir değere ayarlayın. Bu değere nasıl karar vereceğiniz hakkında daha fazla bilgi için ScaNN dizini ayarlama başlıklı makaleyi inceleyin.

ScaNN repo'sunda önerildiği gibi veri noktalarının KÖK KARESİ'ni kullandım (Bölümlendirme sırasında num_leaves, yaklaşık olarak veri noktalarının kare kökü olmalıdır).

Dizinin sorgu kullanılarak oluşturulup oluşturulmadığını kontrol edin:

SELECT * FROM pg_stat_ann_indexes;

Dizin olmadan kullandığımız aynı sorguyu kullanarak vektör araması yapın:

select * from apparels

ORDER BY embedding <=> CAST(embedding('textembedding-gecko', 'white tops for girls without any print') as vector(768))

LIMIT 20

Yukarıdaki sorgu, laboratuvarda 8. adımda kullandığımız sorguyla aynıdır. Ancak artık alan dizine eklendi.

Dizinle ve dizin olmadan (dizini bırakarak) basit bir arama sorgusuyla test edin:

white tops for girls without any print

Dizinlenen gömülü verilerdeki Vector Search sorgusundaki yukarıdaki arama metni, kaliteli arama sonuçları ve verimlilik sağlar. Dizinle verimlilik büyük ölçüde artar (yürütme süresi açısından: ScaNN olmadan 10,37 ms ve ScaNN ile 0,87 ms). Bu konu hakkında daha fazla bilgi için lütfen bu blogu inceleyin.

9. LLM ile Eşleşme Doğrulaması

Devam edip bir uygulamaya en iyi eşleşmeleri döndürecek bir hizmet oluşturmadan önce, bu potansiyel yanıtların gerçekten alakalı olup olmadığını ve kullanıcıyla paylaşmanın güvenli olup olmadığını doğrulamak için üretken yapay zeka modeli kullanalım.

Örneğin Gemini için ayarlandığından emin olma

Öncelikle, Google ML entegrasyonunun kümeniz ve örneğiniz için etkinleştirilip etkinleştirilmediğini kontrol edin. AlloyDB Studio'da aşağıdaki komutu verin:

show google_ml_integration.enable_model_support;

Değer "açık" olarak gösteriliyorsa sonraki 2 adımı atlayabilir ve doğrudan AlloyDB ile Vertex AI Model entegrasyonunu ayarlamaya geçebilirsiniz.

AlloyDB kümenizin birincil örneğine gidin ve BİRİNCİL ÖRNEĞİ DÜZENLE'yi tıklayın.

Gelişmiş Yapılandırma Seçenekleri'ndeki İşaretler bölümüne gidin. ve google_ml_integration.enable_model_support flag değerinin aşağıda gösterildiği gibi "on" olarak ayarlandığından emin olun:

"Açık" olarak ayarlanmamışsa "Açık" olarak ayarlayın ve ardından ÖRNEK YENİLE düğmesini tıklayın. Bu adım birkaç dakika sürer.

AlloyDB ve Vertex AI modeli entegrasyonu

Artık AlloyDB Studio'ya bağlanabilir ve belirtilen yerde proje kimliğinizi kullanarak AlloyDB'den Gemini model erişimini ayarlamak için aşağıdaki DML ifadesini çalıştırabilirsiniz. Komutu çalıştırmadan önce söz dizimi hatası konusunda uyarı alabilirsiniz ancak komut sorunsuz şekilde çalışır.

Öncelikle, aşağıdaki gibi Gemini 1.5 model bağlantısını oluştururuz. Aşağıdaki komuttaki $PROJECT_ID ifadesini Google Cloud proje kimliğinizle değiştirmeyi unutmayın.

CALL
 google_ml.create_model( model_id => 'gemini-1.5',
   model_request_url => 'https://us-central1-aiplatform.googleapis.com/v1/projects/$PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:streamGenerateContent',
   model_provider => 'google',
   model_auth_type => 'alloydb_service_agent_iam');

AlloyDB Studio'da aşağıdaki komutu kullanarak erişim için yapılandırılmış modelleri kontrol edebilirsiniz:

select model_id,model_type from google_ml.model_info_view;

Son olarak, veritabanı kullanıcılarının Google Vertex AI modelleri aracılığıyla tahmin yürütmek için ml_predict_row işlevini yürütmesine izin vermemiz gerekir. Aşağıdaki komutu çalıştırın:

GRANT EXECUTE ON FUNCTION ml_predict_row to postgres;

Not: Mevcut bir Google Cloud projesi ve bir süre önce oluşturulmuş mevcut bir AlloyDB kümesi/örneği kullanıyorsanız gemini-1.5 modelinin eski referanslarını bırakmanız ve yukarıdaki CALL ifadesiyle tekrar oluşturmanız, ardından gemini-1.5'in sonraki çağrılarında sorun yaşama ihtimaline karşı grant execute on function ml_predict_row komutunu tekrar çalıştırmanız gerekebilir.

Yanıtları değerlendirme

Sorgudan alınan yanıtların makul olmasını sağlamak için sonraki bölümde tek bir büyük sorgu kullanacağız. Ancak bu sorgunun anlaşılması zor olabilir. Şimdi parçalara bakacağız ve birkaç dakika içinde bunların nasıl bir araya geldiğini göreceğiz.

Öncelikle, kullanıcı sorgusuna en yakın 5 eşleşmeyi almak için veritabanına bir istek göndeririz. Bu işlemi basitleştirmek için sorguyu sabit kodluyoruz ancak endişelenmeyin, daha sonra sorguya dahil edeceğiz. apparels tablosundaki ürün açıklamasını ekliyoruz ve iki yeni alan ekliyoruz: biri açıklamayı dizinle, diğeri de orijinal isteğiyle birleştiren. Tüm bunlar xyz adlı bir tabloya (geçici bir tablo adı) kaydedilir.

CREATE TABLE
 xyz AS
SELECT
 id || ' - ' || pdt_desc AS literature,
 pdt_desc AS content,
 'I want womens tops, pink casual only pure cotton.' AS  user_text
FROM
 apparels
ORDER BY
 embedding <=> embedding('text-embedding-004',
   'I want womens tops, pink casual only pure cotton.')::vector
LIMIT
 5;

Bu sorgunun sonucu, kullanıcı sorgusuyla en benzer 5 satır olacaktır. Yeni xyz tablosu, her satırında aşağıdaki sütunların yer aldığı 5 satır içerir:

literature
content
user_text

Yanıtların ne kadar geçerli olduğunu belirlemek için yanıtların nasıl değerlendirileceğini açıkladığımız karmaşık bir sorgu kullanırız. Sorgu kapsamında xyz tablosundaki user_text ve content kullanılır.

"Read this user search text: ', user_text, 
' Compare it against the product inventory data set: ', content, 
' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match."

Bu sorguyu kullanarak xyz tablosundaki yanıtların "iyiliğini" inceleriz.

CREATE TABLE
  x AS
SELECT
  json_array_elements( google_ml.predict_row( model_id => 'gemini-1.5',
      request_body => CONCAT('{
 "contents": [ 
        { "role": "user", 
          "parts": 
             [ { "text": "Read this user search text: ', user_text, ' Compare it against the product inventory data set: ', content, ' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match." 
             } ]
         } 
] }'
)::json))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'
AS LLM_RESPONSE
FROM
    xyz;

predict_row, sonucunu JSON biçiminde döndürür. "-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'" kodu, söz konusu JSON'dan asıl metni ayıklamak için kullanılır. Döndürülen gerçek JSON'u görmek için bu kodu kaldırabilirsiniz.
Son olarak, LLM alanını almak için x tablosundan çıkarmanız yeterlidir:

SELECT 
LLM_RESPONSE 
FROM 
        x;

Bu, aşağıdaki gibi tek bir sonraki sorgu halinde birleştirilebilir.

Ara sonuçlara göz atmak için yukarıdaki sorguları çalıştırdıysanız bunu çalıştırmadan önce xyz ve x tablolarını AlloyDB veritabanından silmeniz/kaldırmanız gerekir.

SELECT
 LLM_RESPONSE
FROM (
 SELECT
 json_array_elements( google_ml.predict_row( model_id => 'gemini-1.5',
     request_body => CONCAT('{
     "contents": [
       { "role": "user",
         "parts":
            [ { "text": "Read this user search text: ', user_text, ' Compare it against the product inventory data set: ', content, ' Return a response with 3 values: 1) MATCH: if the 2 contexts are at least 85% matching or not: YES or NO 2) PERCENTAGE: percentage of match, make sure that this percentage is accurate 3) DIFFERENCE: A clear short easy description of the difference between the 2 products. Remember if the user search text says that some attribute should not be there, and the record has it, it should be a NO match."
            } ]
        }
] }'
)::json))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text'
AS LLM_RESPONSE
   FROM (
         SELECT
           id || ' - ' || pdt_desc AS literature,
           pdt_desc AS content,
         'I want womens tops, pink casual only pure cotton.' user_text
         FROM
           apparels
         ORDER BY
             embedding <=> embedding('text-embedding-004',
             'I want womens tops, pink casual only pure cotton.')::vector
         LIMIT
           5 ) AS xyz ) AS X;

Bu süreç yine de göz korkutucu görünse de umarım bu konuda biraz daha bilgi edinebilirsiniz. Sonuçlar, eşleşme olup olmadığını, eşleşmenin yüzdesini ve derecelendirmeyle ilgili bazı açıklamaları gösterir.

Gemini modelinde akış özelliğinin varsayılan olarak etkin olduğunu unutmayın. Bu nedenle, gerçek yanıt birden fazla satıra yayılır:

10. Uygulamayı web'e taşıma

Bu uygulamayı web'e taşımaya hazır mısınız? Bu Bilgi Motoru'nu Cloud Run Functions ile sunucusuz hale getirmek için aşağıdaki adımları uygulayın:

Yeni bir Cloud Run işlevi OLUŞTURMAK için Google Cloud Console'daki Cloud Run işlevlerine gidin veya https://console.cloud.google.com/functions/add bağlantısını kullanın.
Ortamı "Cloud Run işlevi" olarak seçin. "retail-engine" işlev adını girin ve Bölge olarak "us-central1"i seçin. Kimlik doğrulamayı "Kimliği doğrulanmayan çağrılara izin ver" olarak ayarlayın ve SONRAKİ'yi tıklayın. Çalışma zamanı olarak Java 17'yi, kaynak kod için de Satır İçi Düzenleyici'yi seçin.
Varsayılan olarak giriş noktası "gcfv2.HelloHttpFunction" olarak ayarlanır. Cloud Run işlevinizin HelloHttpFunction.java ve pom.xml bölümündeki yer tutucu kodunu sırasıyla Java dosyasından ve XML'den alınan kodla değiştirin.
Java dosyasındaki $PROJECT_ID yer tutucusunu ve AlloyDB bağlantı kimlik bilgilerini kendi değerlerinizle değiştirmeyi unutmayın. AlloyDB kimlik bilgileri, bu codelab'in başında kullandığımız kimlik bilgileridir. Farklı değerler kullandıysanız lütfen Java dosyasında da aynı değişiklikleri yapın.
Dağıt'ı tıklayın.

Dağıtıldıktan sonra, Cloud Functions'in AlloyDB veritabanı örneğimize erişmesine izin vermek için VPC bağlayıcısını oluşturacağız.

ÖNEMLİ ADIM:

Dağıtıma başladıktan sonra işlevleri Google Cloud Run Functions konsolunda görebilirsiniz. Yeni oluşturulan işlevi (retail-engine) arayın, tıklayın, ardından DÜZENLE'yi tıklayın ve aşağıdakileri değiştirin:

Çalışma zamanı, derleme, bağlantılar ve güvenlik ayarlarına gidin
Zaman aşım süresini 180 saniyeye yükseltin
BAĞLANTILAR sekmesine gidin:

Giriş ayarlarının altında "Tüm trafiğe izin ver" seçeneğinin seçili olduğundan emin olun.
Çıkış ayarları bölümünde Ağ açılır menüsünü tıklayın ve "Yeni VPC Bağlantısı Ekle" seçeneğini belirleyin. Açılan iletişim kutusunda gördüğünüz talimatları uygulayın:

VPC bağlayıcısı için bir ad girin ve bölgenin örneğinizle aynı olduğundan emin olun. Ağ değerini varsayılan olarak bırakın ve Alt Ağ'ı, 10.8.0.0 IP aralığı veya kullanılabilir benzer bir değerle Özel IP Aralığı olarak ayarlayın.
YÜKSEK ÇÖZÜNÜRLÜKLÜ AYARLARI GÖSTER'i genişletin ve yapılandırmayı tam olarak aşağıdaki şekilde ayarladığınızdan emin olun:

OLUŞTUR'u tıklayın. Bu bağlayıcı artık çıkış ayarlarında listelenir.
Yeni oluşturulan bağlayıcıyı seçin
Tüm trafiğin bu VPC bağlayıcısı üzerinden yönlendirilmesini tercih edin.
SONRAKİ'yi ve ardından DAĞIT'ı tıklayın.

11. Uygulamayı test etme

Güncellenen Cloud Functions dağıtıldıktan sonra uç noktayı aşağıdaki biçimde görürsünüz:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/retail-engine

Aşağıdaki komutu çalıştırarak Cloud Shell Terminal'de test edebilirsiniz:

gcloud functions call retail-engine --region=us-central1 --gen2 --data '{"search": "I want some kids clothes themed on Disney"}'

Alternatif olarak, Cloud Run işlevini aşağıdaki gibi test edebilirsiniz:

PROJECT_ID=$(gcloud config get-value project)

curl -X POST https://us-central1-$PROJECT_ID.cloudfunctions.net/retail-engine \
  -H 'Content-Type: application/json' \
  -d '{"search":"I want some kids clothes themed on Disney"}' \
  | jq .

Sonuç:

İşte bu kadar. AlloyDB verilerinde Embeddings modelini kullanarak benzerlik vektörü araması yapmak bu kadar basittir.

Sohbet aracısını oluşturma

Temsilci, bu laboratuvarın 2. bölümünde oluşturulur.

12. Temizleme

Bu laboratuvarın 2. bölümünü tamamlamayı planlıyorsanız mevcut proje silineceği için bu adımı atlayın.

Bu yayında kullanılan kaynaklar için Google Cloud hesabınızın ücretlendirilmesini istemiyorsanız şu adımları uygulayın:

Google Cloud Console'da Kaynakları yönetin sayfasına gidin.
Proje listesinde, silmek istediğiniz projeyi seçin ve ardından Sil'i tıklayın.
İletişim kutusuna proje kimliğini yazın ve projeyi silmek için Kapat'ı tıklayın.

13. Tebrikler

Tebrikler! AlloyDB, pgvector ve Vector Search'i kullanarak başarıyla bir benzerlik araması yaptınız. AlloyDB, Vertex AI ve Vector Search'in özelliklerini birleştirerek bağlamsal ve vektör aramalarını erişilebilir, verimli ve gerçekten anlam odaklı hale getirme konusunda dev bir adım attık. Bu laboratuvarın bir sonraki bölümünde, temsilci oluşturma adımları ele alınmaktadır.

Hata bildir