1. ভূমিকা
ওভারভিউ
Vertex AI সার্চ এবং কথোপকথন (পূর্বে জেনারেটিভ এআই অ্যাপ বিল্ডার নামে পরিচিত) ডেভেলপারদের এন্টারপ্রাইজ-গ্রেড জেনারেটিভ এআই অ্যাপ্লিকেশন তৈরি করতে Google এর ভিত্তি মডেল, অনুসন্ধান দক্ষতা এবং কথোপকথনমূলক AI প্রযুক্তির শক্তিতে ট্যাপ করতে দেয়। এই কোডল্যাবটি Vertex AI অনুসন্ধান ব্যবহার করার উপর ফোকাস করে, যেখানে আপনি আপনার নিজের ডেটাতে একটি Google-মানের অনুসন্ধান অ্যাপ্লিকেশন তৈরি করতে পারেন এবং আপনার ওয়েব পৃষ্ঠা বা অ্যাপে একটি অনুসন্ধান বার এম্বেড করতে পারেন।
ক্লাউড রান হল একটি পরিচালিত গণনা প্ল্যাটফর্ম যা আপনাকে সরাসরি Google এর মাপযোগ্য পরিকাঠামোর উপরে কন্টেইনার চালাতে দেয়। আপনি সোর্স-ভিত্তিক স্থাপনার বিকল্প ব্যবহার করে ক্লাউড রানে (যা একটি কন্টেইনারের ভিতরে রাখতে সক্ষম) যেকোনো প্রোগ্রামিং ভাষায় লিখিত কোড স্থাপন করতে পারেন।
এই কোডল্যাবে, আপনি একটি ক্লাউড স্টোরেজ বালতিতে পিডিএফ ফাইলগুলিতে অসংগঠিত সামগ্রীর জন্য অনুসন্ধান ফলাফল পুনরুদ্ধার করতে উত্স-ভিত্তিক স্থাপনার ব্যবহার করে একটি ক্লাউড রান পরিষেবা তৈরি করবেন৷ আপনি এখানে অসংগঠিত বিষয়বস্তু গ্রহণ সম্পর্কে আরও জানতে পারেন।
আপনি কি শিখবেন
- ক্লাউড স্টোরেজ বালতি থেকে পিডিএফ হিসাবে অসংগঠিত ডেটার জন্য কীভাবে একটি ভার্টেক্স এআই অনুসন্ধান অ্যাপ তৈরি করবেন
- ক্লাউড রানে সোর্স-ভিত্তিক স্থাপনা ব্যবহার করে কীভাবে একটি HTTP শেষ পয়েন্ট তৈরি করবেন
- ক্লাউড রান পরিষেবার জন্য সর্বনিম্ন বিশেষাধিকারের নীতি অনুসরণ করে কীভাবে একটি পরিষেবা অ্যাকাউন্ট তৈরি করতে হয় যাতে Vertex AI অনুসন্ধান অ্যাপটি জিজ্ঞাসা করতে ব্যবহার করা যায়
- Vertex AI সার্চ অ্যাপে প্রশ্ন করার জন্য কীভাবে ক্লাউড রান পরিষেবা চালু করবেন
2. সেটআপ এবং প্রয়োজনীয়তা
পূর্বশর্ত
- আপনি ক্লাউড কনসোলে লগ ইন করেছেন।
- আপনি পূর্বে একটি ক্লাউড রান পরিষেবা স্থাপন করেছেন৷ উদাহরণস্বরূপ, আপনি শুরু করতে সোর্স কোড কুইকস্টার্ট থেকে একটি ওয়েব পরিষেবা স্থাপন অনুসরণ করতে পারেন।
ক্লাউড শেল সক্রিয় করুন
- ক্লাউড কনসোল থেকে, ক্লাউড শেল সক্রিয় করুন ক্লিক করুন
.

যদি এটি আপনার প্রথমবার ক্লাউড শেল শুরু হয়, তাহলে এটি কী তা বর্ণনা করে আপনাকে একটি মধ্যবর্তী স্ক্রীন উপস্থাপন করা হবে। যদি আপনি একটি মধ্যবর্তী স্ক্রীনের সাথে উপস্থাপিত হন, তবে চালিয়ে যান ক্লিক করুন।

ক্লাউড শেলের সাথে সংযোগ করতে এবং সংযোগ করতে এটির মাত্র কয়েক মুহূর্ত লাগবে৷

এই ভার্চুয়াল মেশিনটি প্রয়োজনীয় সমস্ত বিকাশের সরঞ্জাম দিয়ে লোড করা হয়েছে। এটি একটি ক্রমাগত 5 GB হোম ডিরেক্টরি অফার করে এবং Google ক্লাউডে চলে, যা নেটওয়ার্ক কর্মক্ষমতা এবং প্রমাণীকরণকে ব্যাপকভাবে উন্নত করে। এই কোডল্যাবে আপনার অনেক কাজ, যদি সব না হয়, ব্রাউজার দিয়ে করা যেতে পারে।
একবার ক্লাউড শেলের সাথে সংযুক্ত হয়ে গেলে, আপনি দেখতে পাবেন যে আপনি প্রমাণীকৃত হয়েছেন এবং প্রকল্পটি আপনার প্রকল্প আইডিতে সেট করা আছে।
- আপনি প্রমাণীকৃত কিনা তা নিশ্চিত করতে ক্লাউড শেলে নিম্নলিখিত কমান্ডটি চালান:
gcloud auth list
কমান্ড আউটপুট
Credentialed Accounts
ACTIVE ACCOUNT
* <my_account>@<my_domain.com>
To set the active account, run:
$ gcloud config set account `ACCOUNT`
- gcloud কমান্ড আপনার প্রকল্প সম্পর্কে জানে তা নিশ্চিত করতে ক্লাউড শেলে নিম্নলিখিত কমান্ডটি চালান:
gcloud config list project
কমান্ড আউটপুট
[core] project = <PROJECT_ID>
যদি এটি না হয়, আপনি এই কমান্ড দিয়ে এটি সেট করতে পারেন:
gcloud config set project <PROJECT_ID>
কমান্ড আউটপুট
Updated property [core/project].
3. API সক্রিয় করুন৷
আপনি Vertex AI অনুসন্ধান ব্যবহার শুরু করার আগে, আপনাকে সক্ষম করতে হবে এমন বেশ কয়েকটি API আছে।
প্রথমত, এই কোডল্যাবের জন্য Vertex AI সার্চ এবং কথোপকথন, BigQuery, ক্লাউড স্টোরেজ API ব্যবহার করতে হবে। আপনি এখানে সেই API গুলি সক্ষম করতে পারেন।
দ্বিতীয়ত, Vertex AI অনুসন্ধান এবং কথোপকথন API সক্ষম করতে এই পদক্ষেপগুলি অনুসরণ করুন:
- Google ক্লাউড কনসোলে, Vertex AI অনুসন্ধান এবং কথোপকথন কনসোলে নেভিগেট করুন।
- পরিষেবার শর্তাবলী পড়ুন এবং সম্মত হন, তারপরে অবিরত ক্লিক করুন এবং API সক্রিয় করুন৷
4. ক্লাউড স্টোরেজ থেকে অসংগঠিত ডেটার জন্য একটি অনুসন্ধান অ্যাপ তৈরি করুন৷
- Google ক্লাউড কনসোলে, অনুসন্ধান এবং কথোপকথন পৃষ্ঠাতে যান। নতুন অ্যাপে ক্লিক করুন।
- অ্যাপ টাইপ নির্বাচন করুন প্যানে, অনুসন্ধান নির্বাচন করুন।
- নিশ্চিত করুন যে এন্টারপ্রাইজ বৈশিষ্ট্যগুলি আপনার নথিগুলি থেকে মৌখিকভাবে বের করা উত্তরগুলি পেতে সক্ষম করা হয়েছে৷
- সার্চ সারমাইজেশন পাওয়ার জন্য অ্যাডভান্সড এলএলএম ফিচার বিকল্পটি চালু আছে কিনা তা নিশ্চিত করুন।
- অ্যাপ নামের ক্ষেত্রে, আপনার অ্যাপের জন্য একটি নাম লিখুন। আপনার অ্যাপ আইডি অ্যাপ নামের নিচে প্রদর্শিত হবে।
- আপনার অ্যাপের লোকেশন হিসেবে গ্লোবাল (গ্লোবাল) নির্বাচন করুন এবং তারপর Continue এ ক্লিক করুন।
- ডেটা স্টোর প্যানে, নতুন ডেটা স্টোর তৈরি করুন ক্লিক করুন।
- একটি ডেটা উৎস নির্বাচন করুন প্যানে, ক্লাউড স্টোরেজ নির্বাচন করুন।
- GCS ফলক থেকে ডেটা আমদানিতে , ফোল্ডার নির্বাচন করা হয়েছে তা নিশ্চিত করুন।
- gs:// ক্ষেত্রে, নিম্নলিখিত মানটি লিখুন:
cloud-samples-data/gen-app-builder/search/stanford-cs-224এই ক্লাউড স্টোরেজ বাকেটটিতে পরীক্ষার উদ্দেশ্যে একটি সর্বজনীনভাবে উপলব্ধ ক্লাউড স্টোরেজ ফোল্ডার থেকে PDF ফাইল রয়েছে৷ - Unstructured নথি নির্বাচন করুন, এবং তারপর Continue-এ ক্লিক করুন।
- আপনার ডেটা স্টোর কনফিগার করুন ফলকে, আপনার ডেটা স্টোরের অবস্থান হিসাবে বিশ্বব্যাপী (গ্লোবাল) নির্বাচন করুন।
- আপনার ডেটা স্টোরের জন্য একটি নাম লিখুন। আপনার ক্লাউড রান পরিষেবা স্থাপন করার সময় আপনি এই কোডল্যাবে পরে এই নামটি ব্যবহার করবেন৷ তৈরি করুন ক্লিক করুন।
- ডেটা স্টোর প্যানে, আপনার নতুন ডেটা স্টোর নির্বাচন করুন এবং তৈরি করুন ক্লিক করুন।
- আপনার ডেটা স্টোরের ডেটা পৃষ্ঠায়, আপনার ডেটা ইনজেশনের স্থিতি দেখতে কার্যকলাপ ট্যাবে ক্লিক করুন৷ আমদানি প্রক্রিয়া সম্পূর্ণ হলে স্ট্যাটাস কলামে সম্পন্ন প্রদর্শন আমদানি করুন ।
- আমদানিকৃত নথির সংখ্যা দেখতে ডকুমেন্ট ট্যাবে ক্লিক করুন।
- নেভিগেশন মেনুতে, অনুসন্ধান অ্যাপ পরীক্ষা করতে পূর্বরূপ ক্লিক করুন।
- অনুসন্ধান বারে,
final lab due dateলিখুন এবং তারপরে আপনার ফলাফল দেখতে এন্টার টিপুন।
5. ক্লাউড রান পরিষেবা তৈরি করুন৷
এই বিভাগে, আপনি একটি ক্লাউড রান পরিষেবা তৈরি করবেন যা আপনার অনুসন্ধান পদগুলির জন্য একটি ক্যোয়ারী স্ট্রিং গ্রহণ করে৷ এই পরিষেবাটি ডিসকভারি ইঞ্জিন API-এর জন্য পাইথন ক্লায়েন্ট লাইব্রেরি ব্যবহার করবে। অন্যান্য সমর্থিত রানটাইমগুলির জন্য, আপনি এখানে তালিকাটি দেখতে পারেন।
ফাংশনের জন্য সোর্স কোড তৈরি করুন
প্রথমে একটি ডিরেক্টরি তৈরি করুন এবং সেই ডিরেক্টরিতে সিডি করুন।
mkdir docs-search-service-python && cd $_
তারপর, নিম্নলিখিত বিষয়বস্তু সহ একটি requirements.txt ফাইল তৈরি করুন:
blinker==1.6.3 cachetools==5.3.1 certifi==2023.7.22 charset-normalizer==3.3.0 click==8.1.7 Flask==3.0.0 google-api-core==2.12.0 google-auth==2.23.3 google-cloud-discoveryengine==0.11.2 googleapis-common-protos==1.61.0 grpcio==1.59.0 grpcio-status==1.59.0 idna==3.4 importlib-metadata==6.8.0 itsdangerous==2.1.2 Jinja2==3.1.2 MarkupSafe==2.1.3 numpy==1.26.1 proto-plus==1.22.3 protobuf==4.24.4 pyasn1==0.5.0 pyasn1-modules==0.3.0 requests==2.31.0 rsa==4.9 urllib3==2.0.7 Werkzeug==3.0.1 zipp==3.17.0
এরপরে, নিম্নলিখিত বিষয়বস্তু সহ একটি main.py উৎস ফাইল তৈরি করুন:
from typing import List
import json
import os
from flask import Flask
from flask import request
app = Flask(__name__)
from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine_v1 as discoveryengine
project_id = os.environ.get('PROJECT_ID')
location = "global" # Values: "global", "us", "eu"
data_store_id = os.environ.get('SEARCH_ENGINE_ID')
print(project_id)
print(data_store_id)
@app.route("/")
def search_storage():
search_query = request.args.get("searchQuery")
result = search_sample(project_id, location, data_store_id, search_query)
return result
def search_sample(
project_id: str,
location: str,
data_store_id: str,
search_query: str,
) -> str:
# For more information, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
client_options = (
ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
if location != "global"
else None
)
# Create a client
client = discoveryengine.SearchServiceClient(client_options=client_options)
# The full resource name of the search engine serving config
# e.g. projects/{project_id}/locations/{location}/dataStores/{data_store_id}/servingConfigs/{serving_config_id}
serving_config = client.serving_config_path(
project=project_id,
location=location,
data_store=data_store_id,
serving_config="default_config",
)
# Optional: Configuration options for search
# Refer to the `ContentSearchSpec` reference for all supported fields:
# https://cloud.google.com/python/docs/reference/discoveryengine/latest/google.cloud.discoveryengine_v1.types.SearchRequest.ContentSearchSpec
content_search_spec = discoveryengine.SearchRequest.ContentSearchSpec(
# For information about snippets, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/snippets
snippet_spec=discoveryengine.SearchRequest.ContentSearchSpec.SnippetSpec(
return_snippet=True
),
# For information about search summaries, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/get-search-summaries
summary_spec=discoveryengine.SearchRequest.ContentSearchSpec.SummarySpec(
summary_result_count=5,
include_citations=True,
ignore_adversarial_query=True,
ignore_non_summary_seeking_query=True,
),
)
# Refer to the `SearchRequest` reference for all supported fields:
# https://cloud.google.com/python/docs/reference/discoveryengine/latest/google.cloud.discoveryengine_v1.types.SearchRequest
request = discoveryengine.SearchRequest(
serving_config=serving_config,
query=search_query,
page_size=10,
content_search_spec=content_search_spec,
query_expansion_spec=discoveryengine.SearchRequest.QueryExpansionSpec(
condition=discoveryengine.SearchRequest.QueryExpansionSpec.Condition.AUTO,
),
spell_correction_spec=discoveryengine.SearchRequest.SpellCorrectionSpec(
mode=discoveryengine.SearchRequest.SpellCorrectionSpec.Mode.AUTO
),
)
response = client.search(request)
return response.summary.summary_text
if __name__ == "__main__":
app.run(debug=True, host="0.0.0.0", port=int(os.environ.get("PORT", 8080)))
পরিবেশ ভেরিয়েবল সেটআপ করুন
এই কোডে, আপনি এই কোডল্যাবে ব্যবহৃত gcloud কমান্ডের পঠনযোগ্যতা উন্নত করতে কয়েকটি পরিবেশের ভেরিয়েবল তৈরি করবেন।
PROJECT_ID=$(gcloud config get-value project) SERVICE_NAME="search-storage-pdfs-python" SERVICE_REGION="us-central1" # update with your data store name SEARCH_ENGINE_ID=<your-data-store-name>
একটি পরিষেবা অ্যাকাউন্ট তৈরি করুন
এই কোডল্যাবটি আপনাকে দেখায় কিভাবে ক্লাউড রান পরিষেবার জন্য একটি পরিষেবা অ্যাকাউন্ট তৈরি করতে হয় যাতে Vertex AI অনুসন্ধান API অ্যাক্সেস করা যায়৷
SERVICE_ACCOUNT="cloud-run-vertex-ai-search" SERVICE_ACCOUNT_ADDRESS=$SERVICE_ACCOUNT@$PROJECT_ID.iam.gserviceaccount.com gcloud iam service-accounts create $SERVICE_ACCOUNT \ --display-name="Cloud Run Vertex AI Search service account" gcloud projects add-iam-policy-binding $PROJECT_ID \ --member serviceAccount:$SERVICE_ACCOUNT_ADDRESS \ --role='roles/discoveryengine.editor'
ক্লাউড রান পরিষেবা স্থাপন করুন
এখন আপনি আপনার ক্লাউড রান পরিষেবাকে স্বয়ংক্রিয়ভাবে ধারণ করতে একটি উত্স-ভিত্তিক স্থাপনা ব্যবহার করতে পারেন৷
gcloud run deploy $SERVICE_NAME \ --region=$SERVICE_REGION \ --source=. \ --service-account $SERVICE_ACCOUNT \ --update-env-vars SEARCH_ENGINE_ID=$SEARCH_ENGINE_ID,PROJECT_ID=$PROJECT_ID \ --no-allow-unauthenticated
এবং তারপরে আপনি ক্লাউড রান ইউআরএলটিকে পরে ব্যবহার করার জন্য একটি পরিবেশ পরিবর্তনশীল হিসাবে সংরক্ষণ করতে পারেন।
ENDPOINT_URL="$(gcloud run services describe $SERVICE_NAME --region=$SERVICE_REGION --format='value(status.url)')"
6. ক্লাউড রান পরিষেবাতে কল করুন৷
আপনি এখন আপনার ক্লাউড রান পরিষেবাকে একটি ক্যোয়ারী স্ট্রিং সহ কল করতে পারেন যে What is the final lab due date? .
curl -H "Authorization: bearer $(gcloud auth print-identity-token)" "$ENDPOINT_URL?searchQuery=what+is+the+final+lab+due+date"
আপনার ফলাফল নীচের উদাহরণ আউটপুট অনুরূপ হওয়া উচিত:
The final lab is due on Tuesday, March 21 at 4:30 PM [1].
7. অভিনন্দন!
কোডল্যাব সম্পূর্ণ করার জন্য অভিনন্দন!
আমরা Vertex AI অনুসন্ধান এবং ক্লাউড রানের ডকুমেন্টেশন পর্যালোচনা করার পরামর্শ দিই।
আমরা কভার করেছি কি
- ক্লাউড স্টোরেজ বালতি থেকে পিডিএফ হিসাবে অসংগঠিত ডেটার জন্য কীভাবে একটি ভার্টেক্স এআই অনুসন্ধান অ্যাপ তৈরি করবেন
- ক্লাউড রানে সোর্স-ভিত্তিক স্থাপনা ব্যবহার করে কীভাবে একটি HTTP শেষ পয়েন্ট তৈরি করবেন
- ক্লাউড রান পরিষেবার জন্য সর্বনিম্ন বিশেষাধিকারের নীতি অনুসরণ করে কীভাবে একটি পরিষেবা অ্যাকাউন্ট তৈরি করা যায় যাতে Vertex AI অনুসন্ধান অ্যাপটি জিজ্ঞাসা করতে ব্যবহার করা যায়।
- Vertex AI সার্চ অ্যাপে প্রশ্ন করার জন্য কীভাবে ক্লাউড রান পরিষেবা চালু করবেন
8. পরিষ্কার করুন
অসাবধানতাবশত চার্জ এড়াতে, (উদাহরণস্বরূপ, যদি এই ক্লাউড ফাংশনটি আপনার মাসিক ক্লাউড ফাংশন ইনভোকমেন্ট বরাদ্দের চেয়ে বিনামূল্যের স্তরে অজান্তেই বেশি বার আহ্বান করা হয়), আপনি হয় ক্লাউড ফাংশনটি মুছে ফেলতে পারেন বা ধাপ 2 এ আপনার তৈরি করা প্রকল্পটি মুছে ফেলতে পারেন৷
ক্লাউড ফাংশনটি মুছে ফেলতে, https://console.cloud.google.com/functions/- এ ক্লাউড ফাংশন ক্লাউড কনসোলে যান এবং imagen_vqa ফাংশনটি মুছুন (অথবা আপনি অন্য নাম ব্যবহার করলে $FUNCTION_NAME)।
আপনি যদি সম্পূর্ণ প্রকল্প মুছে ফেলার সিদ্ধান্ত নেন, আপনি https://console.cloud.google.com/cloud-resource-manager- এ যেতে পারেন, ধাপ 2-এ আপনার তৈরি করা প্রকল্পটি নির্বাচন করুন এবং মুছুন নির্বাচন করুন৷ আপনি যদি প্রকল্পটি মুছে ফেলেন, তাহলে আপনাকে আপনার ক্লাউড SDK-এ প্রকল্পগুলি পরিবর্তন করতে হবে৷ আপনি gcloud projects list চালিয়ে সমস্ত উপলব্ধ প্রকল্পের তালিকা দেখতে পারেন।