किसी पीएससी एंडपॉइंट पर Model Garden डिप्लॉय करना

1. परिचय

Vertex AI Model Garden से डिप्लॉय किए गए मॉडल के लिए, सुरक्षित और निजी ऐक्सेस सेट अप करने के लिए Private Service Connect का इस्तेमाल करें. इस तरीके से, सार्वजनिक एंडपॉइंट को दिखाने के बजाय, अपने मॉडल को एक निजी Vertex AI एंडपॉइंट पर डिप्लॉय किया जा सकता है. इसे सिर्फ़ आपके वर्चुअल प्राइवेट क्लाउड (VPC) में ऐक्सेस किया जा सकता है.

Private Service Connect, आपके वीपीसी में एक एंडपॉइंट बनाता है. इसमें इंटरनल आईपी पता होता है. यह सीधे तौर पर, Google की मैनेज की गई Vertex AI सेवा से कनेक्ट होता है. यह सेवा आपके मॉडल को होस्ट करती है. इससे आपके वीपीसी और ऑन-प्रिमाइसेस एनवायरमेंट में मौजूद ऐप्लिकेशन, निजी आईपी पतों का इस्तेमाल करके अनुमान लगाने के अनुरोध भेज पाते हैं. ऐसा Cloud वीपीएन या इंटरकनेक्ट के ज़रिए किया जाता है. नेटवर्क का पूरा ट्रैफ़िक, Google के नेटवर्क पर रहता है. इससे सुरक्षा बेहतर होती है, लेटेन्सी कम होती है, और आपके मॉडल के एंडपॉइंट को सार्वजनिक इंटरनेट से पूरी तरह से अलग रखा जाता है.

4a78228d4197997c.png

आपको क्या बनाना है

इस ट्यूटोरियल में, आपको Model Garden से Gemma 3 डाउनलोड करना होगा. इसे Vertex AI Online Inference में, Private Service Connect के ज़रिए ऐक्सेस किए जा सकने वाले प्राइवेट एंडपॉइंट के तौर पर होस्ट किया जाता है. एंड-टू-एंड सेटअप में ये शामिल होंगे:

  1. Model Garden मॉडल: आपको Vertex AI Model Garden से Gemma 3 को चुनना होगा. इसके बाद, इसे Private Service Connect एंडपॉइंट पर डिप्लॉय करना होगा.
  2. Private Service Connect: आपको अपने वर्चुअल प्राइवेट क्लाउड (वीपीसी) में एक उपभोक्ता एंडपॉइंट कॉन्फ़िगर करना होगा. इसमें आपके नेटवर्क के अंदर का एक इंटरनल आईपी पता होगा.
  3. Vertex AI से सुरक्षित कनेक्शन: पीएससी एंडपॉइंट, आपके प्राइवेट मॉडल डिप्लॉयमेंट के लिए Vertex AI की ओर से अपने-आप जनरेट होने वाले सर्विस अटैचमेंट को टारगेट करेगा. इससे एक निजी कनेक्शन बनता है. इससे यह पक्का होता है कि आपके वीपीसी और मॉडल सर्विंग एंडपॉइंट के बीच का ट्रैफ़िक, सार्वजनिक इंटरनेट से नहीं गुज़रता.
  4. आपके वीपीसी में क्लाइंट कॉन्फ़िगरेशन: आपको एक क्लाइंट सेट अप करना होगा. जैसे, Compute Engine वीएम) का इस्तेमाल किया जा सकता है. इससे पीएससी एंडपॉइंट के इंटरनल आईपी पते का इस्तेमाल करके, डिप्लॉय किए गए मॉडल को अनुमान के अनुरोध भेजे जा सकते हैं.

इस प्रोसेस के आखिर तक, आपके पास Model Garden के मॉडल का एक ऐसा उदाहरण होगा जिसे निजी तौर पर उपलब्ध कराया जा रहा है. इसे सिर्फ़ आपके तय किए गए वीपीसी नेटवर्क से ऐक्सेस किया जा सकेगा.

आपको क्या सीखने को मिलेगा

इस ट्यूटोरियल में, आपको Vertex AI Model Garden से मॉडल डिप्लॉय करने का तरीका बताया जाएगा. साथ ही, Private Service Connect (PSC) का इस्तेमाल करके, इसे अपने वर्चुअल प्राइवेट क्लाउड (वीपीसी) से सुरक्षित तरीके से ऐक्सेस करने का तरीका बताया जाएगा. इस तरीके से, आपके वीपीसी (उपयोगकर्ता) में मौजूद ऐप्लिकेशन, सार्वजनिक इंटरनेट का इस्तेमाल किए बिना, Vertex AI मॉडल एंडपॉइंट (प्रोड्यूसर सेवा) से निजी तौर पर कनेक्ट हो सकते हैं.

खास तौर पर, आपको इनके बारे में जानकारी मिलेगी:

  1. Vertex AI के लिए पीएससी के बारे में जानकारी: पीएससी, उपभोक्ता और सेवा देने वाली कंपनी के बीच निजी और सुरक्षित कनेक्शन कैसे बनाता है. आपका वीपीसी, डिप्लॉय किए गए Model Garden मॉडल को इंटरनल आईपी पतों का इस्तेमाल करके ऐक्सेस कर सकता है.
  2. निजी ऐक्सेस के साथ मॉडल डिप्लॉय करना: PSC का इस्तेमाल करने के लिए, अपने Model Garden मॉडल के लिए Vertex AI एंडपॉइंट को कैसे कॉन्फ़िगर करें, ताकि यह एक निजी एंडपॉइंट बन जाए.
  3. सेवा अटैचमेंट की भूमिका: किसी मॉडल को प्राइवेट Vertex AI एंडपॉइंट पर डिप्लॉय करने पर, Google Cloud, Google की ओर से मैनेज किए जाने वाले किरायेदार प्रोजेक्ट में अपने-आप एक सेवा अटैचमेंट बना देता है. यह सेवा अटैचमेंट, मॉडल सर्विंग सेवा को उपभोक्ता नेटवर्क के लिए उपलब्ध कराता है.
  4. अपने वीपीसी में पीएससी एंडपॉइंट बनाने का तरीका:
  • डिप्लॉय किए गए Vertex AI एंडपॉइंट की जानकारी से, यूनीक सर्विस अटैचमेंट यूआरआई पाने का तरीका.
  • अपने वीपीसी में चुने गए सबनेट में, इंटरनल आईपी पते को रिज़र्व करने का तरीका.
  • अपने वीपीसी में फ़ॉरवर्डिंग का ऐसा नियम कैसे बनाएं जो पीएससी एंडपॉइंट के तौर पर काम करे और Vertex AI सर्विस अटैचमेंट को टारगेट करे. यह एंडपॉइंट, मॉडल को रिज़र्व किए गए इंटरनल आईपी के ज़रिए ऐक्सेस करने की सुविधा देता है.
  1. निजी कनेक्टिविटी सेट अप करना: आपके वीपीसी में मौजूद पीएससी एंडपॉइंट, सर्विस अटैचमेंट से कैसे कनेक्ट होता है. इससे आपका नेटवर्क, Vertex AI सेवा से सुरक्षित तरीके से कनेक्ट हो जाता है.
  2. निजी तौर पर अनुमान लगाने के अनुरोध भेजना: अपने वीपीसी में मौजूद संसाधनों (जैसे कि Compute Engine वीएम) से, पीएससी एंडपॉइंट के इंटरनल आईपी पते पर अनुमान लगाने के अनुरोध कैसे भेजें.
  3. पुष्टि करना: यह जांचने और पुष्टि करने के लिए कि निजी कनेक्शन के ज़रिए, अपने वीपीसी से डिप्लॉय किए गए Model Garden मॉडल को अनुमान लगाने के अनुरोध भेजे जा सकते हैं, यह तरीका अपनाएं.

यह प्रोसेस पूरी करने के बाद, Model Garden से ऐसे मॉडल होस्ट किए जा सकेंगे जिन्हें सिर्फ़ आपके निजी नेटवर्क इंफ़्रास्ट्रक्चर से ऐक्सेस किया जा सकता है.

आपको किन चीज़ों की ज़रूरत होगी

Google Cloud प्रोजेक्ट

IAM अनुमतियां

2. शुरू करने से पहले

ट्यूटोरियल के साथ काम करने के लिए प्रोजेक्ट को अपडेट करना

इस ट्यूटोरियल में, Cloud Shell में gcloud कॉन्फ़िगरेशन लागू करने में मदद के लिए, $variables का इस्तेमाल किया गया है.

Cloud Shell में, यह तरीका अपनाएं:

gcloud config list project
gcloud config set project [YOUR-PROJECT-ID]
projectid=[YOUR-PROJECT-ID]
echo $projectid

एपीआई चालू करना

Cloud Shell में, यह तरीका अपनाएं:

gcloud services enable "compute.googleapis.com"
gcloud services enable "aiplatform.googleapis.com"
gcloud services enable "serviceusage.googleapis.com"

3. मॉडल डिप्लॉय करना

Model Garden से मॉडल डिप्लॉय करने के लिए, यहां दिया गया तरीका अपनाएं

Google Cloud Console में, Model Garden पर जाएं. इसके बाद, Gemma 3 को खोजें और चुनें

10c7ce35cfc571dc.png

'डिप्लॉय करने के विकल्प' पर क्लिक करें और Vertex AI चुनें

ed9280fcc5f4c3fa.png

'Vertex AI पर डिप्लॉय करें' पैनल में, 'ऐडवांस' को चुनें. पहले से भरी गई जगह और मशीन की खास जानकारी, उपलब्ध क्षमता के आधार पर चुनी जाती है. इन वैल्यू को बदला जा सकता है. हालांकि, यह कोड लैब us-central1 के लिए बनाया गया है.

3f7e4cefdc06488a.png

'Vertex AI पर डिप्लॉय करें' पैनल में, पक्का करें कि एंडपॉइंट ऐक्सेस को Private Service Connect के तौर पर कॉन्फ़िगर किया गया हो. इसके बाद, अपना प्रोजेक्ट चुनें.

d0f0d9bc49205fb3.png

अन्य विकल्पों के लिए, सभी डिफ़ॉल्ट सेटिंग को वैसे ही रहने दें. इसके बाद, सबसे नीचे मौजूद 'लागू करें' को चुनें. साथ ही, लागू करने की स्थिति जानने के लिए सूचनाएं देखें.

9bd3b10256b7b2cc.png

Model Garden में, us-central1 क्षेत्र चुनें. यह Gemma 3 मॉडल और एंडपॉइंट उपलब्ध कराता है. मॉडल को डिप्लॉय करने में करीब 5 मिनट लगते हैं.

e998ee6288a8a7a.png

यह प्रोसेस पूरी होने के बाद, 30 मिनट में एंडपॉइंट का स्टेटस "चालू है" में बदल जाएगा

9dcc7c56dbe0e88a.png

एंडपॉइंट चुनकर, एंडपॉइंट आईडी पाएं और उसे नोट करें.

6e3e2feef82fadd5.png

Private Service Connect सर्विस अटैचमेंट यूआरआई पाने के लिए, Cloud Shell खोलें और यह तरीका अपनाएं. इस यूआरआई स्ट्रिंग का इस्तेमाल उपभोक्ता तब करता है, जब वह पीएससी उपभोक्ता एंडपॉइंट को डिप्लॉय करता है.

Cloud Shell में, एंडपॉइंट आईडी अपडेट करें. इसके बाद, यह निर्देश जारी करें.

gcloud ai endpoints describe [Endpoint ID] --region=us-central1  | grep -i serviceAttachment:

यहां एक उदाहरण दिया गया है:

user@cloudshell:$ gcloud ai endpoints describe 2124795225560842240 --region=us-central1 | grep -i serviceAttachment:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
    serviceAttachment: projects/o9457b320a852208e-tp/regions/us-central1/serviceAttachments/gkedpm-52065579567eaf39bfe24f25f7981d

serviceAttachment के बाद के कॉन्टेंट को "Service_attachment" नाम के वैरिएबल में कॉपी करें. पीएससी कनेक्शन बनाते समय, आपको इसकी ज़रूरत पड़ेगी.

user@cloudshell:$ Service_attachment=projects/o9457b320a852208e-tp/regions/us-central1/serviceAttachments/gkedpm-52065579567eaf39bfe24f25f7981d

4. उपयोगकर्ता का सेटअप

उपभोक्ता वीपीसी बनाएं

Cloud Shell में, यह तरीका अपनाएं:

gcloud compute networks create consumer-vpc --project=$projectid --subnet-mode=custom

उपयोगकर्ता वीएम सबनेट बनाएं

Cloud Shell में, यह तरीका अपनाएं:

gcloud compute networks subnets create consumer-vm-subnet --project=$projectid --range=192.168.1.0/24 --network=consumer-vpc --region=us-central1 --enable-private-ip-google-access

पीएससी एंडपॉइंट सबनेट बनाना

gcloud compute networks subnets create pscendpoint-subnet --project=$projectid --range=10.10.10.0/28 --network=consumer-vpc --region=us-central1

5. IAP की सुविधा चालू करना

आईएपी को अपने वीएम इंस्टेंस से कनेक्ट करने की अनुमति देने के लिए, फ़ायरवॉल का ऐसा नियम बनाएं जो:

  • यह उन सभी वीएम इंस्टेंस पर लागू होता है जिन्हें आपको आईएपी का इस्तेमाल करके ऐक्सेस करना है.
  • इससे 35.235.240.0/20 आईपी रेंज से इन्ग्रेस ट्रैफ़िक को आने की अनुमति मिलती है. इस रेंज में वे सभी आईपी पते शामिल हैं जिनका इस्तेमाल IAP, टीसीपी फ़ॉरवर्डिंग के लिए करता है.

Cloud Shell में, IAP फ़ायरवॉल नियम बनाएं.

gcloud compute firewall-rules create ssh-iap-consumer \
    --network consumer-vpc \
    --allow tcp:22 \
    --source-ranges=35.235.240.0/20

6. उपयोगकर्ता वीएम इंस्टेंस बनाना

Cloud Shell में, consumer-vm नाम का उपभोक्ता वीएम इंस्टेंस बनाएं.

gcloud compute instances create consumer-vm \
    --project=$projectid \
    --machine-type=e2-micro \
    --image-family debian-11 \
    --no-address \
    --shielded-secure-boot \
    --image-project debian-cloud \
    --zone us-central1-a \
    --subnet=consumer-vm-subnet 

7. Private Service Connect एंडपॉइंट

उपयोगकर्ता, अपने वीपीसी में मौजूद इंटरनल आईपी पते के साथ उपभोक्ता एंडपॉइंट (फ़ॉरवर्डिंग का नियम) बनाता है. यह पीएससी एंडपॉइंट, प्रोड्यूसर के सर्विस अटैचमेंट को टारगेट करता है. उपभोक्ता वीपीसी या हाइब्रिड नेटवर्क में मौजूद क्लाइंट, इस इंटरनल आईपी पते पर ट्रैफ़िक भेज सकते हैं. इससे वे प्रोड्यूसर की सेवा तक पहुँच सकते हैं.

उपभोक्ता एंडपॉइंट के लिए आईपी पता रिज़र्व करें.

Cloud Shell में, फ़ॉरवर्ड करने का नियम बनाएं.

gcloud compute addresses create psc-address \
    --project=$projectid \
    --region=us-central1 \
    --subnet=pscendpoint-subnet \
    --addresses=10.10.10.6

पुष्टि करें कि आईपी पता रिज़र्व किया गया है

Cloud Shell में, रिज़र्व किए गए आईपी पते की सूची बनाएं.

gcloud compute addresses list 

आपको 10.10.10.6 आईपी पता रिज़र्व किया हुआ दिखेगा.

edb5661bea25cd14.png

पिछले चरण में, 'मॉडल डिप्लॉय करें' सेक्शन में कैप्चर किए गए service attachment URI, target-service-attachment को तय करके, उपभोक्ता एंडपॉइंट बनाएं.

Cloud Shell में, नेटवर्क अटैचमेंट के बारे में बताएं.

 gcloud compute forwarding-rules create psc-consumer-ep \
    --network=consumer-vpc \
    --address=psc-address \
    --region=us-central1 \
    --target-service-attachment=$Service_attachment \
    --project=$projectid

पुष्टि करें कि सेवा अटैचमेंट, एंडपॉइंट को स्वीकार करता है

gcloud compute forwarding-rules describe psc-consumer-ep \
    --project=$projectid \
    --region=us-central1 \

जवाब में, पुष्टि करें कि pscConnectionStatus फ़ील्ड में "ACCEPTED" स्टेटस दिखता हो

6c66347ede9d4c7d.png

8. उपयोगकर्ता की वीएम से टेस्ट करना

Cloud Shell में, Vertex Model Garden API को ऐक्सेस करने के लिए, Consumer VM को ऐक्सेस देने के लिए यह तरीका अपनाएं

उपयोगकर्ता वीएम में एसएसएच करना

f0984d9e60530cb2.png

ऐप्लिकेशन के डिफ़ॉल्ट क्रेडेंशियल की मदद से फिर से पुष्टि करें और Vertex AI के स्कोप तय करें.

gcloud auth application-default login
--scopes=https://www.googleapis.com/auth/cloud-platform 

CURLl कमांड जनरेट करने के लिए, यहां दी गई टेबल का इस्तेमाल करें. साथ ही, इसे अपने हिसाब से अडजस्ट करें

एट्रिब्यूट

मान

प्रोटोकॉल

HTTP

जगह

us-central1

ऑनलाइन अनुमान लगाने वाला एंडपॉइंट

2133539641536544768

प्रोजेक्ट आईडी

test4-473419

मॉडल

gemma-3-12b-it

Private Service Connect एंडपॉइंट का आईपी पता

10.10.10.6

मैसेज

[{"role": "user","content": "एक पाउंड पंख ज़्यादा भारी होते हैं या एक पाउंड पत्थर?"}]

अपने एनवायरमेंट की जानकारी के आधार पर, curl कमांड को अपडेट करें और उसे लागू करें:

curl -k -v -X POST   -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"   -H "Content-Type: application/json"   http://[PSC-IP]/v1/projects/[Project-ID]/locations/us-central1/endpoints/[Predictions Endpoint]/chat/completions   -d '{"model": "google/gemma-3-12b-it", "messages": [{"role": "user","content": "What weighs more 1 pound of feathers or rocks?"}] }'

उदाहरण:

curl -k -v -X POST   -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"   -H "Content-Type: application/json"   http://10.10.10.6/v1/projects/test4-473419/locations/us-central1/endpoints/2133539641536544768/chat/completions   -d '{"model": "google/gemma-3-12b-it", "messages": [{"role": "user","content": "What weighs more 1 pound of feathers or rocks?"}] }'

फ़ाइनल नतीजा - बधाई हो!!!

आपको आउटपुट में सबसे नीचे Gemma 3 से मिले अनुमान का नतीजा दिखेगा. इससे पता चलता है कि आपने पीएससी एंडपॉइंट के ज़रिए, एपीआई एंडपॉइंट को निजी तौर पर ऐक्सेस किया है

 Connection #0 to host 10.10.10.6 left intact
{"id":"chatcmpl-9e941821-65b3-44e4-876c-37d81baf62e0","object":"chat.completion","created":1759009221,"model":"google/gemma-3-12b-it","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"This is a classic trick question! They weigh the same. One pound is one pound, regardless of the material. 😊\n\n\n\n","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":106}],"usage":{"prompt_tokens":20,"total_tokens":46,"completion_tokens":26,"prompt_tokens_details":null},"prompt_logprobs":null

9. व्यवस्थित करें

Cloud Shell से, ट्यूटोरियल के कॉम्पोनेंट मिटाएं.

gcloud ai endpoints undeploy-model ENDPOINT_ID --deployed-model-id=DEPLOYED_MODEL_ID --region=us-central1 --quiet

gcloud ai endpoints delete $ENDPOINT_ID --project=$projectid --region=us-central1 --quiet

gcloud ai models delete $MODEL_ID --project=$projectid --region=us-central1 --quiet

gcloud compute instances delete consumer-vm --zone=us-central1-a --quiet

gcloud compute forwarding-rules delete psc-consumer-ep --region=us-central1 --project=$projectid --quiet

gcloud compute addresses delete psc-address --region=us-central1 --project=$projectid --quiet

gcloud compute networks subnets delete pscendpoint-subnet consumer-vm-subnet --region=us-central1 --quiet

gcloud compute firewall-rules delete ssh-iap-consumer --project=$projectid

gcloud compute networks delete consumer-vpc --project=$projectid --quiet

gcloud projects delete $projectid --quiet

10. बधाई हो

बधाई हो! आपने Private Service Connect Endpoint का इस्तेमाल करके, Vertex AI Prediction पर होस्ट किए गए Gemma 3 API के प्राइवेट ऐक्सेस को कॉन्फ़िगर और पुष्टि कर लिया है.

आपने उपभोक्ता इन्फ़्रास्ट्रक्चर बनाया है. इसमें, इंटरनल आईपी पता रिज़र्व करना और अपने वीपीसी में Private Service Connect एंडपॉइंट (फ़ॉरवर्डिंग का नियम) कॉन्फ़िगर करना शामिल है. यह एंडपॉइंट, Vertex AI सेवा से सुरक्षित तरीके से कनेक्ट होता है. इसके लिए, यह आपके डिप्लॉय किए गए Gemma 3 मॉडल से जुड़े सेवा अटैचमेंट को टारगेट करता है. इस सेटअप की मदद से, वीपीसी या कनेक्ट किए गए नेटवर्क में मौजूद आपके ऐप्लिकेशन, Gemma 3 API के साथ निजी तौर पर और सुरक्षित तरीके से इंटरैक्ट कर सकते हैं. इसके लिए, उन्हें इंटरनल आईपी पते का इस्तेमाल करना होगा. साथ ही, उन्हें सार्वजनिक इंटरनेट से ट्रैफ़िक भेजने की ज़रूरत नहीं होगी.

ज़्यादा जानकारी और वीडियो

रेफ़रंस दस्तावेज़