1. परिचय
Vertex AI Model Garden से डिप्लॉय किए गए मॉडल के लिए, सुरक्षित और निजी ऐक्सेस सेट अप करने के लिए Private Service Connect का इस्तेमाल करें. इस तरीके से, सार्वजनिक एंडपॉइंट को दिखाने के बजाय, अपने मॉडल को एक निजी Vertex AI एंडपॉइंट पर डिप्लॉय किया जा सकता है. इसे सिर्फ़ आपके वर्चुअल प्राइवेट क्लाउड (वीपीसी) में ऐक्सेस किया जा सकता है.
Private Service Connect, आपके वीपीसी में एक एंडपॉइंट बनाता है. इसमें इंटरनल आईपी पता होता है. यह सीधे तौर पर, Google की मैनेज की गई Vertex AI सेवा से कनेक्ट होता है. यह सेवा आपके मॉडल को होस्ट करती है. इससे आपके वीपीसी और ऑन-प्रिमाइसेस एनवायरमेंट (Cloud VPN या इंटरकनेक्ट के ज़रिए) में मौजूद ऐप्लिकेशन, निजी आईपी का इस्तेमाल करके अनुमान लगाने के अनुरोध भेज सकते हैं. पूरा नेटवर्क ट्रैफ़िक, Google के नेटवर्क पर रहता है. इससे सुरक्षा बढ़ती है, लेटेन्सी कम होती है, और आपके मॉडल के सर्विंग एंडपॉइंट को सार्वजनिक इंटरनेट से पूरी तरह अलग कर दिया जाता है.

आपको क्या बनाना है
इस ट्यूटोरियल में, Model Garden से Gemma 3 को डाउनलोड किया जाएगा. इसे Vertex AI Online Inference में होस्ट किया गया है. यह एक प्राइवेट एंडपॉइंट है, जिसे Private Service Connect के ज़रिए ऐक्सेस किया जा सकता है. एंड-टू-एंड सेटअप में ये शामिल होंगे:
- Model Garden मॉडल: आपको Vertex AI Model Garden से Gemma 3 को चुनना होगा. इसके बाद, इसे Private Service Connect एंडपॉइंट पर डिप्लॉय करना होगा.
- Private Service Connect: आपको अपने वर्चुअल प्राइवेट क्लाउड (वीपीसी) में एक उपभोक्ता एंडपॉइंट कॉन्फ़िगर करना होगा. इसमें आपके नेटवर्क के अंदर का एक इंटरनल आईपी पता होगा.
- Vertex AI से सुरक्षित कनेक्शन: पीएससी एंडपॉइंट, आपके प्राइवेट मॉडल डिप्लॉयमेंट के लिए Vertex AI की ओर से अपने-आप जनरेट होने वाले सर्विस अटैचमेंट को टारगेट करेगा. इससे एक निजी कनेक्शन बनता है. इससे यह पक्का होता है कि आपके वीपीसी और मॉडल सर्विंग एंडपॉइंट के बीच का ट्रैफ़िक, सार्वजनिक इंटरनेट से नहीं गुज़रता.
- आपके वीपीसी में क्लाइंट कॉन्फ़िगरेशन: आपको अपने वीपीसी में एक क्लाइंट (जैसे, Compute Engine वीएम) सेट अप करना होगा.इससे डिप्लॉय किए गए मॉडल को अनुमान लगाने के अनुरोध भेजे जा सकेंगे. इसके लिए, पीएससी एंडपॉइंट के इंटरनल आईपी पते का इस्तेमाल किया जाएगा.
इस प्रोसेस के आखिर तक, आपके पास Model Garden के मॉडल का एक ऐसा उदाहरण होगा जिसे निजी तौर पर उपलब्ध कराया जा रहा है. इसे सिर्फ़ आपके तय किए गए वीपीसी नेटवर्क से ऐक्सेस किया जा सकेगा.
आपको क्या सीखने को मिलेगा
इस ट्यूटोरियल में, आपको Vertex AI Model Garden से मॉडल डिप्लॉय करने का तरीका बताया जाएगा. साथ ही, Private Service Connect (PSC) का इस्तेमाल करके, इसे अपने वर्चुअल प्राइवेट क्लाउड (वीपीसी) से सुरक्षित तरीके से ऐक्सेस करने का तरीका बताया जाएगा. इस तरीके से, आपके वीपीसी (उपयोगकर्ता) में मौजूद ऐप्लिकेशन, सार्वजनिक इंटरनेट का इस्तेमाल किए बिना, Vertex AI मॉडल एंडपॉइंट (प्रोड्यूसर सेवा) से निजी तौर पर कनेक्ट हो सकते हैं.
खास तौर पर, आपको इनके बारे में जानकारी मिलेगी:
- Vertex AI के लिए पीएससी के बारे में जानकारी: पीएससी, उपभोक्ता और सेवा देने वाली कंपनी के बीच निजी और सुरक्षित कनेक्शन कैसे बनाता है. आपका वीपीसी, डिप्लॉय किए गए Model Garden मॉडल को इंटरनल आईपी पतों का इस्तेमाल करके ऐक्सेस कर सकता है.
- निजी ऐक्सेस के साथ मॉडल डिप्लॉय करना: अपने Model Garden मॉडल के लिए Vertex AI एंडपॉइंट को PSC का इस्तेमाल करने के लिए कैसे कॉन्फ़िगर करें, ताकि यह एक निजी एंडपॉइंट बन जाए.
- सर्विस अटैचमेंट की भूमिका: किसी मॉडल को प्राइवेट Vertex AI एंडपॉइंट पर डिप्लॉय करने पर, Google Cloud, Google की ओर से मैनेज किए जाने वाले किरायेदार प्रोजेक्ट में अपने-आप एक सर्विस अटैचमेंट बना देता है. यह सर्विस अटैचमेंट, मॉडल सर्विंग सेवा को उपभोक्ता नेटवर्क के लिए उपलब्ध कराता है.
- अपने वीपीसी में पीएससी एंडपॉइंट बनाने का तरीका:
- डिप्लॉय किए गए Vertex AI एंडपॉइंट की जानकारी से, यूनीक सर्विस अटैचमेंट यूआरआई पाने का तरीका.
- अपने वीपीसी में चुने गए सबनेट में, इंटरनल आईपी पते को रिज़र्व करने का तरीका.
- अपने वीपीसी में फ़ॉरवर्डिंग का ऐसा नियम बनाने का तरीका जो पीएससी एंडपॉइंट के तौर पर काम करता है. यह नियम, Vertex AI सर्विस अटैचमेंट को टारगेट करता है. यह एंडपॉइंट, मॉडल को रिज़र्व किए गए इंटरनल आईपी के ज़रिए ऐक्सेस करने की सुविधा देता है.
- प्राइवेट कनेक्टिविटी सेट अप करना: आपके वीपीसी में मौजूद पीएससी एंडपॉइंट, सर्विस अटैचमेंट से कैसे कनेक्ट होता है. इससे आपका नेटवर्क, Vertex AI सेवा से सुरक्षित तरीके से कनेक्ट हो पाता है.
- निजी तौर पर अनुमान लगाने के अनुरोध भेजना: अपने वीपीसी में मौजूद संसाधनों (जैसे कि Compute Engine वीएम) से, पीएससी एंडपॉइंट के इंटरनल आईपी पते पर अनुमान लगाने के अनुरोध कैसे भेजें.
- पुष्टि करना: यह जांचने और पुष्टि करने के लिए कि निजी कनेक्शन के ज़रिए, अपने वीपीसी से डिप्लॉय किए गए Model Garden मॉडल को अनुमान के अनुरोध भेजे जा सकते हैं, यह तरीका अपनाएं.
इसे पूरा करने के बाद, Model Garden से ऐसे मॉडल होस्ट किए जा सकेंगे जिन्हें सिर्फ़ आपके निजी नेटवर्क इंफ़्रास्ट्रक्चर से ऐक्सेस किया जा सकता है.
आपको किन चीज़ों की ज़रूरत होगी
Google Cloud प्रोजेक्ट
IAM अनुमतियां
- AI Platform एडमिन (roles/ml.Admin)
- Compute Network Admin (roles/compute.networkAdmin)
- कंप्यूट इंस्टेंस एडमिन (roles/compute.instanceAdmin)
- कंप्यूट सिक्योरिटी एडमिन (roles/compute.securityAdmin)
- डीएनएस एडमिन (roles/dns.admin)
- IAP-secured Tunnel User (roles/iap.tunnelResourceAccessor)
- लॉगिंग एडमिन (roles/logging.admin)
- Notebooks एडमिन (roles/notebooks.admin)
- प्रोजेक्ट के लिए IAM एडमिन (roles/resourcemanager.projectIamAdmin)
- सेवा खाते का एडमिन (roles/iam.serviceAccountAdmin)
- Service Usage Admin (roles/serviceusage.serviceUsageAdmin)
2. शुरू करने से पहले
ट्यूटोरियल के साथ काम करने के लिए प्रोजेक्ट को अपडेट करना
इस ट्यूटोरियल में, Cloud Shell में gcloud कॉन्फ़िगरेशन लागू करने में मदद के लिए, $variables का इस्तेमाल किया गया है.
Cloud Shell में, यह तरीका अपनाएं:
gcloud config list project
gcloud config set project [YOUR-PROJECT-ID]
projectid=[YOUR-PROJECT-ID]
echo $projectid
एपीआई चालू करना
Cloud Shell में, यह तरीका अपनाएं:
gcloud services enable "compute.googleapis.com"
gcloud services enable "aiplatform.googleapis.com"
gcloud services enable "serviceusage.googleapis.com"
3. मॉडल डिप्लॉय करना
Model Garden से मॉडल डिप्लॉय करने के लिए, यहां दिया गया तरीका अपनाएं
Google Cloud Console में, Model Garden पर जाएं. इसके बाद, Gemma 3 को खोजें और चुनें

'डप्लॉय करने के विकल्प' पर क्लिक करें और Vertex AI को चुनें

'Vertex AI पर डिप्लॉय करें' पैनल में, 'ऐडवांस' को चुनें. पहले से भरी गई जगह और मशीन की खास जानकारी, उपलब्ध क्षमता के आधार पर चुनी जाती है. इन वैल्यू को बदला जा सकता है. हालांकि, यह कोड लैब us-central1 के लिए बनाया गया है.

'Vertex AI पर डिप्लॉय करें' पैनल में, पक्का करें कि एंडपॉइंट ऐक्सेस को Private Service Connect के तौर पर कॉन्फ़िगर किया गया हो. इसके बाद, अपना प्रोजेक्ट चुनें.

अन्य विकल्पों के लिए, सभी डिफ़ॉल्ट सेटिंग को वैसे ही रहने दें. इसके बाद, सबसे नीचे मौजूद 'लागू करें' को चुनें. साथ ही, लागू करने की स्थिति जानने के लिए सूचनाएं देखें.

Model Garden में, us-central1 क्षेत्र चुनें. यह Gemma 3 मॉडल और एंडपॉइंट उपलब्ध कराता है. मॉडल को डिप्लॉय करने में करीब 5 मिनट लगते हैं.

यह प्रोसेस पूरी होने के बाद, 30 मिनट में एंडपॉइंट का स्टेटस "चालू है" में बदल जाएगा

एंडपॉइंट चुनकर, एंडपॉइंट आईडी पाएं और उसे नोट करें.

Private Service Connect सर्विस अटैचमेंट यूआरआई पाने के लिए, Cloud Shell खोलें और यह तरीका अपनाएं. इस यूआरआई स्ट्रिंग का इस्तेमाल उपभोक्ता तब करता है, जब वह पीएससी उपभोक्ता एंडपॉइंट को डिप्लॉय करता है.
Cloud Shell में, एंडपॉइंट आईडी अपडेट करें. इसके बाद, यह कमांड जारी करें.
gcloud ai endpoints describe [Endpoint ID] --region=us-central1 | grep -i serviceAttachment:
यहां एक उदाहरण दिया गया है:
user@cloudshell:$ gcloud ai endpoints describe 2124795225560842240 --region=us-central1 | grep -i serviceAttachment:
Using endpoint [https://us-central1-aiplatform.googleapis.com/]
serviceAttachment: projects/o9457b320a852208e-tp/regions/us-central1/serviceAttachments/gkedpm-52065579567eaf39bfe24f25f7981d
serviceAttachment के बाद के कॉन्टेंट को "Service_attachment" नाम के वैरिएबल में कॉपी करें. पीएससी कनेक्शन बनाते समय, आपको इसकी ज़रूरत पड़ेगी.
user@cloudshell:$ Service_attachment=projects/o9457b320a852208e-tp/regions/us-central1/serviceAttachments/gkedpm-52065579567eaf39bfe24f25f7981d
4. उपयोगकर्ता का सेटअप
उपभोक्ता वीपीसी बनाएं
Cloud Shell में, यह तरीका अपनाएं:
gcloud compute networks create consumer-vpc --project=$projectid --subnet-mode=custom
उपयोगकर्ता वीएम सबनेट बनाएं
Cloud Shell में, यह तरीका अपनाएं:
gcloud compute networks subnets create consumer-vm-subnet --project=$projectid --range=192.168.1.0/24 --network=consumer-vpc --region=us-central1 --enable-private-ip-google-access
पीएससी एंडपॉइंट सबनेट बनाना
gcloud compute networks subnets create pscendpoint-subnet --project=$projectid --range=10.10.10.0/28 --network=consumer-vpc --region=us-central1
5. IAP की सुविधा चालू करना
आईएपी को अपने वीएम इंस्टेंस से कनेक्ट करने की अनुमति देने के लिए, फ़ायरवॉल का ऐसा नियम बनाएं जो:
- यह उन सभी वीएम इंस्टेंस पर लागू होता है जिन्हें आपको आईएपी का इस्तेमाल करके ऐक्सेस करना है.
- इसकी मदद से, 35.235.240.0/20 आईपी रेंज से इन्ग्रेस ट्रैफ़िक को आने की अनुमति मिलती है. इस रेंज में वे सभी आईपी पते शामिल हैं जिनका इस्तेमाल IAP, टीसीपी फ़ॉरवर्डिंग के लिए करता है.
Cloud Shell में, IAP फ़ायरवॉल नियम बनाएं.
gcloud compute firewall-rules create ssh-iap-consumer \
--network consumer-vpc \
--allow tcp:22 \
--source-ranges=35.235.240.0/20
6. उपयोगकर्ता वीएम इंस्टेंस बनाना
Cloud Shell में, consumer-vm नाम का उपभोक्ता वीएम इंस्टेंस बनाएं.
gcloud compute instances create consumer-vm \
--project=$projectid \
--machine-type=e2-micro \
--image-family debian-11 \
--no-address \
--shielded-secure-boot \
--image-project debian-cloud \
--zone us-central1-a \
--subnet=consumer-vm-subnet
7. Private Service Connect एंडपॉइंट
उपयोगकर्ता, अपने वीपीसी में मौजूद इंटरनल आईपी पते के साथ उपभोक्ता एंडपॉइंट (फ़ॉरवर्डिंग का नियम) बनाता है. यह पीएससी एंडपॉइंट, प्रोड्यूसर के सर्विस अटैचमेंट को टारगेट करता है. उपभोक्ता वीपीसी या हाइब्रिड नेटवर्क में मौजूद क्लाइंट, इस इंटरनल आईपी पते पर ट्रैफ़िक भेज सकते हैं. इससे वे प्रोड्यूसर की सेवा तक पहुँच सकते हैं.
उपभोक्ता एंडपॉइंट के लिए आईपी पता रिज़र्व करें.
Cloud Shell में, फ़ॉरवर्ड करने का नियम बनाएं.
gcloud compute addresses create psc-address \
--project=$projectid \
--region=us-central1 \
--subnet=pscendpoint-subnet \
--addresses=10.10.10.6
पुष्टि करें कि आईपी पता रिज़र्व किया गया है
Cloud Shell में, रिज़र्व किए गए आईपी पते की सूची बनाएं.
gcloud compute addresses list
आपको 10.10.10.6 आईपी पता रिज़र्व किया हुआ दिखेगा.

पिछले चरण में, 'मॉडल डिप्लॉय करें' सेक्शन में कैप्चर किए गए service attachment URI, target-service-attachment को तय करके, उपभोक्ता एंडपॉइंट बनाएं.
Cloud Shell में, नेटवर्क अटैचमेंट के बारे में बताएं.
gcloud compute forwarding-rules create psc-consumer-ep \
--network=consumer-vpc \
--address=psc-address \
--region=us-central1 \
--target-service-attachment=$Service_attachment \
--project=$projectid
पुष्टि करें कि सेवा अटैचमेंट, एंडपॉइंट को स्वीकार करता है
gcloud compute forwarding-rules describe psc-consumer-ep \
--project=$projectid \
--region=us-central1 \
जवाब में, पुष्टि करें कि pscConnectionStatus फ़ील्ड में "ACCEPTED" स्टेटस दिखता हो

8. उपयोगकर्ता की वीएम से टेस्ट करना
Cloud Shell में, Vertex Model Garden API को ऐक्सेस करने के लिए Consumer VM को ऐक्सेस देने के लिए, यह तरीका अपनाएं
उपयोगकर्ता वीएम में एसएसएच करना

ऐप्लिकेशन के डिफ़ॉल्ट क्रेडेंशियल की मदद से फिर से पुष्टि करें और Vertex AI के स्कोप तय करें.
gcloud auth application-default login
--scopes=https://www.googleapis.com/auth/cloud-platform
CURLl कमांड जनरेट करने के लिए, यहां दी गई टेबल का इस्तेमाल करें. साथ ही, इसे अपने माहौल के हिसाब से अडजस्ट करें
एट्रिब्यूट | मान |
प्रोटोकॉल | HTTP |
जगह | us-central1 |
ऑनलाइन अनुमान लगाने वाला एंडपॉइंट | 2133539641536544768 |
प्रोजेक्ट आईडी | test4-473419 |
मॉडल | gemma-3-12b-it |
Private Service Connect एंडपॉइंट का आईपी पता | 10.10.10.6 |
मैसेज | [{"role": "user","content": "एक पाउंड पंख या पत्थर में से किसका वज़न ज़्यादा होता है?"}] |
अपने एनवायरमेंट की जानकारी के आधार पर, curl कमांड को अपडेट करें और उसे लागू करें:
curl -k -v -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" http://[PSC-IP]/v1/projects/[Project-ID]/locations/us-central1/endpoints/[Predictions Endpoint]/chat/completions -d '{"model": "google/gemma-3-12b-it", "messages": [{"role": "user","content": "What weighs more 1 pound of feathers or rocks?"}] }'
उदाहरण:
curl -k -v -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" http://10.10.10.6/v1/projects/test4-473419/locations/us-central1/endpoints/2133539641536544768/chat/completions -d '{"model": "google/gemma-3-12b-it", "messages": [{"role": "user","content": "What weighs more 1 pound of feathers or rocks?"}] }'
फ़ाइनल नतीजा - बधाई हो!!!
आपको नतीजे में, आउटपुट के सबसे नीचे Gemma 3 से मिले अनुमान दिखेंगे. इससे पता चलता है कि आपने पीएससी एंडपॉइंट के ज़रिए, एपीआई एंडपॉइंट को निजी तौर पर ऐक्सेस किया है
Connection #0 to host 10.10.10.6 left intact
{"id":"chatcmpl-9e941821-65b3-44e4-876c-37d81baf62e0","object":"chat.completion","created":1759009221,"model":"google/gemma-3-12b-it","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"This is a classic trick question! They weigh the same. One pound is one pound, regardless of the material. 😊\n\n\n\n","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":106}],"usage":{"prompt_tokens":20,"total_tokens":46,"completion_tokens":26,"prompt_tokens_details":null},"prompt_logprobs":null
9. व्यवस्थित करें
Cloud Shell से, ट्यूटोरियल के कॉम्पोनेंट मिटाएं.
gcloud ai endpoints undeploy-model ENDPOINT_ID --deployed-model-id=DEPLOYED_MODEL_ID --region=us-central1 --quiet
gcloud ai endpoints delete $ENDPOINT_ID --project=$projectid --region=us-central1 --quiet
gcloud ai models delete $MODEL_ID --project=$projectid --region=us-central1 --quiet
gcloud compute instances delete consumer-vm --zone=us-central1-a --quiet
gcloud compute forwarding-rules delete psc-consumer-ep --region=us-central1 --project=$projectid --quiet
gcloud compute addresses delete psc-address --region=us-central1 --project=$projectid --quiet
gcloud compute networks subnets delete pscendpoint-subnet consumer-vm-subnet --region=us-central1 --quiet
gcloud compute firewall-rules delete ssh-iap-consumer --project=$projectid
gcloud compute networks delete consumer-vpc --project=$projectid --quiet
gcloud projects delete $projectid --quiet
10. बधाई हो
बधाई हो! आपने Private Service Connect एंडपॉइंट का इस्तेमाल करके, Vertex AI Prediction पर होस्ट किए गए Gemma 3 API के प्राइवेट ऐक्सेस को कॉन्फ़िगर और पुष्टि कर लिया है.
आपने उपभोक्ता इन्फ़्रास्ट्रक्चर बनाया है. इसमें, इंटरनल आईपी पता रिज़र्व करना और अपने वीपीसी में Private Service Connect एंडपॉइंट (फ़ॉरवर्डिंग का नियम) कॉन्फ़िगर करना शामिल है. यह एंडपॉइंट, Vertex AI सेवा से सुरक्षित तरीके से कनेक्ट होता है. इसके लिए, यह उस सेवा अटैचमेंट को टारगेट करता है जो आपके डिप्लॉय किए गए Gemma 3 मॉडल से जुड़ा है. इस सेटअप की मदद से, वीपीसी या कनेक्ट किए गए नेटवर्क में मौजूद आपके ऐप्लिकेशन, Gemma 3 API के साथ निजी और सुरक्षित तरीके से इंटरैक्ट कर सकते हैं. इसके लिए, उन्हें सार्वजनिक इंटरनेट से ट्रैफ़िक भेजने की ज़रूरत नहीं होती. वे इंटरनल आईपी पते का इस्तेमाल करके ऐसा कर सकते हैं.