Google Cloud पर Gemini 2.5 Pro के बारे में जानकारी

Google Cloud पर Gemini 2.5 Pro के बारे में जानकारी

इस कोडलैब (कोड बनाना सीखने के लिए ट्यूटोरियल) के बारे में जानकारी

subjectपिछली बार अप्रैल 23, 2025 को अपडेट किया गया
account_circlePrashanth Subrahmanyam ने लिखा

1. खास जानकारी

परिचय

Gemini 2.5 Pro, कोडिंग और दुनिया के बारे में जानकारी के लिए Google का सबसे बेहतर मॉडल है.

2.5 सीरीज़ के साथ, Gemini मॉडल अब हाइब्रिड रीज़निंग मॉडल हैं! Gemini 2.5 Pro, अलग-अलग टास्क के लिए ज़्यादा सोच-विचार कर सकता है. साथ ही, जवाब को ज़्यादा सटीक बनाने के लिए टूल का इस्तेमाल कर सकता है.

Gemini 2.5 Pro:

  • कोडिंग, तर्क करने, और मल्टीमोडलिटी जैसी सभी क्षमताओं में, पिछले मॉडल की तुलना में काफ़ी सुधार हुआ है.
  • गणित और एसटीईएम मानदंडों में बेहतरीन परफ़ॉर्मेंस के साथ, इंडस्ट्री में सबसे आगे.
  • कोड के लिए एक बेहतरीन मॉडल, जिसमें खास तौर पर वेब डेवलपमेंट की सुविधाएं बेहतर हैं.
  • यह खास तौर पर मुश्किल प्रॉम्प्ट के लिए अच्छा है. साथ ही, यह LMSys पर #1 है.

आपको क्या सीखने को मिलेगा

इस ट्यूटोरियल में, आपको Gemini 2.5 Pro मॉडल के साथ, Python के लिए Gemini API और Google Gen AI SDK का इस्तेमाल करने का तरीका पता चलेगा.

आपको ये काम करने होंगे:

  • टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना
    • स्ट्रीमिंग टेक्स्ट जनरेट करना
    • एक से ज़्यादा बार की जाने वाली चैट शुरू करना
    • एसिंक्रोनस तरीकों का इस्तेमाल करना
  • मॉडल के पैरामीटर कॉन्फ़िगर करना
  • सिस्टम से जुड़े निर्देश सेट करना
  • सुरक्षा फ़िल्टर का इस्तेमाल करना
  • कंट्रोल किए गए जनरेशन का इस्तेमाल करना
  • टोकन की गिनती करना
  • ऑडियो, कोड, दस्तावेज़, इमेज, और वीडियो वगैरह का डेटा प्रोसेस करना
  • फ़ंक्शन कॉल करने की सुविधा को अपने-आप और मैन्युअल तरीके से इस्तेमाल करना
  • कोड को चलाना
  • थिंकिंग मोड के उदाहरण

2. शुरू करने से पहले

ज़रूरी शर्तें

शुरू करने से पहले, आपके पास मान्य बिलिंग खाते वाला Google Cloud प्रोजेक्ट होना चाहिए. कृपया वह Google Cloud प्रोजेक्ट चुनें जिसका इस्तेमाल करना है.

कोडलैब चलाने के लिए, हम Colab Enterprise का इस्तेमाल करेंगे. यह एक ऐसा नोटबुक प्लैटफ़ॉर्म है जिसे कई लोग मिलकर इस्तेमाल कर सकते हैं और जिसे मैनेज किया जा सकता है. साथ ही, इसमें Google Cloud की सुरक्षा और नियमों का पालन करने से जुड़ी सुविधाएं भी मौजूद हैं.

ज़रूरी एपीआई चालू करना

अपने Google Cloud प्रोजेक्ट में, इस कोडलैब के लिए ज़रूरी एपीआई चालू करने के लिए, यहां दिए गए बटन पर क्लिक करें: Vertex AI, Dataform, और Compute Engine.

Colab नोटबुक को Google Cloud में कॉपी करना

Colab Enterprise में ट्यूटोरियल नोटबुक खोलने के लिए, नीचे दिए गए बटन पर क्लिक करें. इससे आपके मौजूदा Google Cloud प्रोजेक्ट में, Colab notebook की एक कॉपी बन जाएगी. इसके बाद, आपके पास notebook को चलाने का विकल्प होगा.

चलिए, शुरू करते हैं!

3. एनवायरमेंट को शुरू करना

अब हमारे पास Colab notebook बन चुका है. इसलिए, हम notebook में दिए गए कोड को चला सकते हैं. शुरुआती कुछ चरणों में, डिपेंडेंसी इंस्टॉल हो जाएंगी और ज़रूरी लाइब्रेरी इंपोर्ट हो जाएंगी.

'शुरू करना' सेक्शन में दिया गया तरीका अपनाएं

सबसे पहले, 'शुरू करना' सेक्शन में मौजूद सेल को एक-एक करके चलाएं.

शुरू करने के लिए सेक्शन में कोड सेल

ध्यान दें: जिस कोड सेल को चलाना है उस पर माउस पॉइंटर को दबाकर रखें. इसके बाद, सेल चलाने का आइकॉन सेल चलाएं आइकॉन पर क्लिक करें.

सेल को चलाना

इस सेक्शन के आखिर तक, आपने ये काम कर लिए होंगे.

  • Python के लिए Google Gen AI SDK टूल इंस्टॉल करना
  • लैब के लिए ज़रूरी लाइब्रेरी इंपोर्ट करना
  • Vertex AI का इस्तेमाल करने के लिए, Google Cloud प्रोजेक्ट सेट अप करना

अब टेक्स्ट जनरेट करने के लिए, Gemini 2.5 Pro का इस्तेमाल करते हैं

4. Gemini की मदद से टेक्स्ट जनरेट करना

Notebook के इस सेक्शन में, टेक्स्ट पूरा करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.

अब नोटबुक में सेल के अगले सेट को लागू करें. इसके लिए, कोड को ध्यान से पढ़ें और Google GenAI SDK टूल को इस्तेमाल करने का तरीका जानें.

टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना

इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.

  • इस्तेमाल किए जाने वाले मॉडल की जानकारी देने का तरीका.
  • नॉन-स्ट्रीमिंग बनाम स्ट्रीमिंग आउटपुट जनरेशन.
  • SDK टूल की, एक से ज़्यादा बार चैट करने की सुविधा का इस्तेमाल करना.
  • एसडीके टूल को असिंक्रोनस तरीके से कॉल करना.
  • मॉडल पैरामीटर कॉन्फ़िगर करना.
  • मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, सिस्टम के निर्देश सेट करना.
  • कॉन्टेंट की सुरक्षा के लिए फ़िल्टर कॉन्फ़िगर करना.

अगले लेख में, हम Gemini को अलग-अलग तरह के प्रॉम्प्ट भेजने का तरीका जानेंगे

5. मल्टीमोडल प्रॉम्प्ट

नोटबुक के इस सेक्शन में, इमेज और वीडियो को प्रोसेस करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.

अब नोटबुक में नीचे दी गई सेल को चलाएं. मल्टीमोडल प्रॉम्प्ट के लिए कोड सेल

इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.

  • इमेज और टेक्स्ट वाला प्रॉम्प्ट भेजें.
  • यूआरएल से वीडियो प्रोसेस करना

इसके बाद, हम अच्छी तरह से तय किए गए और स्ट्रक्चर्ड आउटपुट जनरेट करेंगे

6. स्ट्रक्चर्ड आउटपुट

कोड में मॉडल के रिस्पॉन्स का इस्तेमाल करते समय, यह ज़रूरी है कि हमें मॉडल से एक जैसा और भरोसेमंद आउटपुट मिले. कंट्रोल किए गए जनरेशन की मदद से, रिस्पॉन्स स्कीमा तय किया जा सकता है. इससे, मॉडल के आउटपुट के स्ट्रक्चर, फ़ील्ड के नाम, और हर फ़ील्ड के लिए अनुमानित डेटा टाइप की जानकारी मिलती है.

अब नोटबुक में नीचे दी गई सेल को चलाएं. कंट्रोल किए गए आउटपुट के लिए कोड सेल

इसके बाद, हम मॉडल के आउटपुट को ग्राउंड करने का तरीका देखेंगे

7. सतह

अगर आपको मौजूदा नॉलेज बेस का इस्तेमाल करना है या मॉडल को रीयल टाइम में जानकारी देनी है, तो आपको मॉडल के आउटपुट को ग्राउंड करने के बारे में जानना चाहिए.

Gemini और Vertex AI की मदद से, Google Search में आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. इसके अलावा, फ़ंक्शन के जवाबों के आउटपुट और आखिर में कोड में भी आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. कोड को लागू करने की सुविधा से, मॉडल को कोड जनरेट करने और उसे चलाने में मदद मिलती है. इससे, मॉडल को नतीजों से सीखने और आखिरी आउटपुट पाने के लिए, बार-बार कोशिश करने में मदद मिलती है.

अब नोटबुक में नीचे दी गई सेल को चलाएं. ग्राउंडिंग की जांच करने के लिए कोड सेल

अगले लेख में, हम Gemini 2.5 Pro की सोचने की क्षमताओं के बारे में जानेंगे

8. Gemini जवाब ढूँढ रहा है

थिंकिंग मोड, खास तौर पर उन मुश्किल टास्क के लिए मददगार होता है जिनमें रणनीति बनाने और बार-बार समस्या हल करने की ज़रूरत होती है. Gemini 2.5 मॉडल, थिंकिंग मॉडल हैं. इनमें जवाब देने से पहले जानकारी का विश्लेषण करने यानी तर्क करने की क्षमता है. इस वजह से ये मॉडल बेहतर परफ़ॉर्म करते हैं और ज़्यादा सटीक जवाब देते हैं.

अब नोटबुक में ये सेल चलाएं. ऐसा करने पर, मॉडल के असल आउटपुट को दिखाने से पहले, सोचने के तरीके से जुड़े आउटपुट पर ध्यान दें. थिंकिंग आउटपुट दिखाने के लिए कोड सेल

9. नतीजा

बधाई हो! आपने Python के लिए Google Gen AI SDK का इस्तेमाल करके, Gemini 2.5 Pro की सुविधाओं का फ़ायदा पाने का तरीका जाना है. इसमें टेक्स्ट जनरेशन, मल्टीमोडलिटी, ग्राउंडिंग, स्ट्रक्चर्ड आउटपुट, और बेहतर तरीके से सोचने की क्षमताओं के बारे में बताया गया है. अब आपके पास एसडीके टूल का इस्तेमाल करके, अपने नए ऐप्लिकेशन बनाने के लिए बुनियादी जानकारी है. Gemini 2.5 Pro में थिंकिंग और रीज़निंग मोड की बेहतर सुविधाएं हैं. इनकी मदद से, कई तरह के कामों के लिए नए तरीके आज़माए जा सकते हैं.

अन्य रेफ़रंस

आपको यह कोडलैब कैसा लगा?