Google Cloud पर Gemini 2.5 Pro के बारे में जानकारी

1. खास जानकारी

परिचय

Gemini 2.5 Pro, कोडिंग और दुनिया के बारे में जानकारी के लिए Google का सबसे बेहतर मॉडल है.

2.5 सीरीज़ के साथ, Gemini मॉडल अब हाइब्रिड रीज़निंग मॉडल हैं! Gemini 2.5 Pro, अलग-अलग टास्क के लिए ज़्यादा सोच-विचार कर सकता है. साथ ही, जवाब को ज़्यादा सटीक बनाने के लिए टूल का इस्तेमाल कर सकता है.

Gemini 2.5 Pro:

  • कोडिंग, तर्क करने, और मल्टीमोडलिटी जैसी सभी क्षमताओं में, पिछले मॉडल की तुलना में काफ़ी सुधार हुआ है.
  • मैथ और एसटीईएम मानदंडों में बेहतरीन परफ़ॉर्मेंस के साथ, रीज़निंग में इंडस्ट्री लीडर.
  • कोड के लिए एक बेहतरीन मॉडल, जिसमें खास तौर पर वेब डेवलपमेंट की सुविधाएं बेहतर हैं.
  • यह खास तौर पर मुश्किल प्रॉम्प्ट के लिए अच्छा है. साथ ही, यह LMSys पर #1 है.

आपको क्या सीखने को मिलेगा

इस ट्यूटोरियल में, आपको Gemini 2.5 Pro मॉडल के साथ, Python के लिए Gemini API और Google Gen AI SDK का इस्तेमाल करने का तरीका पता चलेगा.

आपको ये काम करने होंगे:

  • टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना
    • स्ट्रीमिंग टेक्स्ट जनरेट करना
    • एक से ज़्यादा बार की जाने वाली चैट शुरू करना
    • एसिंक्रोनस तरीकों का इस्तेमाल करना
  • मॉडल के पैरामीटर कॉन्फ़िगर करना
  • सिस्टम से जुड़े निर्देश सेट करना
  • सुरक्षा फ़िल्टर का इस्तेमाल करना
  • कंट्रोल किए गए जनरेशन का इस्तेमाल करना
  • टोकन की गिनती करना
  • ऑडियो, कोड, दस्तावेज़, इमेज, और वीडियो वगैरह का डेटा प्रोसेस करना
  • फ़ंक्शन कॉल करने की सुविधा को अपने-आप और मैन्युअल तरीके से इस्तेमाल करना
  • कोड चलाना
  • सोच-समझकर जवाब देने वाले मॉडल के उदाहरण

2. शुरू करने से पहले

ज़रूरी शर्तें

शुरू करने से पहले, आपके पास मान्य बिलिंग खाते वाला Google Cloud प्रोजेक्ट होना चाहिए. कृपया वह Google Cloud प्रोजेक्ट चुनें जिसका इस्तेमाल करना है.

कोडलैब चलाने के लिए, हम Colab Enterprise का इस्तेमाल करेंगे. यह एक ऐसा नोटबुक प्लैटफ़ॉर्म है जिसे कई लोग मिलकर इस्तेमाल कर सकते हैं और जिसे मैनेज किया जा सकता है. साथ ही, इसमें Google Cloud की सुरक्षा और नियमों का पालन करने से जुड़ी सुविधाएं भी मौजूद हैं.

ज़रूरी एपीआई चालू करना

अपने Google Cloud प्रोजेक्ट में, इस कोडलैब के लिए ज़रूरी एपीआई चालू करने के लिए, यहां दिए गए बटन पर क्लिक करें: Vertex AI, Dataform, और Compute Engine.

Colab नोटबुक को Google Cloud में कॉपी करना

Colab Enterprise में ट्यूटोरियल नोटबुक खोलने के लिए, नीचे दिए गए बटन पर क्लिक करें. इससे आपके मौजूदा Google Cloud प्रोजेक्ट में, Colab notebook की एक कॉपी बन जाएगी. इसके बाद, आपके पास notebook को चलाने का विकल्प होगा.

चलिए, शुरू करते हैं!

3. एनवायरमेंट को शुरू करना

अब हमारे पास Colab notebook बन चुका है. इसलिए, हम notebook में दिए गए कोड को चला सकते हैं. शुरुआती कुछ चरणों में, डिपेंडेंसी इंस्टॉल हो जाएंगी और ज़रूरी लाइब्रेरी इंपोर्ट हो जाएंगी.

'शुरू करना' सेक्शन में दिया गया तरीका अपनाएं

सबसे पहले, 'शुरू करना' सेक्शन में मौजूद सेल को एक-एक करके चलाएं.

शुरू करने के लिए सेक्शन में कोड सेल

ध्यान दें: जिस कोड सेल को चलाना है उस पर माउस पॉइंटर को दबाकर रखें. इसके बाद, सेल चलाने का आइकॉन सेल चलाएं आइकॉन पर क्लिक करें.

सेल को चलाना

इस सेक्शन के आखिर तक, आपने ये काम कर लिए होंगे.

  • Python के लिए Google Gen AI SDK टूल इंस्टॉल करना
  • लैब के लिए ज़रूरी लाइब्रेरी इंपोर्ट करना
  • Vertex AI का इस्तेमाल करने के लिए, Google Cloud प्रोजेक्ट सेट अप करना

अब टेक्स्ट जनरेट करने के लिए, Gemini 2.5 Pro का इस्तेमाल करते हैं

4. Gemini की मदद से टेक्स्ट जनरेट करना

Notebook के इस सेक्शन में, टेक्स्ट पूरा करने की सुविधा जनरेट करने के लिए, Gemini 2.5 Pro का इस्तेमाल किया जाएगा.

अब नोटबुक में सेल के अगले सेट को लागू करें. इसके लिए, कोड को ध्यान से पढ़ें और Google GenAI SDK टूल को इस्तेमाल करने का तरीका जानें.

टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना

इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.

  • इस्तेमाल किए जाने वाले मॉडल की जानकारी देने का तरीका.
  • नॉन-स्ट्रीमिंग बनाम स्ट्रीमिंग आउटपुट जनरेशन.
  • SDK टूल की, एक से ज़्यादा बार चैट करने की सुविधा का इस्तेमाल करना.
  • एसडीके टूल को असिंक्रोनस तरीके से कॉल करना.
  • मॉडल पैरामीटर कॉन्फ़िगर करना.
  • मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, सिस्टम के निर्देश सेट करना.
  • कॉन्टेंट की सुरक्षा से जुड़े फ़िल्टर कॉन्फ़िगर करना.

अगले लेख में, हम Gemini को अलग-अलग तरीकों से प्रॉम्प्ट भेजने का तरीका जानेंगे

5. मल्टीमोडल प्रॉम्प्ट

नोटबुक के इस सेक्शन में, इमेज और वीडियो को प्रोसेस करने के लिए, Gemini 2.5 Pro का इस्तेमाल किया जाएगा.

अब नोटबुक में ये सेल चलाएं. मल्टीमोडल प्रॉम्प्ट के लिए कोड सेल

इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.

  • इमेज और टेक्स्ट वाला प्रॉम्प्ट भेजें.
  • यूआरएल से वीडियो प्रोसेस करना

इसके बाद, हम अच्छी तरह से तय किए गए और स्ट्रक्चर्ड आउटपुट जनरेट करेंगे

6. स्ट्रक्चर्ड आउटपुट

कोड में मॉडल के रिस्पॉन्स का इस्तेमाल करते समय, यह ज़रूरी है कि हमें मॉडल से एक जैसा और भरोसेमंद आउटपुट मिले. कंट्रोल किए गए जनरेशन की मदद से, रिस्पॉन्स स्कीमा तय किया जा सकता है. इससे, मॉडल के आउटपुट के स्ट्रक्चर, फ़ील्ड के नाम, और हर फ़ील्ड के लिए अनुमानित डेटा टाइप की जानकारी मिलती है.

अब नोटबुक में नीचे दी गई सेल को चलाएं. कंट्रोल किए गए आउटपुट के लिए कोड सेल

इसके बाद, हम मॉडल के आउटपुट को ग्राउंड करने का तरीका देखेंगे

7. सतह

अगर आपको मौजूदा नॉलेज बेस का इस्तेमाल करना है या मॉडल को रीयल टाइम में जानकारी देनी है, तो आपको मॉडल के आउटपुट को ग्राउंड करने पर ध्यान देना चाहिए.

Gemini और Vertex AI की मदद से, Google Search में आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. इसके अलावा, फ़ंक्शन के जवाबों के आउटपुट और आखिर में कोड में भी आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. कोड को लागू करने की सुविधा से, मॉडल को कोड जनरेट करने और उसे चलाने में मदद मिलती है. इससे, मॉडल को नतीजों से सीखने और आखिरी आउटपुट पाने के लिए, बार-बार कोशिश करने में मदद मिलती है.

अब नोटबुक में ये सेल चलाएं. ग्राउंडिंग की जांच करने के लिए कोड सेल

अगले लेख में, हम Gemini 2.5 Pro की सोचने की क्षमताओं के बारे में जानेंगे

8. Gemini जवाब ढूँढ रहा है

थिंकिंग मोड, खास तौर पर उन मुश्किल टास्क के लिए मददगार होता है जिनमें रणनीति बनाने और बार-बार समस्या हल करने की ज़रूरत होती है. Gemini 2.5 मॉडल, थिंकिंग मॉडल हैं. इनमें जवाब देने से पहले जानकारी का विश्लेषण करने यानी तर्क करने की क्षमता है. इस वजह से ये मॉडल बेहतर परफ़ॉर्म करते हैं और ज़्यादा सटीक जवाब देते हैं.

अब नोटबुक में ये सेल चलाएं. ऐसा करने पर, मॉडल के असल आउटपुट को दिखाने से पहले, सोचने के तरीके से जुड़ा आउटपुट देखें. थिंकिंग आउटपुट दिखाने के लिए कोड सेल

9. नतीजा

बधाई हो! आपने Python के लिए Google के जनरेटिव एआई SDK का इस्तेमाल करके, Gemini 2.5 Pro की सुविधाओं का फ़ायदा पाने का तरीका जाना है. इसमें टेक्स्ट जनरेशन, अलग-अलग तरह की जानकारी, ग्राउंडिंग, स्ट्रक्चर्ड आउटपुट, और बेहतर तरीके से सोचने की क्षमताओं के बारे में बताया गया है. अब आपके पास एसडीके टूल का इस्तेमाल करके, अपने नए ऐप्लिकेशन बनाने के लिए बुनियादी जानकारी है. Gemini 2.5 Pro, सोचने-समझने और तर्क करने की अपनी बेहतरीन सुविधाओं की मदद से, नई संभावनाओं को खोलता है. साथ ही, इसका इस्तेमाल कई तरह के कामों के लिए किया जा सकता है.

अन्य रेफ़रंस

आपको यह कोडलैब कैसा लगा?

बहुत बढ़िया औसत बेहतर हो सकता है