1. खास जानकारी
परिचय
Gemini 2.5 Pro, कोडिंग और दुनिया के बारे में जानकारी देने के लिए Google का सबसे बेहतरीन मॉडल है.
Gemini के 2.5 सीरीज़ वाले मॉडल, अब हाइब्रिड रीज़निंग मॉडल हैं! Gemini 2.5 Pro, किसी भी टास्क को पूरा करने से पहले उस पर काफ़ी सोच-विचार कर सकता है. साथ ही, जवाब को ज़्यादा सटीक बनाने के लिए टूल का इस्तेमाल कर सकता है.
Gemini 2.5 Pro:
- यह पिछले मॉडल की तुलना में, कोडिंग, तर्क करने, और मल्टीमॉडल जैसी सुविधाओं के मामले में काफ़ी बेहतर है.
- रीज़निंग के मामले में, यह इंडस्ट्री में सबसे आगे है. साथ ही, मैथ और एसटीईएम के बेंचमार्क में इसकी परफ़ॉर्मेंस बेहतरीन है.
- यह कोडिंग के लिए एक बेहतरीन मॉडल है. साथ ही, वेब डेवलपमेंट के लिए यह खास तौर पर अच्छा है.
- यह खास तौर पर मुश्किल प्रॉम्प्ट के लिए अच्छा है. साथ ही, यह हर तरह के सवालों के जवाब देने में सक्षम है. यह LMSys पर पहले नंबर पर है.
आपको क्या सीखने को मिलेगा
इस ट्यूटोरियल में, Gemini 2.5 Pro मॉडल के साथ Gemini API और Python के लिए Google Gen AI SDK का इस्तेमाल करने का तरीका बताया गया है.
आपको ये काम करने होंगे:
- टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना
- स्ट्रीमिंग टेक्स्ट जनरेट करना
- एक से ज़्यादा बार की जाने वाली चैट शुरू करना
- एसिंक्रोनस तरीकों का इस्तेमाल करना
- मॉडल के पैरामीटर कॉन्फ़िगर करना
- सिस्टम के लिए निर्देश सेट करना
- सुरक्षा फ़िल्टर इस्तेमाल करना
- कंट्रोल के साथ जनरेट करने की सुविधा का इस्तेमाल करना
- टोकन गिनना
- ऑडियो, कोड, दस्तावेज़, इमेज, और वीडियो जैसे मल्टीमॉडल डेटा को प्रोसेस करना
- फ़ंक्शन को अपने-आप और मैन्युअल तरीके से कॉल करने की सुविधा का इस्तेमाल करना
- कोड को चलाना
- सोचने के तरीके के उदाहरण
2. शुरू करने से पहले
ज़रूरी शर्तें
शुरू करने से पहले, आपके पास मान्य बिलिंग खाते वाला Google Cloud प्रोजेक्ट होना चाहिए. कृपया वह Google Cloud प्रोजेक्ट चुनें जिसका आपको इस्तेमाल करना है.
इस कोडलैब को चलाने के लिए, हम Colab Enterprise का इस्तेमाल करेंगे. यह एक ऐसा नोटबुक एनवायरमेंट है जिसमें कई लोग एक साथ काम कर सकते हैं. इसे मैनेज किया जाता है. साथ ही, इसमें Google Cloud की सुरक्षा और अनुपालन से जुड़ी सुविधाएं मिलती हैं.
ज़रूरी एपीआई चालू करें
अपने Google Cloud प्रोजेक्ट में, इस कोडलैब के लिए ज़रूरी एपीआई चालू करने के लिए, यहां दिए गए बटन पर क्लिक करें: Vertex AI, Dataform, और Compute Engine.
Colab नोटबुक को Google Cloud में कॉपी करना
Colab Enterprise में ट्यूटोरियल नोटबुक खोलने के लिए, नीचे दिए गए बटन पर क्लिक करें. इससे आपके मौजूदा Google Cloud प्रोजेक्ट में Colab Notebook की एक कॉपी बन जाएगी. इसके बाद, आपके पास notebook को चलाने का विकल्प होगा.
चलिए, शुरू करते हैं!
3. एनवायरमेंट को शुरू करना
Colab notebook बन जाने के बाद, हम notebook में दिए गए कोड को एक्ज़ीक्यूट कर सकते हैं. शुरुआती कुछ चरणों में, डिपेंडेंसी इंस्टॉल की जाएंगी और ज़रूरी लाइब्रेरी इंपोर्ट की जाएंगी.
'शुरू करना' लेख में दिए गए चरणों को पूरा करें
सबसे पहले, 'शुरू करें' सेक्शन में मौजूद सेल को एक के बाद एक करके चलाएं.

ध्यान दें: किसी सेल को चलाने के लिए, उस कोड सेल पर माउस पॉइंटर घुमाएं जिसे आपको चलाना है. इसके बाद,
सेल चलाएं आइकॉन पर क्लिक करें.

इस सेक्शन के आखिर तक, आपने ये काम कर लिए होंगे.
- Python के लिए Google Gen AI SDK टूल इंस्टॉल करना
- लैब के लिए ज़रूरी लाइब्रेरी इंपोर्ट करना
- Vertex AI का इस्तेमाल करने के लिए, Google Cloud प्रोजेक्ट सेट अप करना
अब Gemini 2.5 Pro का इस्तेमाल करके टेक्स्ट जनरेट करते हैं
4. Gemini की मदद से टेक्स्ट जनरेट करना
Notebook के इस सेक्शन में, टेक्स्ट पूरे करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.
अब नोटबुक में मौजूद सेल के अगले सेट को एक्ज़ीक्यूट करें. इसके लिए, कोड को ध्यान से पढ़ें और Google GenAI SDK टूल को इस्तेमाल करने का तरीका समझें.

इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.
- इस्तेमाल किए जाने वाले मॉडल के बारे में बताने का तरीका.
- स्ट्रीमिंग और नॉन-स्ट्रीमिंग के ज़रिए जनरेट किए गए आउटपुट की तुलना.
- SDK की मल्टी-टर्न चैट की सुविधा का इस्तेमाल करना.
- एसडीके को एसिंक्रोनस तरीके से कॉल करना.
- मॉडल के पैरामीटर कॉन्फ़िगर करना.
- मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, सिस्टम के निर्देश सेट करना.
- कॉन्टेंट को सुरक्षित रखने के लिए फ़िल्टर कॉन्फ़िगर करना.
इसके बाद, हम देखेंगे कि Gemini को टेक्स्ट, इमेज वगैरह को प्रोसेस करने वाले प्रॉम्प्ट कैसे भेजे जाते हैं
5. टेक्स्ट, इमेज वगैरह को प्रोसेस करने वाले मॉडल में प्रॉम्प्ट सबमिट करने की सुविधा
नोटबुक के इस सेक्शन में, इमेज और वीडियो को प्रोसेस करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.
आगे बढ़ें और नोटबुक में मौजूद इन सेल को एक्ज़ीक्यूट करें. 
इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.
- इमेज और टेक्स्ट वाला प्रॉम्प्ट भेजें.
- यूआरएल से वीडियो प्रोसेस करना
इसके बाद, हम अच्छी तरह से परिभाषित और स्ट्रक्चर्ड आउटपुट जनरेट करेंगे
6. स्ट्रक्चर्ड आउटपुट
कोड में मॉडल के जवाब का इस्तेमाल करते समय, यह ज़रूरी है कि हमें मॉडल से लगातार और भरोसेमंद आउटपुट मिले. जवाब जनरेट करने की सुविधा को कंट्रोल करने की मदद से, जवाब का स्कीमा तय किया जा सकता है. इससे मॉडल के आउटपुट का स्ट्रक्चर, फ़ील्ड के नाम, और हर फ़ील्ड के लिए अनुमानित डेटा टाइप तय किया जा सकता है.
आगे बढ़ें और नोटबुक में मौजूद इन सेल को एक्ज़ीक्यूट करें. 
इसके बाद, हम देखेंगे कि मॉडल के आउटपुट को भरोसेमंद सोर्स से कैसे जोड़ा जाता है
7. सतह
अगर आपको मौजूदा नॉलेज बेस का इस्तेमाल करना है या मॉडल को रीयल टाइम में जानकारी देनी है, तो आपको मॉडल के आउटपुट में प्रॉम्प्ट से जुड़ी जानकारी शामिल करने पर ध्यान देना चाहिए.
Gemini और Vertex AI की मदद से, Google Search से मिले नतीजों, फ़ंक्शन के जवाबों, और कोड के आधार पर जवाब तैयार किए जा सकते हैं. कोड को चलाने की सुविधा की मदद से, मॉडल कोड जनरेट कर सकता है और उसे चला सकता है. इससे, मॉडल को नतीजों से सीखने और फ़ाइनल आउटपुट पाने के लिए दोहराने में मदद मिलती है.
आगे बढ़ें और नोटबुक में मौजूद इन सेल को एक्ज़ीक्यूट करें. 
इसके बाद, हम Gemini 2.5 Pro की सोचने-समझने की क्षमताओं के बारे में जानेंगे
8. सूझ-बूझ वाला मॉडल
सोचने का मोड, खास तौर पर उन मुश्किल कामों के लिए फ़ायदेमंद होता है जिनमें कई बार रणनीति बनाने और बार-बार समस्या हल करने की ज़रूरत होती है. Gemini 2.5 मॉडल थिंकिंग मॉडल हैं. इनमें जवाब देने से पहले जानकारी का विश्लेषण करने यानी तर्क करने की क्षमता है. इस वजह से ये मॉडल बेहतर परफ़ॉर्म करते हैं और ज़्यादा सटीक जवाब देते हैं.
आगे बढ़ें और नोटबुक में मौजूद इन सेल को एक्ज़ीक्यूट करें. ऐसा करने पर, मॉडल के असली जवाब देने से पहले, उसके सोचने की प्रोसेस पर ध्यान दें. 
9. नतीजा
बधाई हो! आपने Google Gen AI SDK for Python का इस्तेमाल करके, Gemini 2.5 Pro की सुविधाओं का फ़ायदा उठाने का तरीका सीखा. इसमें टेक्स्ट जनरेट करने, मल्टीमॉडल, ग्राउंडिंग, स्ट्रक्चर्ड आउटपुट, और इसकी ऐडवांस थिंकिंग से जुड़ी सुविधाओं के बारे में बताया गया है. अब आपके पास एसडीके टूल का इस्तेमाल करके, अपने इनोवेटिव ऐप्लिकेशन बनाने के लिए बुनियादी जानकारी है. Gemini 2.5 Pro में थिंकिंग और रीज़निंग मोड की सुविधा है. इससे नई संभावनाएँ खुलती हैं और अलग-अलग इस्तेमाल के उदाहरणों में इनोवेशन को बढ़ावा मिलता है.
अन्य रेफ़रंस
- Google के जनरेटिव एआई एसडीके के रेफ़रंस दस्तावेज़ देखें.
- Google Cloud के जनरेटिव एआई की GitHub रिपॉज़िटरी में मौजूद अन्य नोटबुक एक्सप्लोर करें.
- Model Garden में जाकर, एआई मॉडल एक्सप्लोर करें.