इस कोडलैब (कोड बनाना सीखने के लिए ट्यूटोरियल) के बारे में जानकारी
1. खास जानकारी
परिचय
Gemini 2.5 Pro, कोडिंग और दुनिया के बारे में जानकारी के लिए Google का सबसे बेहतर मॉडल है.
2.5 सीरीज़ के साथ, Gemini मॉडल अब हाइब्रिड रीज़निंग मॉडल हैं! Gemini 2.5 Pro, अलग-अलग टास्क के लिए ज़्यादा सोच-विचार कर सकता है. साथ ही, जवाब को ज़्यादा सटीक बनाने के लिए टूल का इस्तेमाल कर सकता है.
Gemini 2.5 Pro:
- कोडिंग, तर्क करने, और मल्टीमोडलिटी जैसी सभी क्षमताओं में, पिछले मॉडल की तुलना में काफ़ी सुधार हुआ है.
- गणित और एसटीईएम मानदंडों में बेहतरीन परफ़ॉर्मेंस के साथ, इंडस्ट्री में सबसे आगे.
- कोड के लिए एक बेहतरीन मॉडल, जिसमें खास तौर पर वेब डेवलपमेंट की सुविधाएं बेहतर हैं.
- यह खास तौर पर मुश्किल प्रॉम्प्ट के लिए अच्छा है. साथ ही, यह LMSys पर #1 है.
आपको क्या सीखने को मिलेगा
इस ट्यूटोरियल में, आपको Gemini 2.5 Pro मॉडल के साथ, Python के लिए Gemini API और Google Gen AI SDK का इस्तेमाल करने का तरीका पता चलेगा.
आपको ये काम करने होंगे:
- टेक्स्ट प्रॉम्प्ट से टेक्स्ट जनरेट करना
- स्ट्रीमिंग टेक्स्ट जनरेट करना
- एक से ज़्यादा बार की जाने वाली चैट शुरू करना
- एसिंक्रोनस तरीकों का इस्तेमाल करना
- मॉडल के पैरामीटर कॉन्फ़िगर करना
- सिस्टम से जुड़े निर्देश सेट करना
- सुरक्षा फ़िल्टर का इस्तेमाल करना
- कंट्रोल किए गए जनरेशन का इस्तेमाल करना
- टोकन की गिनती करना
- ऑडियो, कोड, दस्तावेज़, इमेज, और वीडियो वगैरह का डेटा प्रोसेस करना
- फ़ंक्शन कॉल करने की सुविधा को अपने-आप और मैन्युअल तरीके से इस्तेमाल करना
- कोड को चलाना
- थिंकिंग मोड के उदाहरण
2. शुरू करने से पहले
ज़रूरी शर्तें
शुरू करने से पहले, आपके पास मान्य बिलिंग खाते वाला Google Cloud प्रोजेक्ट होना चाहिए. कृपया वह Google Cloud प्रोजेक्ट चुनें जिसका इस्तेमाल करना है.
कोडलैब चलाने के लिए, हम Colab Enterprise का इस्तेमाल करेंगे. यह एक ऐसा नोटबुक प्लैटफ़ॉर्म है जिसे कई लोग मिलकर इस्तेमाल कर सकते हैं और जिसे मैनेज किया जा सकता है. साथ ही, इसमें Google Cloud की सुरक्षा और नियमों का पालन करने से जुड़ी सुविधाएं भी मौजूद हैं.
ज़रूरी एपीआई चालू करना
अपने Google Cloud प्रोजेक्ट में, इस कोडलैब के लिए ज़रूरी एपीआई चालू करने के लिए, यहां दिए गए बटन पर क्लिक करें: Vertex AI, Dataform, और Compute Engine.
Colab नोटबुक को Google Cloud में कॉपी करना
Colab Enterprise में ट्यूटोरियल नोटबुक खोलने के लिए, नीचे दिए गए बटन पर क्लिक करें. इससे आपके मौजूदा Google Cloud प्रोजेक्ट में, Colab notebook की एक कॉपी बन जाएगी. इसके बाद, आपके पास notebook को चलाने का विकल्प होगा.
चलिए, शुरू करते हैं!
3. एनवायरमेंट को शुरू करना
अब हमारे पास Colab notebook बन चुका है. इसलिए, हम notebook में दिए गए कोड को चला सकते हैं. शुरुआती कुछ चरणों में, डिपेंडेंसी इंस्टॉल हो जाएंगी और ज़रूरी लाइब्रेरी इंपोर्ट हो जाएंगी.
'शुरू करना' सेक्शन में दिया गया तरीका अपनाएं
सबसे पहले, 'शुरू करना' सेक्शन में मौजूद सेल को एक-एक करके चलाएं.
ध्यान दें: जिस कोड सेल को चलाना है उस पर माउस पॉइंटर को दबाकर रखें. इसके बाद, सेल चलाएं आइकॉन पर क्लिक करें.
इस सेक्शन के आखिर तक, आपने ये काम कर लिए होंगे.
- Python के लिए Google Gen AI SDK टूल इंस्टॉल करना
- लैब के लिए ज़रूरी लाइब्रेरी इंपोर्ट करना
- Vertex AI का इस्तेमाल करने के लिए, Google Cloud प्रोजेक्ट सेट अप करना
अब टेक्स्ट जनरेट करने के लिए, Gemini 2.5 Pro का इस्तेमाल करते हैं
4. Gemini की मदद से टेक्स्ट जनरेट करना
Notebook के इस सेक्शन में, टेक्स्ट पूरा करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.
अब नोटबुक में सेल के अगले सेट को लागू करें. इसके लिए, कोड को ध्यान से पढ़ें और Google GenAI SDK टूल को इस्तेमाल करने का तरीका जानें.
इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.
- इस्तेमाल किए जाने वाले मॉडल की जानकारी देने का तरीका.
- नॉन-स्ट्रीमिंग बनाम स्ट्रीमिंग आउटपुट जनरेशन.
- SDK टूल की, एक से ज़्यादा बार चैट करने की सुविधा का इस्तेमाल करना.
- एसडीके टूल को असिंक्रोनस तरीके से कॉल करना.
- मॉडल पैरामीटर कॉन्फ़िगर करना.
- मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, सिस्टम के निर्देश सेट करना.
- कॉन्टेंट की सुरक्षा के लिए फ़िल्टर कॉन्फ़िगर करना.
अगले लेख में, हम Gemini को अलग-अलग तरह के प्रॉम्प्ट भेजने का तरीका जानेंगे
5. मल्टीमोडल प्रॉम्प्ट
नोटबुक के इस सेक्शन में, इमेज और वीडियो को प्रोसेस करने के लिए Gemini 2.5 Pro का इस्तेमाल किया जाएगा.
अब नोटबुक में नीचे दी गई सेल को चलाएं.
इस सेक्शन को पूरा करने के बाद, आपको इनके बारे में जानकारी मिल जाएगी.
- इमेज और टेक्स्ट वाला प्रॉम्प्ट भेजें.
- यूआरएल से वीडियो प्रोसेस करना
इसके बाद, हम अच्छी तरह से तय किए गए और स्ट्रक्चर्ड आउटपुट जनरेट करेंगे
6. स्ट्रक्चर्ड आउटपुट
कोड में मॉडल के रिस्पॉन्स का इस्तेमाल करते समय, यह ज़रूरी है कि हमें मॉडल से एक जैसा और भरोसेमंद आउटपुट मिले. कंट्रोल किए गए जनरेशन की मदद से, रिस्पॉन्स स्कीमा तय किया जा सकता है. इससे, मॉडल के आउटपुट के स्ट्रक्चर, फ़ील्ड के नाम, और हर फ़ील्ड के लिए अनुमानित डेटा टाइप की जानकारी मिलती है.
अब नोटबुक में नीचे दी गई सेल को चलाएं.
इसके बाद, हम मॉडल के आउटपुट को ग्राउंड करने का तरीका देखेंगे
7. सतह
अगर आपको मौजूदा नॉलेज बेस का इस्तेमाल करना है या मॉडल को रीयल टाइम में जानकारी देनी है, तो आपको मॉडल के आउटपुट को ग्राउंड करने के बारे में जानना चाहिए.
Gemini और Vertex AI की मदद से, Google Search में आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. इसके अलावा, फ़ंक्शन के जवाबों के आउटपुट और आखिर में कोड में भी आउटपुट को भरोसेमंद स्रोतों से मिलाया जा सकता है. कोड को लागू करने की सुविधा से, मॉडल को कोड जनरेट करने और उसे चलाने में मदद मिलती है. इससे, मॉडल को नतीजों से सीखने और आखिरी आउटपुट पाने के लिए, बार-बार कोशिश करने में मदद मिलती है.
अब नोटबुक में नीचे दी गई सेल को चलाएं.
अगले लेख में, हम Gemini 2.5 Pro की सोचने की क्षमताओं के बारे में जानेंगे
8. Gemini जवाब ढूँढ रहा है
थिंकिंग मोड, खास तौर पर उन मुश्किल टास्क के लिए मददगार होता है जिनमें रणनीति बनाने और बार-बार समस्या हल करने की ज़रूरत होती है. Gemini 2.5 मॉडल, थिंकिंग मॉडल हैं. इनमें जवाब देने से पहले जानकारी का विश्लेषण करने यानी तर्क करने की क्षमता है. इस वजह से ये मॉडल बेहतर परफ़ॉर्म करते हैं और ज़्यादा सटीक जवाब देते हैं.
अब नोटबुक में ये सेल चलाएं. ऐसा करने पर, मॉडल के असल आउटपुट को दिखाने से पहले, सोचने के तरीके से जुड़े आउटपुट पर ध्यान दें.
9. नतीजा
बधाई हो! आपने Python के लिए Google Gen AI SDK का इस्तेमाल करके, Gemini 2.5 Pro की सुविधाओं का फ़ायदा पाने का तरीका जाना है. इसमें टेक्स्ट जनरेशन, मल्टीमोडलिटी, ग्राउंडिंग, स्ट्रक्चर्ड आउटपुट, और बेहतर तरीके से सोचने की क्षमताओं के बारे में बताया गया है. अब आपके पास एसडीके टूल का इस्तेमाल करके, अपने नए ऐप्लिकेशन बनाने के लिए बुनियादी जानकारी है. Gemini 2.5 Pro में थिंकिंग और रीज़निंग मोड की बेहतर सुविधाएं हैं. इनकी मदद से, कई तरह के कामों के लिए नए तरीके आज़माए जा सकते हैं.
अन्य रेफ़रंस
- Google Gen AI SDK के रेफ़रंस दस्तावेज़ देखें.
- Google Cloud के जनरेटिव एआई के GitHub रिपॉज़िटरी में, अन्य नोटबुक एक्सप्लोर करें.
- मॉडल गार्डन में एआई मॉडल एक्सप्लोर करें.