1. खास जानकारी
इस लैब में, आपको एक ही Gemini प्रॉम्प्ट का इस्तेमाल करके, मल्टीमॉडल वीडियो ट्रांसक्रिप्शन की जटिल समस्या को हल करने का तरीका सिखाया जाएगा!
आपको वीडियो का विश्लेषण करना होगा. साथ ही, इन सवालों के जवाब देने होंगे:
- 1️⃣ क्या कहा गया और कब कहा गया?
- 2️⃣ स्पीकर कौन हैं?
- 3️⃣ किसने क्या कहा?
यहां एक उदाहरण दिया गया है कि आपको क्या मिलेगा:
आपको क्या सीखने को मिलेगा
- मल्टीमॉडल से जुड़ी नई या जटिल समस्याओं को हल करने का तरीका
- डेटा को अलग करने और ध्यान बनाए रखने के लिए प्रॉम्प्ट देने की तकनीक: टेबल से जानकारी निकालना
- एक अनुरोध में Gemini के 10 लाख टोकन के कॉन्टेक्स्ट का ज़्यादा से ज़्यादा फ़ायदा पाने की रणनीतियां
- टेक्स्ट, इमेज, और वीडियो वगैरह का इस्तेमाल करके की गई क्वेरी के जवाब में वीडियो के ट्रांसक्रिप्शन के व्यावहारिक उदाहरण
- सलाह और ऑप्टिमाइज़ेशन
आपको इन चीज़ों की ज़रूरत होगी
- नोटबुक में Python चलाने के बारे में जानकारी (Colab या किसी अन्य Jupyter एनवायरमेंट में)
- Google Cloud प्रोजेक्ट (Vertex AI) या Gemini API पासकोड (Google AI Studio)
- 20 से 90 मिनट (यह इस बात पर निर्भर करता है कि आपने सिर्फ़ जल्दी-जल्दी में पढ़ा है या हर चीज़ को पढ़कर टेस्ट किया है)
आइए शुरू करें...
2. शुरू करने से पहले
Gemini API का इस्तेमाल करने के लिए, आपके पास ये दो मुख्य विकल्प हैं:
- Google Cloud प्रोजेक्ट के साथ Vertex AI के ज़रिए
- Gemini API पासकोड के साथ Google AI Studio के ज़रिए
🛠️ पहला विकल्प - Vertex AI के ज़रिए Gemini API
ज़रूरतें:
- Google Cloud प्रोजेक्ट
- इस प्रोजेक्ट के लिए, Vertex AI API चालू होना चाहिए
🛠️ दूसरा विकल्प - Google AI Studio के ज़रिए Gemini API का इस्तेमाल करना
ज़रूरी शर्तें:
- Gemini API पासकोड
Google AI Studio से Gemini API पासकोड पाने के बारे में ज़्यादा जानें.
3. नोटबुक चलाना
नोटबुक खोलने के लिए, अपनी पसंद का टूल चुनें:
🧰 टूल A - Colab में नोटबुक खोलें
🧰 टूल B - Colab Enterprise या Vertex AI Workbench में नोटबुक खोलें
💡 अगर आपने Colab Enterprise या Vertex AI Workbench इंस्टेंस के साथ पहले से ही कोई Google Cloud प्रोजेक्ट कॉन्फ़िगर किया है, तो इस विकल्प को चुना जा सकता है.
🧰 टूल C - GitHub से नोटबुक पाएं और उसे अपने एनवायरमेंट में चलाएं
⚠️ आपको GitHub से नोटबुक डाउनलोड करनी होगी या रिपॉज़िटरी को क्लोन करना होगा. इसके बाद, इसे अपने Jupyter एनवायरमेंट में चलाना होगा.
🗺️ नोटबुक की विषय सूची
आसानी से नेविगेट करने के लिए, विषय सूची को बड़ा करके उसका इस्तेमाल करें. उदाहरण:
🏁 नोटबुक चलाना
अब आप तैयार हैं. अब इस नोटबुक को फ़ॉलो किया जा सकता है और चलाया जा सकता है. मज़े करो!...
4. बधाई हो!
आपने इस मुश्किल समस्या को हल करने के लिए, इन तकनीकों का इस्तेमाल किया:
- Gemini की स्वाभाविक क्षमताओं के बारे में जानकारी पाने के लिए, ओपन प्रॉम्प्ट का इस्तेमाल करके प्रोटोटाइप बनाना
- एलएलएम के काम करने के तरीके को ध्यान में रखते हुए
- टेबल से डेटा निकालने की रणनीति का इस्तेमाल करके, ज़्यादा सटीक प्रॉम्प्ट बनाना
- प्रोडक्शन के लिए तैयार कोड की ओर बढ़ने के लिए, स्ट्रक्चर्ड आउटपुट जनरेट करना
- जवाबों को आसानी से समझने और बेहतर तरीके से दोहराने के लिए, डेटा विज़ुअलाइज़ेशन की सुविधा जोड़ी गई है
- नतीजों को ऑप्टिमाइज़ करने के लिए, डिफ़ॉल्ट पैरामीटर में बदलाव करना
- ज़्यादा टेस्ट करना, दोहराना, और निकाले गए डेटा को बेहतर बनाना
ये सिद्धांत, डेटा निकालने के कई अन्य डोमेन पर लागू होने चाहिए. साथ ही, इनसे आपको अपनी मुश्किल समस्याओं को हल करने में मदद मिलनी चाहिए.
ज़्यादा जानें
- Google Cloud Generative AI रिपॉज़िटरी से, Gemini की अन्य नोटबुक चलाएं
- Vertex AI प्रॉम्प्ट गैलरी में, इस्तेमाल के अन्य उदाहरणों के बारे में जानें
- Vertex AI के रिलीज़ नोट पढ़कर, अपडेट रहें