Gemini और Nano Banana की मदद से, विज़ुअल ऑब्जेक्ट का पता लगाना और उनमें बदलाव करना

1. खास जानकारी

इस लैब में, आपको ये टास्क पूरे करने होंगे:

  • 1️⃣ Gemini की मदद से, इमेज में मौजूद विज़ुअल ऑब्जेक्ट का पता लगाना
  • 2️⃣ Nano Banana की मदद से, विज़ुअल ऑब्जेक्ट एक्सट्रैक्ट करना और उन्हें वापस लाना
  • 3️⃣ Nano Banana की मदद से, वापस लाई गई चीज़ों में बदलाव करना और उन्हें बदलना

यहां कुछ उदाहरण दिए गए हैं कि आपको क्या-क्या मिलेगा:

1f2cadc1fd825c64.png

आपको क्या सीखने को मिलेगा

  • Gemini की जगह की जानकारी समझने की क्षमता का इस्तेमाल करके, ऑब्जेक्ट का पता लगाने की सुविधा कैसे इस्तेमाल करें
  • नैचुरल लैंग्वेज प्रॉम्प्ट का इस्तेमाल करके, बाउंडिंग बॉक्स, कैप्शन, और डाइनैमिक लेबल निकालने का तरीका
  • मुड़े-तुड़े या पुराने विज़ुअल ऑब्जेक्ट को वापस लाने, साफ़ करने, और सीधा करने का तरीका
  • इमेज में बदलाव करने के लिए, ज़रूरी और जानकारी देने वाले प्रॉम्प्ट कैसे लिखें
  • विज़ुअल को क्रिएटिव तरीके से रंगने और उन्हें पूरी तरह से नई स्टाइल में बदलने का तरीका
  • विज़ुअल को फ़ोटो-रियलिस्टिक लाइव-ऐक्शन मूवी स्टिल में "सिनेमैटाइज़" करने का तरीका

आपको इन चीज़ों की ज़रूरत होगी

  • नोटबुक में Python चलाने के बारे में जानकारी (Colab या किसी अन्य Jupyter एनवायरमेंट में)
  • बिलिंग की सुविधा वाला Google Cloud प्रोजेक्ट (Vertex AI) या Gemini API पासकोड (Google AI Studio)

ℹ️ लैब को शुरू से आखिर तक चलाने की कुल लागत, दो डॉलर से कम है. इसमें 45 जनरेट की गई 1K इमेज शामिल हैं. हर इमेज में 1,290 टोकन हैं.

ed255bd97afbedca.png fc7e616a26c8fa40.png c0b9ecec49c859f2.png fc7e616a26c8fa40.png 8f240cd033d2cc65.png

आइए शुरू करें...

2. शुरू करने से पहले

Gemini API का इस्तेमाल करने के लिए, आपके पास दो मुख्य विकल्प हैं:

  1. Google Cloud प्रोजेक्ट के साथ Vertex AI के ज़रिए
  2. Gemini API पासकोड के साथ Google AI Studio के ज़रिए

🛠️ पहला विकल्प - Vertex AI के ज़रिए Gemini API

ज़रूरतें:

  • Google Cloud प्रोजेक्ट
  • इस प्रोजेक्ट के लिए, Vertex AI API चालू होना चाहिए

🛠️ दूसरा विकल्प - Google AI Studio के ज़रिए Gemini API

ज़रूरी शर्त:

  • Gemini API पासकोड

Google AI Studio से Gemini API पासकोड पाने के बारे में ज़्यादा जानें.

3. नोटबुक चलाना

नोटबुक खोलने के लिए, अपनी पसंद का टूल चुनें:

🧰 टूल A - Colab में नोटबुक खोलें

🧰 टूल B - Colab Enterprise या Vertex AI Workbench में नोटबुक खोलें

💡 अगर आपने Colab Enterprise या Vertex AI Workbench इंस्टेंस के साथ पहले से ही कोई Google Cloud प्रोजेक्ट कॉन्फ़िगर किया है, तो यह तरीका बेहतर हो सकता है.

🧰 टूल C - GitHub से नोटबुक पाएं और उसे अपने एनवायरमेंट में चलाएं

⚠️ आपको GitHub से नोटबुक डाउनलोड करनी होगी या रिपॉज़िटरी को क्लोन करना होगा. इसके बाद, इसे अपने Jupyter एनवायरमेंट में चलाना होगा.

🗺️ नोटबुक की विषय सूची

आसानी से नेविगेट करने के लिए, विषय सूची को बड़ा करके उसका इस्तेमाल करें. उदाहरण:

de85f5dcc0fe059e.png

🏁 नोटबुक चलाना

अब आप तैयार हैं. अब नोटबुक को फ़ॉलो और चलाया जा सकता है. मज़े करो!...

4. बधाई हो!

e3299284f68f56f4.png

कोडलैब पूरा करने के लिए बधाई!

ज़्यादा जानें