Way Back Home - Level 0: Identify Yourself

1. परेशानी का सिग्नल

हेडर

आपका एस्केप पॉड, किसी अनजान दुनिया के वायुमंडल से होकर गुज़रता है. हर पैनल पर चेतावनी वाली लाइटें चमकती हैं. नेविगेशन सिस्टम खराब हो गया है. कम्यूनिकेशन की सुविधाएं कुछ समय के लिए उपलब्ध नहीं हैं. पॉड के आपातकालीन प्रोटोकॉल चालू होने पर, एआई असिस्टेंट की आवाज़ सुनाई देती है:

"सर्वाइवर का पता चला. आपातकालीन लैंडिंग हो गई है. Initiating rescue beacon protocol..."

"चेतावनी: पहचान की पुष्टि करना ज़रूरी है. गैलेक्टिक रेस्क्यू नेटवर्क, बिना रजिस्ट्रेशन वाले एक्सप्लोरर का पता नहीं लगा सकता. कृपया अपने बीकन को चालू करने के लिए, अपनी पहचान की पुष्टि करें."

व्यूपोर्ट के बाहर देखना. एलियन की दुनिया का नज़ारा, जो क्षितिज तक फैला हुआ है. इसमें अजीब तरह की चट्टानें, अनजान पेड़-पौधे, और अजीब रंग का आसमान दिख रहा है. इस ग्रह की सतह पर, आपके मिशन के अन्य सर्वाइवर बिखरे हुए हैं.

लेकिन सबसे पहले: आपका सिस्टम में मौजूद होना ज़रूरी है.

आपको क्या बनाना है

इस लेवल में, आपको एक से ज़्यादा बार इमेज जनरेट करने की सुविधा का इस्तेमाल करके, स्पेस एक्सप्लोरर के तौर पर अपनी पहचान बनानी होगी. इसके लिए, Google के Gemini इमेज जनरेट करने वाले मॉडल (इन्हें Nano Banana 🍌 भी कहा जाता है) का इस्तेमाल करें. आपका अवतार, ग्लोबल रेस्क्यू मैप पर दिखेगा. इसे वर्कशॉप इवेंट में शामिल अन्य लोग भी देख पाएंगे.

वास्तुकला

आपको क्या सीखने को मिलेगा

सिद्धांत	ब्यौरा
कई बार बातचीत करके इमेज जनरेट करना	चैट सेशन का इस्तेमाल करके, जनरेट की गई अलग-अलग इमेज में किसी किरदार का लुक एक जैसा रखने का तरीका
इमेज जनरेट करने के लिए प्रॉम्प्ट इंजीनियरिंग	स्टाइल के हिसाब से और एक जैसे आउटपुट पाने के लिए, खास शर्तों के साथ असरदार प्रॉम्प्ट लिखना
Gemini Image API (Nano Banana)	Python SDK के ज़रिए, Gemini की इमेज जनरेट करने की सुविधाओं का इस्तेमाल करना
चैट सेशन	बातचीत के कॉन्टेक्स्ट का इस्तेमाल करके, जवाब को बार-बार बेहतर बनाना और किरदार की बातों में एकरूपता बनाए रखना

इस लेवल के खत्म होने पर, आपके पास ये होंगे:

✅ टेक्स्ट-टू-इमेज एआई का इस्तेमाल करके, अपने एक्सप्लोरर का पोर्ट्रेट जनरेट किया हो
✅ बातचीत के कई चरणों का इस्तेमाल करके, एक जैसा मैप आइकॉन बनाया हो
✅ रेस्क्यू नेटवर्क में अपनी पहचान रजिस्टर की हो
✅ दुनिया के लाइव मैप पर, अन्य एक्सप्लोरर के साथ आपकी जानकारी दिख रही हो

आइए, हम आपको मैप पर दिखाते हैं! 📍

2. अपना एनवायरमेंट तैयार करना

Cloud Shell ऐक्सेस करना

सबसे पहले, हम Cloud Shell खोलेंगे. यह ब्राउज़र पर आधारित एक टर्मिनल है. इसमें Google Cloud SDK और अन्य ज़रूरी टूल पहले से इंस्टॉल होते हैं.

क्या आपको Google Cloud क्रेडिट चाहिए?

• अगर आपको किसी शिक्षक की निगरानी में होने वाली वर्कशॉप में हिस्सा लेना है: आपका शिक्षक आपको क्रेडिट कोड देगा. कृपया उनके दिए गए लिंक का इस्तेमाल करें.
• अगर आपको यह कोडलैब खुद से पूरा करना है: तो वर्कशॉप की लागत को कवर करने के लिए, Google Cloud का मुफ़्त क्रेडिट रिडीम किया जा सकता है. क्रेडिट पाने के लिए, कृपया इस लिंक पर क्लिक करें. इसके बाद, इसे अपने खाते पर लागू करने के लिए, यहां दी गई वीडियो गाइड में बताया गया तरीका अपनाएं.

Google Cloud Console में सबसे ऊपर मौजूद, Cloud Shell चालू करें पर क्लिक करें. यह सबसे ऊपर दाएं कोने में मौजूद नेविगेशन बार में टर्मिनल आइकॉन होता है.

Cloud Shell

अपना Google Cloud प्रोजेक्ट आईडी ढूंढें:

Google Cloud Console खोलें: https://console.cloud.google.com
पेज पर सबसे ऊपर मौजूद प्रोजेक्ट ड्रॉपडाउन से, वह प्रोजेक्ट चुनें जिसका इस्तेमाल आपको इस वर्कशॉप के लिए करना है.
आपका प्रोजेक्ट आईडी, डैशबोर्ड पर मौजूद प्रोजेक्ट की जानकारी देने वाले कार्ड में दिखता है

Cloud Shell खुलने के बाद, पुष्टि करें कि आपने पुष्टि कर ली है:

# Check that you are logged in
gcloud auth list

आपको अपना खाता (ACTIVE) के तौर पर दिखेगा.

रिपॉज़िटरी का क्लोन बनाना

Way Back Home के डेटा स्टोर करने की जगह को क्लोन करें और प्रोजेक्ट पर जाएं:

git clone https://github.com/google-americas/way-back-home.git
cd way-back-home

डिपेंडेंसी इंस्टॉल करना

लेवल 0 पर जाएं और ज़रूरी Python पैकेज इंस्टॉल करें:

cd level_0
uv sync

मुख्य डिपेंडेंसी ये हैं:

पैकेज	मकसद
`google-genai`	इमेज जनरेट करने के लिए Gemini API क्लाइंट
`requests`	Mission Control को एपीआई कॉल के लिए एचटीटीपी क्लाइंट
`Pillow`	इमेज प्रोसेसिंग और फ़ाइल हैंडलिंग

सेटअप की पुष्टि करना

यह पक्का करने के लिए कि सब कुछ सही तरीके से कॉन्फ़िगर किया गया है, पुष्टि करने की प्रोसेस को तुरंत पूरा करें:

uv run python ../scripts/verify_setup.py

आपको यह दिखना चाहिए:

✓ Authenticated as: your-email@google.com
✓ Python environment ready (uv)
✓ Ready to proceed!

आपने अभी-अभी क्या पूरा किया

✓ Cloud Shell खोला गया हो
✓ Google Cloud से पुष्टि की गई हो
✓ कोडलैब रिपॉज़िटरी क्लोन की गई हो
✓ uv
की मदद से Python की डिपेंडेंसी इंस्टॉल की गई हों
✓ सेटअप की पुष्टि की गई हो

इसके बाद: Mission Control से कनेक्ट करें. सेटअप स्क्रिप्ट, आपके Google Cloud प्रोजेक्ट और एपीआई को अपने-आप कॉन्फ़िगर कर देगी.

3. मिशन कंट्रोल से कनेक्ट करना

सेटअप स्क्रिप्ट चलाना

सेटअप स्क्रिप्ट, आपको Way Back Home रेस्क्यू नेटवर्क से कनेक्ट करती है और आपकी एक्सप्लोरर पहचान को सुरक्षित रखती है. इसे प्रोजेक्ट के रूट से चलाएं:

cd $HOME/way-back-home
chmod +x scripts/setup.sh
./scripts/setup.sh

आपको दो तरह की जानकारी देने के लिए कहा जाएगा.

अपना इवेंट कोड डालें

इवेंट कोड से यह पता चलता है कि आपने किस वर्कशॉप इवेंट में हिस्सा लिया है.

अगर आप किसी वर्कशॉप में हैं: क्यूआर कोड, स्लाइड या वर्कशॉप के इंस्ट्रक्टर से मिला इवेंट कोड डालें.

🚀 Welcome to Way Back Home!

Enter event code (from QR/slide): devfest-nyc-26
Validating event...
✓ Connected to: DevFest NYC 2026

अगर आपको खुद से सीखना है, तो: सार्वजनिक लर्निंग एनवायरमेंट में शामिल होने के लिए, sandbox डालें.

🚀 Welcome to Way Back Home!

Enter event code (from QR/slide): sandbox
Validating event...
✓ Connected to: Way Back Home Sandbox

इवेंट की पुष्टि करने की सुविधा कैसे काम करती है

इवेंट कोड डालने पर, सेटअप स्क्रिप्ट Mission Control API को कॉल करती है. इससे यह पुष्टि की जाती है कि इवेंट मौजूद है या नहीं:

GET https://api.waybackhome.dev/events/devfest-nyc-26

यह एपीआई, चालू वर्कशॉप इवेंट के डेटाबेस की जांच करता है. अगर यह मान्य है, तो यह इवेंट का नाम और कॉन्फ़िगरेशन दिखाता है. इससे यह पक्का होता है कि आप किसी असली और चालू वर्कशॉप सेशन से कनेक्ट हो रहे हैं.

एक्सप्लोरर का नाम चुनना

अपने एक्सप्लोरर के लिए कोई यूनीक नाम चुनें. दुनिया के मैप और लीडरबोर्ड पर आपकी प्रोफ़ाइल ऐसी दिखेगी.

Choose your explorer name: AstroAyo
✓ Username available!

अगर आपके चुने गए नाम का इस्तेमाल, उसी इवेंट में हिस्सा लेने वाला कोई दूसरा व्यक्ति पहले से कर रहा है, तो:

Choose your explorer name: SpaceExplorer
⚠️  That name is taken. Try another.
Choose your explorer name: SpaceExplorer42
✓ Username available!

सेटअप पूर्ण

प्रोसेस पूरी होने के बाद, आपको पुष्टि का यह मैसेज दिखेगा:

Initializing your explorer profile...

✓ Environment configured!
  Explorer ID: a1b2c3d4
  Starting coordinates: (47, 23)

Next: cd level_0 && python customize.py

यह क्या हुआ?

सेटअप स्क्रिप्ट ने Mission Control को कई एपीआई कॉल किए:

आपके इवेंट कोड की पुष्टि हो गई है — पुष्टि की गई है कि वर्कशॉप इवेंट मौजूद है और चालू है
उपयोगकर्ता नाम की उपलब्धता की जांच की गई हो — यह पक्का किया गया हो कि आपके इवेंट में किसी और ने उस नाम पर दावा न किया हो
अपनी पहचान सुरक्षित की — यूनीक आईडी के साथ, हिस्सा लेने वाले व्यक्ति के लिए स्लॉट बनाया गया
शुरुआत के लिए असाइन किए गए निर्देशांक — आपको धरती की सतह पर किसी भी जगह पर रखा गया
सेव किया गया कॉन्फ़िगरेशन — प्रोजेक्ट रूट में मौजूद config.json में सभी जानकारी लिखी गई

लेवल 0 पर जाना

अब लेवल 0 डायरेक्ट्री पर जाएं (आपकी डिपेंडेंसी, मॉड्यूल 2 से पहले ही इंस्टॉल हो चुकी हैं):

cd level_0

अपने कॉन्फ़िगरेशन की जांच करना

देखें कि क्या सेव किया गया है (config.json, प्रोजेक्ट रूट में है):

cat ../config.json

{
    "event_code": "devfest-nyc-26",
    "event_name": "DevFest NYC 2026",
    "username": "AstroAyo",
    "participant_id": "a1b2c3d4",
    "starting_x": 47,
    "starting_y": 23,
    "api_base": "https://api.waybackhome.dev",
    "project_id": "your-project-id"
}

इस कॉन्फ़िगरेशन फ़ाइल का इस्तेमाल, बाद की स्क्रिप्ट करेंगी. इससे, रेस्क्यू नेटवर्क को आपकी पहचान करने में मदद मिलेगी.

आपने अभी-अभी क्या पूरा किया

✓ Mission Control API से कनेक्ट किया गया हो
✓ एक्सप्लोरर के लिए यूनीक नाम रिज़र्व किया गया हो
✓ आपको प्रतिभागी आईडी और शुरुआती कोऑर्डिनेट मिल गए हों
✓ अगले चरणों के लिए कॉन्फ़िगरेशन सेव किया गया हो

अगला चरण: एक्सप्लोरर के लुक को पसंद के मुताबिक बनाएं.

4. एक्सप्लोरर को पसंद के मुताबिक बनाना

कस्टम स्क्रिप्ट चलाना

अपना अवतार जनरेट करने से पहले, आपको एक्सप्लोरर की इमेज के बारे में कुछ विकल्प चुनने होंगे:

uv run python customize.py

अपने सूट का रंग चुनें

एक्सप्लोरर के स्पेस सूट के लिए कोई रंग चुनें:

🎨 Let's create your explorer identity!

Select suit color:
  1. Deep Blue
  2. Crimson Red
  3. Forest Green
  4. Royal Purple
  5. Solar Gold
  6. Silver

Choice [1-6, default=6]: 1
✓ Deep Blue selected

अपने एक्सप्लोरर के बारे में बताएं (ज़रूरी नहीं)

एक्सप्लोरर की बनावट के बारे में कम शब्दों में जानकारी दी जा सकती है. इसके अलावा, रैंडम असाइनमेंट के लिए Enter दबाएं:

Brief description of your explorer (or Enter for random):
Example: 'short dark hair, glasses, friendly smile'
> short dark hair, glasses, determined expression

✓ Preferences saved!

अगर आपने कुछ भी टाइप किए बिना Enter दबाया, तो आपको रैंडम तौर पर कुछ विशेषताएं मिलेंगी:

> 
✓ Random traits: confident expression, short styled hair

अच्छे ब्यौरे लिखने के लिए सलाह

ब्यौरे में, दिखने वाली शारीरिक बनावटों के बारे में बताने पर ध्यान दें:

सही है: "घुंघराले लाल बाल, झाइयां, प्यारी मुस्कान"
अच्छा: "सफ़ेद बालों का जूड़ा, तेज़ आंखें, झुर्रियों वाला चेहरा"
इनसे बचें: लंबी-चौड़ी बैकस्टोरी या ऐसी बातें जो दिखती नहीं हैं

पोर्ट्रेट जनरेट करते समय, एआई आपके ब्यौरे को समझेगा. इसलिए, विज़ुअल की साफ़ तौर पर जानकारी देने से बेहतर नतीजे मिलते हैं.

कॉन्फ़िगरेशन अपडेट किया गया

आपकी प्राथमिकताएं अब सेव हो गई हैं:

✓ Preferences saved!
Next: Open generator.py and follow the codelab instructions

अपडेट किए गए कॉन्फ़िगरेशन की पुष्टि करें:

cat ../config.json

आपको अपनी जोड़ी गई प्राथमिकताएं दिखेंगी:

{
    "event_code": "devfest-nyc-26",
    "event_name": "DevFest NYC 2026",
    "username": "AstroAyo",
    "participant_id": "a1b2c3d4",
    "starting_x": 47,
    "starting_y": 23,
    "api_base": "https://api.waybackhome.dev",
    "project_id": "your-project-id",
    "suit_color": "deep blue with silver accents",
    "appearance": "short dark hair, glasses, determined expression"
}

आपने अभी-अभी क्या पूरा किया

✓ आपने सूट का रंग चुना हो
✓ आपने एक्सप्लोरर की इमेज तय की हो
✓ इमेज जनरेट करने के लिए कॉन्फ़िगरेशन तैयार हो

इसके बाद: मुख्य इवेंट—इमेज जनरेट करने का कोड लिखना!

5. अवतार जनरेट करने की सुविधा बनाना

यह मुख्य लर्निंग मॉड्यूल है. आपको Python कोड लिखना होगा. यह कोड, Gemini की इमेज जनरेट करने की सुविधा (Nano Banana) का इस्तेमाल करके, आपका यूनीक एक्सप्लोरर अवतार जनरेट करेगा.

जनरेटर फ़ाइल खोलें

Cloud Shell Editor में अवतार जनरेट करने वाला टूल खोलें:

cloudshell edit generator.py

इसके अलावा, Cloud Shell में Open Editor पर क्लिक करें और level_0 फ़ोल्डर में generator.py पर जाएं.

फ़ाइल स्ट्रक्चर को समझना

इस फ़ाइल में स्टार्टर कोड और तीन प्लेसहोल्डर सेक्शन होते हैं. इनमें आपको अपना कोड जोड़ना होता है:

"""
Level 0: Avatar Generator

This module generates your unique space explorer avatar using
multi-turn image generation with Gemini (Nano Banana) for
character consistency across portrait and icon.
"""

from google import genai
from google.genai import types
from PIL import Image
import json
import os
import io

# Load configuration from setup (config.json is in project root)
CONFIG_PATH = "../config.json"

with open(CONFIG_PATH) as f:
    config = json.load(f)

USERNAME = config["username"]
SUIT_COLOR = config["suit_color"]
APPEARANCE = config["appearance"]

# Initialize the Gemini client for Vertex AI
client = genai.Client(
    vertexai=True,
    project=os.environ.get("GOOGLE_CLOUD_PROJECT", config.get("project_id")),
    location="us-central1"
)


def generate_explorer_avatar() -> dict:
    """
    Generate portrait and icon using multi-turn chat for consistency.
    
    The key technique here is using a CHAT SESSION rather than independent
    API calls. This allows Gemini to "remember" the character it created
    in the first turn, ensuring the icon matches the portrait.
    
    Returns:
        dict with portrait_path and icon_path
    """
    
    # MODULE_5_STEP_1_CREATE_CHAT_SESSION
    # TODO: Create a chat session for multi-turn generation
    chat = None  # Replace this line
    
    # MODULE_5_STEP_2_GENERATE_PORTRAIT
    # TODO: Generate the explorer portrait
    portrait_image = None  # Replace this section
    
    # MODULE_5_STEP_3_GENERATE_ICON
    # TODO: Generate a consistent map icon
    icon_image = None  # Replace this section
    
    return {
        "portrait_path": "outputs/portrait.png",
        "icon_path": "outputs/icon.png"
    }


if __name__ == "__main__":
    # Create outputs directory if it doesn't exist
    os.makedirs("outputs", exist_ok=True)
    
    print(f"Generating avatar for {USERNAME}...")
    result = generate_explorer_avatar()
    print(f"✅ Avatar created!")
    print(f"   Portrait: {result['portrait_path']}")
    print(f"   Icon: {result['icon_path']}")

आपको तीन TODO सेक्शन को अपने लागू किए गए कोड से बदलना होगा.

मुख्य सिद्धांत: किरदार की बातों में एकरूपता बनाए रखने के लिए, कई बार बातचीत करना

एक से ज़्यादा इमेज में एक जैसे किरदार जनरेट करने के लिए, चैट सेशन का इस्तेमाल करें. चैट में इमेज जनरेट करने पर, Gemini को यह याद रहता है कि उसने कौनसी इमेज जनरेट की थी. एक ही चैट में बाद के मैसेज में "इस किरदार" या "उसी व्यक्ति" का रेफ़रंस दिया जा सकता है. Gemini, विज़ुअल में एकरूपता बनाए रखेगा.

यह अलग-अलग, स्वतंत्र एपीआई कॉल करने से बुनियादी तौर पर अलग है. ऐसा इसलिए, क्योंकि उनमें हर बार अलग-अलग दिखने वाले वर्ण जनरेट होते हैं. इसकी वजह यह है कि उनमें कोई भी कॉन्टेक्स्ट शेयर नहीं किया जाता.

Independent calls:           Chat session:
┌─────────┐                  ┌─────────┐
│ Call 1  │ → Person A       │ Turn 1  │ → Person A
└─────────┘                  │         │
┌─────────┐                  │ Turn 2  │ → Person A (same!)
│ Call 2  │ → Person B       │         │
└─────────┘   (different!)   └─────────┘

पहला चरण: चैट सेशन बनाना

MODULE_5_STEP_1_CREATE_CHAT_SESSION प्लेसहोल्डर ढूंढें और chat = None # Replace this line लाइन को इससे बदलें:

    # MODULE_5_STEP_1_CREATE_CHAT_SESSION
    # Create a chat session to maintain character consistency across generations.
    # The chat session preserves context between turns, so Gemini "remembers"
    # what it generated and can create consistent variations.
    chat = client.chats.create(
        model="gemini-2.5-flash-image",  # Nano Banana - Gemini with image generation
        config=types.GenerateContentConfig(
            response_modalities=["TEXT", "IMAGE"]
        )
    )

कोड को समझना

client.chats.create() — इससे एक नया बातचीत सेशन शुरू होता है. इसमें कई बार बातचीत करने पर भी कॉन्टेक्स्ट बना रहता है
model="gemini-2.5-flash-image" — इसमें Gemini 2.5 Flash मॉडल का इस्तेमाल किया जाता है. साथ ही, इसमें इमेज जनरेट करने की सुविधा (Nano Banana) भी होती है
response_modalities=["TEXT", "IMAGE"] — इससे Gemini को पता चलता है कि हमें जवाबों में टेक्स्ट के साथ-साथ जनरेट की गई इमेज भी चाहिए. इमेज जनरेट करने के लिए, यह ज़रूरी है.

दूसरा चरण: पोर्ट्रेट जनरेट करना

MODULE_5_STEP_2_GENERATE_PORTRAIT ढूंढें और portrait_image = None # Replace this section को इस कोड से बदलें:

    # MODULE_5_STEP_2_GENERATE_PORTRAIT
    # First turn: Generate the explorer portrait.
    # This establishes the character that will be referenced in subsequent turns.
    portrait_prompt = f"""Create a stylized space explorer portrait.

Character appearance: {APPEARANCE}
Name on suit patch: "{USERNAME}"
Suit color: {SUIT_COLOR}

CRITICAL STYLE REQUIREMENTS:
- Digital illustration style, clean lines, vibrant saturated colors
- Futuristic but weathered space suit with visible mission patches
- Background: Pure solid white (#FFFFFF) - absolutely no gradients, patterns, or elements
- Frame: Head and shoulders only, 3/4 view facing slightly left
- Lighting: Soft diffused studio lighting, no harsh shadows
- Expression: Determined but approachable
- Art style: Modern animated movie character portrait (similar to Pixar or Dreamworks style)

The white background is essential - the avatar will be composited onto a map."""

    print("🎨 Generating your portrait...")
    portrait_response = chat.send_message(portrait_prompt)
    
    # Extract the image from the response.
    # Gemini returns a response with multiple "parts" - we need to find the image part.
    portrait_image = None
    for part in portrait_response.candidates[0].content.parts:
        if part.inline_data is not None:
            # Found the image! Convert from bytes to PIL Image and save.
            image_bytes = part.inline_data.data
            portrait_image = Image.open(io.BytesIO(image_bytes))
            portrait_image.save("outputs/portrait.png")
            break
    
    if portrait_image is None:
        raise Exception("Failed to generate portrait - no image in response")
    
    print("✓ Portrait generated!")

प्रॉम्प्ट इंजीनियरिंग से जुड़ी सलाह

ध्यान दें कि प्रॉम्प्ट को किस तरह से तैयार किया गया है:

विषय की परिभाषा — "स्टाइलिश स्पेस एक्सप्लोरर पोर्ट्रेट बनाओ" से Gemini को यह पता चलता है कि हमें क्या चाहिए
वैरिएबल इंजेक्शन — हम उपयोगकर्ता की पसंद ({APPEARANCE}, {USERNAME}, {SUIT_COLOR}) को शामिल करते हैं
स्टाइल से जुड़ी ज़रूरी शर्तें — आर्टिस्टिक डायरेक्शन ("डिजिटल इलस्ट्रेशन", "Pixar या Dreamworks की स्टाइल")
तकनीकी पाबंदियां — सफ़ेद बैकग्राउंड, खास फ़्रेमिंग, रोशनी

Way Back Home के लिए, पूरी तरह से सफ़ेद बैकग्राउंड की शर्त ज़रूरी है. इससे अवतारों को मैप पर साफ़ तौर पर कंपोज़ किया जा सकता है. साथ ही, रंग के टकराव या फ़्रिंजिंग आर्टफ़ैक्ट से बचा जा सकता है.

जवाब को पार्स करने की प्रोसेस को समझना

Gemini के जवाब में कई "हिस्से" होते हैं:

टेक्स्ट वाले हिस्से — मॉडल की टिप्पणी या जवाब
इमेज के हिस्से — जनरेट की गई इमेज, बाइनरी डेटा (inline_data) के तौर पर

हम इमेज के हिस्सों को तब तक दोहराते हैं, जब तक हमें inline_data नहीं मिल जाता. इसमें इमेज के रॉ बाइट होते हैं. इसके बाद, हम इन बाइट को सेव करने के लिए, PIL इमेज में बदलते हैं.

तीसरा चरण: मैप आइकॉन जनरेट करना

MODULE_5_STEP_3_GENERATE_ICON को ढूंढें और icon_image = None # Replace this section को इससे बदलें:

    # MODULE_5_STEP_3_GENERATE_ICON
    # Second turn: Generate a consistent icon for the map.
    # Because we're in the same chat session, Gemini remembers the character
    # from the portrait and will maintain visual consistency.
    icon_prompt = """Now create a circular map icon of this SAME character.

CRITICAL REQUIREMENTS:
- SAME person, SAME face, SAME expression, SAME suit — maintain perfect consistency with the portrait
- Tighter crop: just the head and very top of shoulders
- Background: Pure solid white (#FFFFFF)
- Optimized for small display sizes (will be used as a 64px map marker)
- Keep the exact same art style, colors, and lighting as the portrait
- Square 1:1 aspect ratio

This icon must be immediately recognizable as the same character from the portrait."""

    print("🖼️  Creating map icon...")
    icon_response = chat.send_message(icon_prompt)
    
    # Extract the icon image from the response
    icon_image = None
    for part in icon_response.candidates[0].content.parts:
        if part.inline_data is not None:
            image_bytes = part.inline_data.data
            icon_image = Image.open(io.BytesIO(image_bytes))
            icon_image.save("outputs/icon.png")
            break
    
    if icon_image is None:
        raise Exception("Failed to generate icon - no image in response")
    
    print("✓ Icon generated!")

मुख्य सिद्धांत: कॉन्टेक्स्ट के हिसाब से एक जैसा कॉन्टेंट

ध्यान दें कि आइकॉन के लिए दिए गए प्रॉम्प्ट में "यह वही किरदार है" लिखा है. साथ ही, इसमें "वही व्यक्ति, वही चेहरा, वही हाव-भाव, वही सूट" पर ज़ोर दिया गया है.

हम एक ही चैट सेशन में हैं. इसलिए, Gemini को पता है कि हम किस किरदार के बारे में बात कर रहे हैं. यह वही किरदार है जिसे उसने पिछले टर्न में बनाया था. मॉडल इस कॉन्टेक्स्ट को अपने-आप बनाए रखता है.

अगर हमने नया चैट सेशन शुरू किया होता या अलग से एपीआई कॉल किया होता, तो Gemini एक बिलकुल अलग दिखने वाला व्यक्ति जनरेट करता. ऐसा इसलिए होता, क्योंकि उसके पास पिछली जनरेशन की कोई जानकारी नहीं होती.

आपका लिखा गया कोड

तीनों सेक्शन जोड़ने के बाद, आपका generate_explorer_avatar() फ़ंक्शन कुछ ऐसा दिखेगा:

def generate_explorer_avatar() -> dict:
    """
    Generate portrait and icon using multi-turn chat for consistency.
    
    The key technique here is using a CHAT SESSION rather than independent
    API calls. This allows Gemini to "remember" the character it created
    in the first turn, ensuring the icon matches the portrait.
    
    Returns:
        dict with portrait_path and icon_path
    """
    
    # MODULE_5_STEP_1_CREATE_CHAT_SESSION
    # Create a chat session to maintain character consistency across generations.
    # The chat session preserves context between turns, so Gemini "remembers"
    # what it generated and can create consistent variations.
    chat = client.chats.create(
        model="gemini-2.5-flash-image",  # Nano Banana - Gemini with image generation
        config=types.GenerateContentConfig(
            response_modalities=["TEXT", "IMAGE"]
        )
    )
    
    # MODULE_5_STEP_2_GENERATE_PORTRAIT
    # First turn: Generate the explorer portrait.
    # This establishes the character that will be referenced in subsequent turns.
    portrait_prompt = f"""Create a stylized space explorer portrait.

Character appearance: {APPEARANCE}
Name on suit patch: "{USERNAME}"
Suit color: {SUIT_COLOR}

CRITICAL STYLE REQUIREMENTS:
- Digital illustration style, clean lines, vibrant saturated colors
- Futuristic but weathered space suit with visible mission patches
- Background: Pure solid white (#FFFFFF) - absolutely no gradients, patterns, or elements
- Frame: Head and shoulders only, 3/4 view facing slightly left
- Lighting: Soft diffused studio lighting, no harsh shadows
- Expression: Determined but approachable
- Art style: Modern animated movie character portrait (similar to Pixar or Dreamworks style)

The white background is essential - the avatar will be composited onto a map."""

    print("🎨 Generating your portrait...")
    portrait_response = chat.send_message(portrait_prompt)
    
    # Extract the image from the response.
    # Gemini returns a response with multiple "parts" - we need to find the image part.
    portrait_image = None
    for part in portrait_response.candidates[0].content.parts:
        if part.inline_data is not None:
            # Found the image! Convert from bytes to PIL Image and save.
            image_bytes = part.inline_data.data
            portrait_image = Image.open(io.BytesIO(image_bytes))
            portrait_image.save("outputs/portrait.png")
            break
    
    if portrait_image is None:
        raise Exception("Failed to generate portrait - no image in response")
    
    print("✓ Portrait generated!")
    
    # MODULE_5_STEP_3_GENERATE_ICON
    # Second turn: Generate a consistent icon for the map.
    # Because we're in the same chat session, Gemini remembers the character
    # from the portrait and will maintain visual consistency.
    icon_prompt = """Now create a circular map icon of this SAME character.

CRITICAL REQUIREMENTS:
- SAME person, SAME face, SAME expression, SAME suit — maintain perfect consistency with the portrait
- Tighter crop: just the head and very top of shoulders
- Background: Pure solid white (#FFFFFF)
- Optimized for small display sizes (will be used as a 64px map marker)
- Keep the exact same art style, colors, and lighting as the portrait
- Square 1:1 aspect ratio

This icon must be immediately recognizable as the same character from the portrait."""

    print("🖼️  Creating map icon...")
    icon_response = chat.send_message(icon_prompt)
    
    # Extract the icon image from the response
    icon_image = None
    for part in icon_response.candidates[0].content.parts:
        if part.inline_data is not None:
            image_bytes = part.inline_data.data
            icon_image = Image.open(io.BytesIO(image_bytes))
            icon_image.save("outputs/icon.png")
            break
    
    if icon_image is None:
        raise Exception("Failed to generate icon - no image in response")
    
    print("✓ Icon generated!")
    
    return {
        "portrait_path": "outputs/portrait.png",
        "icon_path": "outputs/icon.png"
    }

अपनी फ़ाइल सेव करना

generator.py को सेव करना न भूलें:

Cloud Shell Editor: Ctrl+S (Windows/Linux) या Cmd+S (Mac)
vim: Escape दबाएं. इसके बाद, :wq और Enter टाइप करें

आपने अभी-अभी क्या बनाया

✓ एक से ज़्यादा बार इमेज जनरेट करने के लिए चैट सेशन बनाया गया
✓ स्टाइल से जुड़ी पाबंदियों के साथ पोर्ट्रेट जनरेट करने के लिए, पूरी जानकारी वाला प्रॉम्प्ट तैयार किया गया
✓ बातचीत के संदर्भ का इस्तेमाल करके, मैप का एक जैसा आइकॉन जनरेट किया गया
✓ Gemini से मिले जवाबों से इमेज डेटा को पार्स करने का तरीका सीखा गया

मास्टर किए गए मुख्य सिद्धांत:

सिद्धांत	आपने क्या सीखा
चैट सेशन	`client.chats.create()` कई बार बातचीत होने पर भी संदर्भ को बनाए रखता है
जवाब देने के तरीके	`["TEXT", "IMAGE"]` से, जवाबों में इमेज जनरेट करने की सुविधा चालू होती है
प्रॉम्प्ट का स्ट्रक्चर	विषय → वैरिएबल → स्टाइल → तकनीकी सीमाएं
कैरेक्टर की स्टाइल एक जैसी रखना	एक ही चैट सेशन = सभी इमेज में एक ही वर्ण
जवाब को पार्स करना	जवाब के हिस्सों में, `inline_data` से इमेज निकालना

अगला चरण: अपना कोड चलाएं और मैप पर अपनी जगह देखें!

6. जनरेट करें और रजिस्टर करें

प्रोजेक्ट आईडी सेट करना

पक्का करें कि आपका प्रोजेक्ट आईडी, एनवायरमेंट वैरिएबल के तौर पर उपलब्ध हो:

export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)

Identity Creator को चलाएं

अब मुख्य स्क्रिप्ट चलाएं. यह स्क्रिप्ट, जनरेट करने, अपलोड करने, और रजिस्टर करने की प्रोसेस को मैनेज करती है:

uv run python create_identity.py

आपको जनरेट होने की प्रोसेस रीयल टाइम में दिखेगी:

ध्यान दें: लाइव मैप पर आपका अवतार दिखने में पांच सेकंड लग सकते हैं. इसलिए, अगर आपको मैप पर तुरंत अपना अवतार नहीं दिखता है, तो पेज को रीफ़्रेश करें.

🚀 Creating identity for AstroAyo...

🎨 Generating your portrait...
✓ Portrait generated!
🖼️  Creating map icon...
✓ Icon generated!

☁️  Uploading to mission database...
✓ Avatar uploaded!

📍 Registering with rescue network...
✓ Registration complete!

╔═══════════════════════════════════════════════════════════════╗
║                    ✅ IDENTITY CONFIRMED!                      ║
╠═══════════════════════════════════════════════════════════════╣
║                                                               ║
║  Explorer: AstroAyo                                           ║
║  Location: (47, 23) — unconfirmed                             ║
║                                                               ║
║  🗺️  You're now on the map!                                   ║
║  https://waybackhome.dev/e/devfest-nyc-26                     ║
║                                                               ║
║  NEXT: Proceed to Level 1 to pinpoint your exact location!   ║
║                                                               ║
╚═══════════════════════════════════════════════════════════════╝

यह क्या हुआ?

आपको दी गई create_identity.py स्क्रिप्ट ने कई चरणों को पूरा किया:

आपके कोड को कॉल किया गया — generator.py से generate_explorer_avatar() को लागू किया गया
अपलोड की गई इमेज — Mission Control API को आपका पोर्ट्रेट और आइकॉन भेजा गया
अपनी पहचान रजिस्टर की — अवतार के यूआरएल के साथ, प्रतिभागी का रिकॉर्ड अपडेट किया गया
पुष्टि हो गई है — आपका अवतार अब दुनिया के मैप पर लाइव है!

आपने इमेज जनरेट करने का लॉजिक लिखा है. स्क्रिप्ट ने आपकी ओर से नेटवर्किंग और रजिस्ट्रेशन को मैनेज किया.

जनरेट किया गया अवतार देखना

जनरेट की गई इमेज को स्थानीय तौर पर देखें:

# List the generated files
ls -la outputs/

# Download to view on your local machine
cloudshell download outputs/portrait.png
cloudshell download outputs/icon.png

इसके अलावा, outputs/ फ़ोल्डर पर जाकर और इमेज फ़ाइलों पर क्लिक करके, उन्हें सीधे Cloud Shell Editor में देखा जा सकता है.

जनरेट किया गया पोर्ट्रेट और आइकॉन, इन इमेज की तरह दिखेगा:

पोर्ट्रेट का उदाहरण

मैप पर अपनी जगह की जानकारी देखना!

अपने आउटपुट में दिखाया गया दुनिया का मैप यूआरएल खोलें:

https://waybackhome.dev/e/{your-event-code}

उदाहरण के लिए: https://waybackhome.dev/e/devfest-nyc-26

मैप पर अपना अवतार ढूंढें! आपको ये चीज़ें दिखेंगी:

आइकॉन, जो ग्रह की सतह पर आपकी जगह दिखाता है
आपके आइकॉन के नीचे लेबल के तौर पर आपका एक्सप्लोरर नेम
आपके मार्कर के आस-पास धीरे-धीरे पल्स करने वाला हल्का बीकन

ज़्यादा जानकारी वाले कार्ड में अपनी पूरी इमेज देखने के लिए, अपने मार्कर पर क्लिक करें.

बीकन की रोशनी कम क्यों है?

फ़िलहाल, आपकी जगह की जानकारी की पुष्टि नहीं हुई है. आप निर्देशांक (47, 23) के आस-पास कहीं हैं. हालांकि, बचाव दल को आपकी exact जगह की जानकारी अभी तक नहीं मिली है. तुम्हारी क्रैश लैंडिंग हुई थी, याद है?

लेवल 1: अपनी जगह की सटीक जानकारी का पता लगाना में, आपको मल्टी-एजेंट सिस्टम का इस्तेमाल करके अपने आस-पास की जगह का विश्लेषण करना होगा, ताकि अपने सटीक कोऑर्डिनेट की पुष्टि की जा सके. पुष्टि होने के बाद, आपका बीकन तेज़ी से चमकने लगेगा, ताकि बचाव दल आपको ढूंढ सकें!

क्या आपको अपना अवतार पसंद नहीं है? फिर से जनरेट करो!

अगर आपको कोई दूसरा अवतार चाहिए, तो उसे फिर से जनरेट किया जा सकता है:

# Option 1: Change your appearance settings first
uv run python customize.py

# Option 2: Just regenerate with current settings
uv run python create_identity.py

create_identity.py का इस्तेमाल करने पर, हर बार एक पूरी तरह से नया अवतार जनरेट होता है. (नया चैट सेशन = नया किरदार). साथ ही, यह आपके रजिस्ट्रेशन को अपडेट करता है. जब तक आपको मनमुताबिक नतीजे न मिल जाएं, तब तक बेझिझक बदलाव करें!

हर बार अलग-अलग वर्ण क्यों बनते हैं

create_identity.py को फिर से चलाने पर, नया चैट सेशन शुरू हो जाता है. कोई पिछला कॉन्टेक्स्ट न होने की वजह से, Gemini एक नया किरदार जनरेट करता है.

यह सुविधा यहां काम की है. इससे आपको पहला नतीजा पसंद न आने पर, उसे फिर से जनरेट करने का विकल्प मिलता है. मल्टी-टर्न चैट वाली कंसिस्टेंसी तकनीक यह पक्का करती है कि एक ही रन में पोर्ट्रेट और आइकॉन मैच करें. हालांकि, हर रन में एक यूनीक कैरेक्टर जनरेट होता है.

समस्या का हल

आम समस्याएं

"पोर्ट्रेट जनरेट नहीं हो सका - जवाब में कोई इमेज नहीं है"

ऐसा हो सकता है कि मॉडल ने कॉन्टेंट से जुड़ी नीतियों का उल्लंघन होने की वजह से, इमेज जनरेट करने से मना कर दिया हो. फिर से चलाने की कोशिश करें.
देख लें कि आपकी इमेज के ब्यौरे में प्रतिबंधित कॉन्टेंट शामिल न हो.
पक्का करें कि इमेज जनरेट करने की सुविधा (gemini-2.5-flash-image) देने वाले मॉडल का इस्तेमाल किया जा रहा हो.

"ModuleNotFoundError: No module named ‘google.genai'"

यह पक्का करने के लिए कि डिपेंडेंसी इंस्टॉल हो गई हैं, level_0 डायरेक्ट्री से uv sync को फिर से चलाएं
सही एनवायरमेंट में अपने-आप चलने के लिए, uv run python generator.py का इस्तेमाल करें

"अनुमति नहीं है" या पुष्टि करने से जुड़ी गड़बड़ियां

पक्का करें कि आपका प्रोजेक्ट सेट हो: export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)
देखें कि Vertex AI API चालू हो: gcloud services enable aiplatform.googleapis.com

"अपलोड नहीं हो सका" या एपीआई से जुड़ी गड़बड़ियां

Cloud Shell में अपने इंटरनेट कनेक्शन की जांच करें.
पुष्टि करें कि इवेंट अब भी चालू है. इवेंट, वर्कशॉप खत्म होने के बाद काम नहीं करते.
अगर आपको यह नहीं पता कि Mission Control API काम कर रहा है या नहीं, तो अपने वर्कशॉप इंस्ट्रक्टर से पूछें.

मैप पर अवतार नहीं दिख रहा है

इसे 5 से 10 सेकंड तक देखें. मैप, अपडेट के लिए समय-समय पर पोल करता है.
पेज को हार्ड रीफ़्रेश करें (Ctrl+Shift+R या Cmd+Shift+R).
अपने टर्मिनल आउटपुट में यह पुष्टि करें कि रजिस्ट्रेशन बिना किसी गड़बड़ी के पूरा हो गया है.

आपने अभी-अभी क्या पूरा किया

✓ आपने एक्सप्लोरर का अपना यूनीक पोर्ट्रेट जनरेट किया हो
✓ आपने मैप का एक जैसा आइकॉन बनाया हो
✓ आपने मिशन कंट्रोल में ऐसेट अपलोड की हों
✓ आपने रेस्क्यू नेटवर्क में अपनी पहचान रजिस्टर की हो
✓ आपकी जानकारी लाइव वर्ल्ड मैप पर दिख रही हो!

बधाई हो, एक्सप्लोरर! अब आप बचाव नेटवर्क में शामिल हो गए हैं. आपका बीकन चालू है (हालांकि, यह धुंधला है). साथ ही, अन्य सर्वाइवर आपको मैप पर देख सकते हैं.

7. नतीजा

आपने क्या बनाया

आपने सिर्फ़ 10 मिनट में, एआई की मदद से इमेज जनरेट करने की सुविधा का इस्तेमाल करके, अवतार जनरेट करने वाला पूरा सिस्टम बनाया:

┌─────────────────────────────────────────────────────────────┐
│                     Your Creation                           │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   📝 Input                       🖼️  Output                  │
│   ──────────                     ────────                    │
│   • Explorer name                • Stylized portrait         │
│   • Suit color                   • Consistent map icon       │
│   • Appearance description       • Live map presence         │
│                                                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   🧠 Techniques You Used                                     │
│   ──────────────────────                                    │
│   • Multi-turn chat sessions for character consistency      │
│   • Structured prompt engineering with style constraints    │
│   • Response parsing to extract generated images            │
│   • API integration for cloud registration                  │
│                                                             │
└─────────────────────────────────────────────────────────────┘

सीखने लायक ज़रूरी बातें

लेसन	यह ज़रूरी क्यों है
चैट सेशन में कॉन्टेक्स्ट बनाए रखना	यह सुविधा, एक जैसी दिखने वाली कई इमेज जनरेट करने के लिए ज़रूरी है. इससे इमेज में मौजूद किरदार की बनावट में बदलाव नहीं होता
प्रॉम्प्ट का स्ट्रक्चर मायने रखता है	साफ़ तौर पर बताई गई शर्तों (व्हाइट बैकग्राउंड, खास स्टाइल, फ़्रेमिंग) के हिसाब से, अनुमानित और प्रोडक्शन के लिए तैयार नतीजे मिलते हैं
एक से ज़्यादा बार बातचीत करने की सुविधा, अलग-अलग कॉल करने की सुविधा से बेहतर है	चैट में मौजूद हर मैसेज, पिछले कॉन्टेक्स्ट के आधार पर तैयार होता है. इससे, जवाब को बेहतर बनाने और उसमें एकरूपता बनाए रखने में मदद मिलती है
जवाब देने के तरीके से जुड़े कंट्रोल का आउटपुट	इमेज जनरेट करने के लिए, `["TEXT", "IMAGE"]` सेटिंग चालू करना ज़रूरी है. इसके बिना, आपको सिर्फ़ टेक्स्ट मिलेगा

कीमत की खास जानकारी

इस लेवल के लिए, आपने Gemini 2.5 Flash (Nano Banana) का इस्तेमाल करके दो इमेज जनरेट की हैं:

आइटम	टोकन	लागत
पोर्ट्रेट (1024×1024)	~1,290 आउटपुट टोकन	~4.35 रुपये
आइकॉन (1024×1024)	~1,290 आउटपुट टोकन	~4.35 रुपये
कुल	~2,580 टोकन	~0.08 डॉलर

अन्य विकल्प: Nano Banana Pro

बेहतर क्वालिटी का आउटपुट पाने के लिए, gemini-3-pro-image-preview (Nano Banana Pro) का इस्तेमाल करें. इससे ज़्यादा बारीकी से और बेहतर क्वालिटी वाली इमेज जनरेट होती हैं.हालांकि, पोर्ट्रेट + आइकॉन के लिए (1K रिज़ॉल्यूशन का इस्तेमाल करके) इसकी कीमत करीब 27 रुपये होती है.

ज़्यादा लोगों की भागीदारी वाले वर्कशॉप के लिए, Nano Banana (Gemini 2.5 Flash) सबसे अच्छा विकल्प है. इसकी क्वालिटी अच्छी है और यह कम कीमत में उपलब्ध है.

सफ़र जारी है

एक्सप्लोरर के तौर पर आपकी पहचान की पुष्टि हो गई है, लेकिन एक समस्या है: आपकी जगह की जानकारी की पुष्टि नहीं हुई है.

दुनिया का मैप देखें—आपका बीकन धुंधला है और धीरे-धीरे पल्स कर रहा है. रेस्क्यू नेटवर्क को पता है कि आप मौजूद हैं, लेकिन उन्हें यह नहीं पता कि आप किस जगह पर हैं. आपकी लोकेशन, पृथ्वी की सतह के किसी बड़े हिस्से में कहीं भी हो सकती है.

लेवल 1: अपनी जगह की जानकारी सेट करना में, आपको ये काम करने होंगे:

Google के एजेंट डेवलपमेंट किट (एडीके) का इस्तेमाल करके, मल्टी-एजेंट सिस्टम बनाना
भूवैज्ञानिक, वनस्पति विज्ञान, और खगोलीय विश्लेषण के लिए एमसीपी सर्वर बनाएं
टेक्स्ट, इमेज, और वीडियो वगैरह का इस्तेमाल करके दिए गए इनपुट को प्रोसेस करना (दुर्घटना की जगह की इमेज)
एआई की मदद से, पुष्टि की गई जगह का टपोग्राफ़िकल मैप जनरेट करना
अपने बीकन को चालू करें, ताकि बचाव दल आपको ढूंढ सके!

लेवल 1 में, ज़्यादा ऐडवांस कॉन्सेप्ट के बारे में बताया गया है. जैसे, मल्टी-एजेंट ऑर्केस्ट्रेशन, मॉडल कॉन्टेक्स्ट प्रोटोकॉल (एमसीपी), और प्रोडक्शन डिप्लॉयमेंट पैटर्न. आपको एक मॉडल की सुविधा का इस्तेमाल करने से लेकर, पूरा एजेंटिक सिस्टम बनाने तक का तरीका बताया जाएगा.

डेटा साफ़ करना (ज़रूरी नहीं)

अगर आपको लोकल फ़ाइलों को क्लीन अप करना है (level_0 डायरेक्ट्री से चलाएं):

rm -rf outputs/
deactivate  # Exit virtual environment

रेस्क्यू नेटवर्क के साथ आपका रजिस्ट्रेशन बना रहता है. लोकल फ़ाइलें मिटाने के बाद भी, आपको मैप पर दिखाया जाएगा. इमेज को क्लाउड में सेव किया जाता है, न कि डिवाइस में.

संसाधन

आपके बीकन की पुष्टि होना बाकी है. एक्सप्लोरर, लेवल 1 में मिलते हैं. 🚀

8. बोनस: फ़ोटो पर आधारित अवतार (ज़रूरी नहीं)

फ़ोटो से अवतार बनाने की सुविधा का इस्तेमाल कब करें

अगर आपको यह तरीका पसंद है, तो:

आपको अपने अवतार को अपने जैसा बनाना है
आपको किसी फ़ोटो को स्टाइल करना है
आपको Gemini की इमेज को दूसरी इमेज में बदलने की सुविधाओं के बारे में जानना हो

यह कैसे काम करता है

सिर्फ़ टेक्स्ट के ब्यौरे के आधार पर कोई किरदार जनरेट करने के बजाय, एक फ़ोटो उपलब्ध कराएं और Gemini से उसे बदलने के लिए कहें. साथ ही, यह भी कहें कि व्यक्ति के लुक में कोई बदलाव न किया जाए:

अपनी फ़ोटो अपलोड करें

सबसे पहले, Cloud Shell में कोई फ़ोटो अपलोड करें:

Cloud Shell में, टर्मिनल टूलबार में मौजूद तीन बिंदु वाले मेन्यू (⋮) पर क्लिक करें
अपलोड करें को चुनें
हेडशॉट की साफ़ फ़ोटो चुनें (JPEG या PNG)
अपलोड किए गए पाथ को नोट करें. उदाहरण के लिए, /home/your-username/my_photo.jpg)

जनरेटर में बदलाव करना

किसी फ़ोटो का इस्तेमाल करने के लिए, आपको generator.py में पोर्ट्रेट जनरेट करने के चरण में बदलाव करना होगा. सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट की जगह, मल्टीमॉडल प्रॉम्प्ट का इस्तेमाल करें. इसमें अपनी फ़ोटो शामिल करें:

    # MODULE_5_STEP_2_GENERATE_PORTRAIT (Photo-based version)
    
    # Load your photo
    photo_path = "/home/your-username/my_photo.jpg"  # Update this path!
    user_photo = Image.open(photo_path)
    
    # Convert photo to bytes for the API
    photo_buffer = io.BytesIO()
    user_photo.save(photo_buffer, format="JPEG")
    photo_bytes = photo_buffer.getvalue()
    
    portrait_prompt = f"""Transform this person into a stylized space explorer portrait.

PRESERVE from the original photo:
- The person's facial features, face shape, and likeness
- Their general expression and personality
- Any distinctive features (glasses, facial hair, etc.)

TRANSFORM with this style:
- Digital illustration style, clean lines, vibrant saturated colors
- Add a futuristic space suit with the name "{USERNAME}" on a shoulder patch
- Suit color: {SUIT_COLOR}
- Background: Pure solid white (#FFFFFF) - no gradients or elements
- Frame: Head and shoulders, 3/4 view
- Lighting: Soft diffused studio lighting
- Art style: Modern animated movie character (Pixar/Dreamworks aesthetic)

The result should be clearly recognizable as THIS specific person, but illustrated as a heroic space explorer."""

    print("🎨 Transforming your photo into an explorer portrait...")
    
    # Send both the prompt AND the image
    portrait_response = chat.send_message([
        portrait_prompt,
        types.Part.from_bytes(data=photo_bytes, mime_type="image/jpeg")
    ])
    
    # Rest of the extraction code stays the same...

अब भी मल्टी-टर्न कंसिस्टेंसी की सुविधा काम करती है

फ़ोटो के आधार पर इमेज जनरेट करने के लिए, बातचीत के कई चरणों वाली सुविधा इसी तरह काम करती है:

पहली बारी: फ़ोटो + प्रॉम्प्ट → स्टाइल में बनाया गया पोर्ट्रेट (आपकी तरह दिखने वाला, इलस्ट्रेटेड)
दूसरा चरण: "इसी किरदार का आइकॉन बनाओ" → एक जैसा आइकॉन

चैट सेशन में, स्टाइल की गई इमेज सेव होती है, न कि ओरिजनल फ़ोटो. इसलिए, आइकॉन, बदले गए पोर्ट्रेट से पूरी तरह मेल खाएगा.

निजता से जुड़ी बातें

निजता से जुड़ी जानकारी

फ़ोटो अपलोड करने पर:

फ़ोटो को प्रोसेस करने के लिए, Vertex AI (Google Cloud) को भेजा जाता है
स्टाइल वाली फ़ोटो (आपकी ओरिजनल फ़ोटो नहीं) को रेस्क्यू नेटवर्क पर सेव किया जाता है
सिर्फ़ ऐसी फ़ोटो का इस्तेमाल करें जिन्हें एआई सेवाओं के ज़रिए प्रोसेस करने में आपको कोई समस्या नहीं है
निजता बनाए रखने के लिए, टेक्स्ट जनरेट करने की सुविधा (फ़ोटो नहीं) हमेशा उपलब्ध रहती है

Vertex AI Studio में इसे आज़माएं

कोड लिखने से पहले, Google Cloud Console में जाकर फ़ोटो को इंटरैक्टिव तरीके से बदलने की सुविधा को आज़माया जा सकता है:

Vertex AI Studio पर जाएं
इमेज से जुड़ी सुविधाओं वाला Gemini का कोई मॉडल चुनें
अटैचमेंट बटन का इस्तेमाल करके, अपनी फ़ोटो अपलोड करें
इमेज ट्रांसफ़ॉर्म करने के लिए प्रॉम्प्ट डालें
जब तक आपको मनमुताबिक नतीजा न मिल जाए, तब तक स्टाइल में बदलाव करते रहें

यह इंटरैक्टिव तरीका, प्रॉम्प्ट के साथ एक्सपेरिमेंट करने और कोड को लागू करने से पहले रीयल-टाइम में नतीजे देखने के लिए बेहतरीन है!

आपने क्या सीखा (बोनस)

✓ Gemini की मदद से, इमेज को दूसरी इमेज में बदलने का तरीका
✓ एक ही मैसेज में टेक्स्ट और इमेज जैसे कई तरह के कॉन्टेंट को भेजने का तरीका
✓ आर्टिस्टिक स्टाइल ट्रांसफ़र लागू करते समय, इमेज की समानता को बनाए रखने का तरीका
✓ फ़ोटो के आधार पर एआई जनरेशन के लिए निजता से जुड़ी बातें