Data Agent Kit और Antigravity IDE की मदद से Analytics

1. परिचय

सोमवार की सुबह है और सीएफ़ओ ने आपको अभी-अभी पिंग किया है. इस महीने ऑर्डर की औसत कीमत में 7% की गिरावट आई है. हालांकि, कुल रेवेन्यू में कोई बदलाव नहीं हुआ है. कुछ गड़बड़ी हुई है और बोर्ड को शुक्रवार तक जवाब चाहिए.

आपकी कंपनी, Cymbal Pets, अमेरिका में पालतू जानवरों के सामान की सबसे बड़ी ऑनलाइन खुदरा विक्रेता कंपनी है. आपको जिस डेटा की ज़रूरत है वह Google Cloud की तीन सेवाओं में फैला हुआ है: लेन-देन का डेटा BigQuery में, ग्राहक और प्रॉडक्ट के रिकॉर्ड Cloud SQL में, और मार्केटिंग फ़ाइलें Cloud Storage में. आम तौर पर, इस तरह की क्रॉस-सर्विस जांच करने के लिए, आपको अलग-अलग कंसोल के बीच स्विच करना पड़ता है. साथ ही, कनेक्शन के लिए बॉयलरप्लेट लिखना पड़ता है और नतीजों को मैन्युअल तरीके से एक साथ जोड़ना पड़ता है.

इस कोडलैब में, नैचुरल लैंग्वेज का इस्तेमाल करके गड़बड़ी की जांच करने के लिए, Antigravity IDE में Google Cloud Data Agent Kit (DAK) का इस्तेमाल किया जाएगा. आपको सिर्फ़ यह बताना होता है कि आपको क्या चाहिए. इसके बाद, एआई एजेंट BigQuery, Cloud SQL, और Cloud Storage के बीच कनेक्शन, एसक्यूएल, और क्रॉस-सर्विस जॉइन को मैनेज करता है. समस्या का पता लगाने के बाद, आपको एजेंट से dbt पाइपलाइन बनाने के लिए कहना होगा. इससे आपकी खोज के नतीजों को लागू किया जा सकेगा. साथ ही, आपको डेटा मॉडलिंग से जुड़ी किसी गड़बड़ी को डीबग करना होगा. इसके अलावा, आपको सीएफ़ओ को अनुमान के आधार पर सुझाव देना होगा.

आपको क्या करना होगा

  • Knowledge Catalog का इस्तेमाल करके, BigQuery, Cloud SQL, और Cloud Storage में मौजूद डेटा ऐसेट ढूंढना
  • एमसीपी टूल का इस्तेमाल करके, एक ही बातचीत में कई सेवाओं से क्वेरी करके, किसी गड़बड़ी की जांच करना
  • स्टेजिंग मॉडल और ऑटोमेटेड टेस्ट की मदद से, अलग-अलग सेवाओं के डेटा को स्टेज करने और जोड़ने के लिए, dbt पाइपलाइन बनाएं
  • डेटा मॉडलिंग से जुड़ी समस्या को डीबग करना, क्योंकि एजेंट खुद से समस्या का पता लगाता है और फ़ैन-आउट बग को ठीक करता है
  • BigQuery के AI.FORECAST का इस्तेमाल करके, आने वाले समय के रुझानों का अनुमान लगाएं और डेटा पर आधारित सुझाव दें

आपको किन चीज़ों की ज़रूरत होगी

  • कोई वेब ब्राउज़र, जैसे कि Chrome
  • बिलिंग की सुविधा वाला Google Cloud प्रोजेक्ट
  • SQL और Google Cloud Console के बारे में बुनियादी जानकारी

यह कोडलैब, डेटा के बारे में सामान्य जानकारी रखने वाले लोगों (ऐनलिटिक्स इंजीनियर, डेटा ऐनलिस्ट, डेटा साइंटिस्ट) के लिए है.

इस कोडलैब में बनाए गए संसाधनों की लागत 5 डॉलर से कम होनी चाहिए.

2. शुरू करने से पहले

इस सेक्शन में, आपको एक सेटअप स्क्रिप्ट चलाने का तरीका बताया जाएगा. यह स्क्रिप्ट, आपके पूरे लैब एनवायरमेंट को तैयार करती है. इसमें ऑर्डर डेटा वाला BigQuery डेटासेट, ग्राहक और प्रॉडक्ट डेटा वाला Cloud SQL Postgres इंस्टेंस, और प्रमोशनल कैंपेन के रिकॉर्ड वाला Cloud Storage बकेट शामिल है. स्क्रिप्ट को पूरा होने में करीब 8 से 10 मिनट लगते हैं. इसमें Cloud SQL प्रोविज़निंग में सबसे ज़्यादा समय लगता है.

Cloud Shell शुरू करना

सेटअप स्क्रिप्ट चलाने के लिए, Google Cloud Shell का इस्तेमाल किया जाएगा.

  1. Google Cloud Console में सबसे ऊपर मौजूद, Cloud Shell चालू करें पर क्लिक करें.

Cloud Shell खोलें

  1. कनेक्ट होने के बाद, अपना प्रोजेक्ट आईडी सेट करें और अपने एनवायरमेंट की पुष्टि करें:
gcloud config set project <<YOUR_PROJECT_ID>>
export PROJECT_ID=$(gcloud config get-value project)

आपको इस तरह का मैसेज दिखेगा:

Your active configuration is: [cloudshell-####]
Updated property [core/project]

रिपॉज़िटरी का क्लोन बनाना

कोडलैब की रिपॉज़िटरी को अपने Cloud Shell एनवायरमेंट में क्लोन करें:

cd ~/
git clone --filter=blob:none --no-checkout https://github.com/GoogleCloudPlatform/devrel-demos.git
cd ~/devrel-demos
git sparse-checkout init --cone
git sparse-checkout set codelabs/agentic-data-labs
git checkout main
cd codelabs/agentic-data-labs/

सेटअप स्क्रिप्ट चलाना

सेटअप स्क्रिप्ट, आपके पूरे लैब एनवायरमेंट को कुछ ही मिनटों में तैयार कर देती है. यह टूल, एपीआई चालू करने, BigQuery डेटा को लोड करने और बढ़ाने, GCS में प्रमोशन ऐसेट अपलोड करने जैसे काम करता है. इसके बाद, यह बैकग्राउंड वर्कर को अपने-आप शुरू कर देता है, ताकि कोडलैब शुरू करते समय Cloud SQL Postgres को बैकग्राउंड में उपलब्ध कराया जा सके और कॉन्फ़िगर किया जा सके.

यह स्क्रिप्ट, Cloud SQL के लिए सुरक्षित पासवर्ड अपने-आप जनरेट करती है. साथ ही, इसे आपकी .env फ़ाइल में अपने-आप सेव कर देती है.

cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x setup.sh setup_sql.sh
./setup.sh

इसके पूरा होने पर, आपको फ़ोरग्राउंड एनवायरमेंट की खास जानकारी दिखेगी:

╔══════════════════════════════════════════════════════╗
║   Base Setup complete!                               ║
╚══════════════════════════════════════════════════════╝

Your core BigQuery and GCS assets are ready.
Cloud SQL is currently provisioning in the background and will be fully ready by Step 4.

  BigQuery:   YOUR_PROJECT_ID.cymbal_pets
              ├── orders
              └── order_items

  GCS:        gs://YOUR_PROJECT_ID-cymbal-pets-raw
              └── promo_events.json

लैब के अगले चरणों को पूरा करने के दौरान, बैकग्राउंड में डेटाबेस को चालू किया जाता है और उसमें डेटा डाला जाता है. इसकी प्रोग्रेस को किसी भी समय अलग टर्मिनल पैनल में देखा जा सकता है. इसके लिए, इनका इस्तेमाल करें:

tail -f /tmp/cloudsql_setup.log

डेटा आर्किटेक्चर पर ध्यान दें: लेन-देन से जुड़ा डेटा (ऑर्डर और ऑर्डर आइटम) BigQuery में सेव होता है. वहीं, ऑपरेशन से जुड़ा डेटा (ग्राहक, पालतू जानवरों की प्रोफ़ाइलें, और प्रॉडक्ट) Cloud SQL में सेव होता है. यह बंटवारा, असल संगठनों में डेटा को अलग-अलग सेवाओं में बांटने के तरीके को दिखाता है. इससे अलग-अलग सेवाओं में जांच करना दिलचस्प हो जाता है.

सेक्शन की खास जानकारी: आपने लैब एनवायरमेंट को बूटस्ट्रैप करने के लिए सेटअप स्क्रिप्ट चलाई और बैकग्राउंड डेटाबेस प्रोविज़निंग शुरू की.

3. आईडीई और डेटा एजेंट किट सेट अप करना

Antigravity IDE खोलें

Cloud SQL के पूरा होने का इंतज़ार करने की ज़रूरत नहीं है! Antigravity IDE खोलें और इसे अपने Google Cloud प्रोजेक्ट से कनेक्ट करें.

  1. अगर आपने अब तक Antigravity IDE को डाउनलोड और इंस्टॉल नहीं किया है, तो Google Antigravity के डाउनलोड पेज से इसे डाउनलोड और इंस्टॉल करें.
  2. Antigravity IDE डेस्कटॉप ऐप्लिकेशन लॉन्च करें.
  3. अपनी लोकल मशीन पर एक नया, खाली फ़ोल्डर बनाएं. उदाहरण के लिए, agentic-data-labs नाम का फ़ोल्डर बनाएं. इसके बाद, फ़ोल्डर खोलें को चुनकर, उसे IDE में खोलें. यह कोडलैब के लिए आपके लोकल वर्कस्पेस के तौर पर काम करेगा.

Antigravity IDE प्रोजेक्ट फ़ोल्डर को कॉन्फ़िगर करना

Data Agent Kit एक्सटेंशन इंस्टॉल करना

Google Cloud Data Agent Kit एक्सटेंशन, Google Cloud की डेटा सेवाओं के साथ सीधे तौर पर इंटिग्रेट होता है. इससे आपको अपने एडिटर में ही BigQuery, Cloud SQL, Cloud Storage वगैरह के साथ इंटरैक्ट करने की सुविधा मिलती है. इसके लिए, आपको कॉन्टेक्स्ट स्विच करने की ज़रूरत नहीं होती.

  1. Antigravity IDE में, स्क्रीन के सबसे बाईं ओर मौजूद Activity Bar में, Extensions आइकॉन पर क्लिक करें. यह आइकॉन, चार स्क्वेयर की तरह दिखता है.
  2. एक्सटेंशन पैनल में सबसे ऊपर मौजूद खोज बार में, Google Cloud Data Agent Kit टाइप करें.
  3. googlecloudtools ने Google Cloud Data Agent Kit नाम का एक्सटेंशन पब्लिश किया है. इसे ढूंढें
  4. इंस्टॉल करें बटन पर क्लिक करें.
  5. आपको यह मैसेज दिख सकता है, "क्या आपको पब्लिशर ‘googlecloudtools' और उसके एक्सटेंशन पर भरोसा है?". आगे बढ़ने के लिए, भरोसेमंद पब्लिशर और इंस्टॉल करें पर क्लिक करें.

Data Agent Kit एक्सटेंशन इंस्टॉल करना

इंस्टॉल हो जाने के बाद, आपको Antigravity IDE के सबसे बाईं ओर मौजूद ऐक्टिविटी बार में, नया Google Cloud Data Agent Kit आइकॉन दिखेगा.

एक्सटेंशन की पुष्टि करना और उसे कॉन्फ़िगर करना

एक्सटेंशन इंस्टॉल करने के बाद, इसे अपने Google Cloud प्रोजेक्ट से कनेक्ट करें.

  1. "Google Cloud Data Agent Kit में आपका स्वागत है" नाम का एक पेज अपने-आप खुल जाएगा. अगर आपने Cloud खाते में साइन इन नहीं किया है, तो ऐक्सेस की अनुमति देने के लिए दिए गए निर्देशों का पालन करें.
  2. कॉन्फ़िगरेशन की खास जानकारी सेक्शन में, प्रोजेक्ट फ़ील्ड ढूंढें. ड्रॉपडाउन पर क्लिक करें और अपना Google Cloud प्रोजेक्ट चुनें. अपने देश/इलाके को us-central1 के तौर पर सेट करें. इसके बाद, Configure MCP Servers को चुनें.

Data Agent Kit एक्सटेंशन का शुरुआती कॉन्फ़िगरेशन

  1. एमसीपी कॉन्फ़िगरेशन पैनल में जाकर, BigQuery और Cloud SQL को चालू करने के लिए क्लिक करें. इसके बाद, शुरू करें पर क्लिक करें.

एमसीपी सर्वर कॉन्फ़िगर करना

कॉन्फ़िगरेशन के विकल्प देखना

सेटअप पूरा होने के बाद, आपको "Google Cloud Data Agent Kit का इस्तेमाल शुरू करें" पेज पर रीडायरेक्ट कर दिया जाएगा.

  1. "सेटअप और कॉन्फ़िगरेशन" में जाकर, शुरू करें पर क्लिक करें.
  2. इससे डेटा एजेंट कॉन्फ़िगरेशन पैनल खुलता है. टैब एक्सप्लोर करें:
    • प्रोजेक्ट और क्षेत्र: चुने गए प्रोजेक्ट आईडी की पुष्टि करें. साथ ही, यह देखें कि ज़रूरी एपीआई (Cloud Storage API, BigQuery API, Catalog API, और Cloud SQL Admin API) चालू हों.
    • BigQuery: BigQuery क्वेरी के लिए जगह की डिफ़ॉल्ट जानकारी कॉन्फ़िगर करें. क्षेत्र us-central1 का इस्तेमाल करें.
    • एमसीपी सर्वर कॉन्फ़िगर करें: चालू किए गए एमसीपी सर्वर (BigQuery, Notebooks, Cloud SQL वगैरह) देखें. इनकी मदद से एआई एजेंट, आपके डेटा के साथ सुरक्षित तरीके से इंटरैक्ट कर सकते हैं.
    • स्किल: पहले से बनी हुई स्किल एक्सप्लोर करें. ये स्किल, एजेंट को मुश्किल डेटा टास्क के लिए खास सुविधाएं देती हैं.

डेटा एजेंट की सेटिंग का पैनल

सेक्शन की खास जानकारी: आपने Antigravity IDE खोला और उसे अपने Google Cloud प्रोजेक्ट से कनेक्ट किया. इसके बाद, Data Agent Kit के रिमोट एमसीपी सर्वर कॉन्फ़िगर किए. साथ ही, BigQuery के ख़िलाफ़ क्वेरी चलाकर कनेक्शन की पुष्टि की.

4. अपने डेटा के बारे में जानना

अब सीन सेट करने का समय है. यहां एक उदाहरण दिया गया है: सीएफ़ओ का कहना है कि पिछले महीने ऑर्डर की औसत कीमत में 7% की गिरावट आई है, लेकिन कुल रेवेन्यू में कोई बदलाव नहीं हुआ है. एजेंट से जांच करने के लिए कहने से पहले, आपको यह समझना चाहिए कि आपको किस डेटा पर काम करना है.

इस सेक्शन में, आपको डेटा एजेंट किट पैनल को मैन्युअल तरीके से एक्सप्लोर करने का तरीका बताया जाएगा. इससे आपको इस पैनल के बारे में बुनियादी जानकारी मिल जाएगी. किसी भी जांच में, क्वेरी शुरू करने से पहले अपने डेटा को समझना पहला ज़रूरी चरण है.

BigQuery टेबल एक्सप्लोर करना

  1. डेटा एजेंट किट पैनल में, कैटलॉग में जाकर, आपका प्रोजेक्टBigQuerycymbal_pets को बड़ा करें.
  2. orders टेबल पर क्लिक करें. ऐसा करने पर, एक नया टैब खुलेगा. इसमें टेबल की जानकारी दिखेगी.
  3. टेबल व्यूअर की बाईं ओर मौजूद टैब एक्सप्लोर करें:
    • डेटा: असल पंक्तियों की झलक देखें. डेटासेट में स्क्रोल करें और कॉलम की जांच करें.
    • स्कीमा: कॉलम के नाम और टाइप की समीक्षा करें. order_type और promo_code जैसे फ़ील्ड पर ध्यान दें. ये बाद में ज़रूरी हो जाएंगे.
    • अन्य टैब (जानकारी, अहम जानकारी, डेटा प्रोफ़ाइल वगैरह): मेटाडेटा, डेटा लीनेज, और क्वालिटी की जानकारी ऐक्सेस करें. यह जानकारी आम तौर पर Google Cloud Console में मिलती है. इसके लिए, आपको एडिटर से बाहर जाने की ज़रूरत नहीं है.

BigQuery की ऑर्डर टेबल

  1. अब order_items टेबल पर क्लिक करें और उसके स्कीमा की समीक्षा करें. quantity और price फ़ील्ड पर ध्यान दें.

Cloud SQL टेबल एक्सप्लोर करना

सेटअप स्क्रिप्ट ने ग्राहक, पालतू जानवर, और प्रॉडक्ट डेटा को Cloud SQL में PostgreSQL डेटाबेस में भी रखा.

  1. Data Agent Kit पैनल में, CATALOG सेक्शन में जाकर, Universal Search पर क्लिक करें.
  2. खोज बॉक्स में, pet_profiles टाइप करें और Enter दबाएं.
  3. खोज के नतीजों में, अपने प्रोजेक्ट के Cloud SQL इंस्टेंस में मौजूद pet_profiles के लिए, PostgreSQL टेबल के नतीजे पर क्लिक करें. ध्यान दें कि साइडबार अकॉर्डियन अपने-आप बड़ा हो जाता है. इससे आपको पता चलता है कि डेटाबेस ट्री में टेबल कहां मौजूद है. अब इसकी जानकारी देखने के लिए, ट्री में इसके ठीक ऊपर मौजूद customers टेबल पर क्लिक करें. इसके बाद, स्कीमा और जानकारी टैब देखें.

Cloud SQL स्कीमा

Cloud Storage की फ़ाइलें एक्सप्लोर करना

आखिर में, मार्केटिंग और प्रमोशन कैंपेन के रिकॉर्ड, Cloud Storage में रॉ JSON फ़ाइलों के तौर पर सेव किए जाते हैं.

  1. बाईं ओर मौजूद Data Agent Kit पैनल में, CLOUD STORAGE सेक्शन को बड़ा करें. अपने प्रोजेक्ट का रॉ बकेट (YOUR_PROJECT_ID-cymbal-pets-raw) ढूंढें.
  2. बकेट में मौजूद promo_events.json फ़ाइल पर क्लिक करें. इससे एक नया एडिटर टैब खुलता है. इसमें, मार्केटिंग कैंपेन का रॉ JSON लाइंस कॉन्टेंट सीधे तौर पर IDE में देखा जा सकता है.

Cloud Storage promo_events.json की झलक

स्टॉक की जानकारी

डेटा लैंडस्केप के बारे में अब आपको यह जानकारी मिल गई है:

सेवा

टेबल

इसमें क्या-क्या शामिल है

BigQuery

orders, order_items

करीब 19 लाख ऑर्डर, करीब 43 लाख लाइन आइटम, तारीख की सीमा 2023-2025

Cloud SQL

customers, pet_profiles, products

~92 हज़ार ग्राहक, ~7.6 हज़ार पालतू जानवरों की प्रोफ़ाइलें, 206 प्रॉडक्ट

Cloud Storage

promo_events.json

प्रमोशन वाले कैंपेन के रिकॉर्ड

डेटा को तीन सेवाओं में बांटा गया है. पारंपरिक वर्कफ़्लो में, आपको कनेक्शन सेट अप करने, इंटिग्रेशन कोड लिखने, और नतीजों को मैन्युअल तरीके से जोड़ने की ज़रूरत होती है. अगले चरण में, आपको एआई एजेंट को यह काम सौंपना होगा. इसके लिए, आपको सिर्फ़ एक बार बातचीत करनी होगी.

सेक्शन की खास जानकारी: आपने Data Agent Kit पैनल का इस्तेमाल करके, BigQuery, Cloud SQL, और Cloud Storage में डेटा आर्किटेक्चर को मैन्युअल तरीके से एक्सप्लोर किया. अब आपको पता है कि डेटा कहां मौजूद है और कौनसे फ़ील्ड उपलब्ध हैं. इसलिए, अब जांच शुरू की जा सकती है.

5. नंबर के हिसाब से

अब जांच शुरू की जाएगी. आपको चैट पैनल का इस्तेमाल करके, एआई एजेंट से BigQuery से ऑर्डर की औसत कीमत (एओवी) का डेटा निकालने के लिए कहना होगा. एओवी, कारोबार की एक मेट्रिक है. इससे हर ऑर्डर पर खर्च की गई औसत रकम का पता चलता है. यह एजेंट, MCP टूल का इस्तेमाल करके आपकी ओर से क्वेरी करेगा. साथ ही, आपको हर एसक्यूएल क्वेरी दिखेगी.

ऑर्डर की औसत कीमत का रुझान पाना

  1. आईडीई की दाईं ओर मौजूद चैट पैनल में, यह प्रॉम्प्ट टाइप करें और Enter दबाएं:
    Calculate our monthly average order value from August 2024 through January 2025
    using the orders and order_items tables in BigQuery.
    
  2. डेटा ऐक्सेस करने की अनुमतियों को स्वीकार करें. आपके डेटाबेस पर क्वेरी चलाने वाले एआई एजेंटों के बारे में सावधान रहना ज़रूरी है. डेटा एजेंट किट, आपको कंट्रोल में रखती है. यह डेटा ऐक्सेस करने से पहले, आपसे साफ़ तौर पर अनुमति मांगती है. प्रॉम्प्ट दिखने पर, इनमें से कोई विकल्प चुना जा सकता है:
    • अभी के लिए अनुमति दें: इससे एक बार इस्तेमाल करने की अनुमति मिलती है. यह अनुमति, ज़्यादा जोखिम वाली क्वेरी की ऑडिटिंग के लिए सबसे सही है.
    • हमेशा अनुमति दें: इससे सेशन के लिए, इस टूल का इस्तेमाल जारी रखने की अनुमति मिलती है.
    • नहीं: इससे कार्रवाई पूरी तरह से ब्लॉक हो जाती है.
    लैब का बेहतर अनुभव पाने के लिए, हां, और हमेशा अनुमति दें को चुनें.ध्यान दें: अनुमतियां, हर टूल के हिसाब से दी जाती हैं. एजेंट, नए टूल (जैसे, list_table_ids या execute_sql_readonly) का इस्तेमाल करता है. इसलिए, आपको कुछ और प्रॉम्प्ट दिख सकते हैं. इन प्रॉम्प्ट को भी "हमेशा अनुमति दें" पर सेट करें.

एमसीपी टूल की अनुमति से जुड़ा प्रॉम्प्ट

  1. एजेंट को काम करते हुए देखें. चैट पैनल, एजेंट की हर गतिविधि के लिए पारदर्शिता लॉग के तौर पर भी काम करता है. ब्लैक बॉक्स के बजाय, एजेंट आपको रीयल टाइम में यह बताता है कि उसने ऐसा क्यों किया और क्या कार्रवाई की.
  2. एजेंट के जवाब देने के बाद, अपने प्रॉम्प्ट के नीचे मौजूद X मिनट तक काम किया ड्रॉपडाउन पर क्लिक करके, काम का पूरा लॉग बड़ा करें. यहां यह देखा जा सकता है कि आपको जवाब कैसे मिला:
    • एक्सप्लोर किया गया: इन आइटम को बड़ा करके देखें कि एजेंट फ़ाइलें पढ़ रहा है, फ़ोल्डर ब्राउज़ कर रहा है या MCP टूल (जैसे, datacloud_bigquery_remote / list_table_ids और execute_sql_readonly) को कॉल कर रहा है. टूल को पास किए गए सटीक JSON आर्ग्युमेंट और एक्ज़ीक्यूट किए गए SQL को देखा जा सकता है.
    • चलाया गया: एजेंट ने जो भी टर्मिनल कमांड चलाई हैं उन्हें देखने के लिए, इन आइटम को बड़ा करें. जैसे, gcloud config list.

एमसीपी टूल के कॉल दिखाने वाला एजेंट ट्रांसपेरंसी लॉग

  1. नतीजों की समीक्षा करें. एजेंट को हर महीने के हिसाब से एओवी की वैल्यू वाली टेबल दिखानी चाहिए. खुद ही इन नंबरों को देखें: पिछले महीनों में यह करीब 110 डॉलर था. इसके बाद, जनवरी में यह करीब 103 डॉलर हो गया. यह वही गड़बड़ी है जिसे सीएफ़ओ ने फ़्लैग किया था.

चैनल के हिसाब से ड्रिल-डाउन करना

कुल एओवी में गिरावट आई है, लेकिन यह गिरावट किस वजह से आई है? Let's find out.

  1. Chat पैनल में, यह टाइप करें:
    January looks lower than the prior months. 
    Break down January's AOV by order_type to see what's going on?
    
  2. इसके बाद, एजेंट एक और BigQuery क्वेरी चलाता है. इस बार, वह order_type के हिसाब से ग्रुप करता है. नतीजों को ध्यान से देखें.आपको कुछ खास बातें दिखेंगी: ऑनलाइन और ऑफ़लाइन एओवी, 110 डॉलर के आस-पास स्थिर है. हालांकि, एक नया चैनल B2B-Wholesale है, जिसका एओवी काफ़ी कम है (लगभग 75 डॉलर). इस नए चैनल की वजह से, ब्लेंड किए गए औसत में गिरावट आ रही है.
  3. एजेंट, B2B ग्राहकों की जांच करने का सुझाव दे सकता है. अगर ऐसा नहीं होता है, तो कोई बात नहीं. अगले चरण में आपको यह करना होगा.

सेक्शन की खास जानकारी: आपने डेटा की सामान्य जांच करके, जनवरी में एओवी में आई गिरावट का पता लगाया. इसके बाद, आपने order_type के हिसाब से डेटा की बारीकी से जांच की. इससे आपको पता चला कि B2B-Wholesale एक नया चैनल है, जिसकी वजह से औसत एओवी में गिरावट आई है. अब आपको यह पता लगाना होगा कि ये B2B ग्राहक कौन हैं.

6. सेवा की सीमा पार करना

आपने BigQuery में B2B-Wholesale को अनियमित चैनल के तौर पर आइडेंटिफ़ाई किया है. हालांकि, ग्राहक से जुड़ा डेटा Cloud SQL में सेव है. डेटा एजेंट किट की मदद से, बातचीत को जारी रखा जा सकता है. साथ ही, यह सेवा की सीमा को मैनेज करती है.

B2B ग्राहकों की जांच करना

  1. चैट पैनल में, यह टाइप करें:
    Who are these B2B customers? Their profiles should be in our Cloud SQL database. 
    Check for:
    - Who they are
    - When they signed up
    - Whether they're new or existing customers
    
  2. चैट पैनल को ध्यान से देखें. इस बार, आपको कोई दूसरा एमसीपी टूल दिखेगा. अब एजेंट, BigQuery के बजाय Cloud SQL से क्वेरी कर रहा है.एजेंट, cymbal-pets-ops Cloud SQL Postgres इंस्टेंस से कनेक्ट होता है और customers टेबल के ख़िलाफ़ क्वेरी चलाता है. एसक्यूएल देखने के लिए, जानकारी दिखाएं पर क्लिक करें.
  3. नतीजों की समीक्षा करें. एजेंट को कई अहम नतीजे दिखाने चाहिए:
    • सभी B2B ग्राहकों के पास customer_type = 'Business' है
    • इन सभी ने पिछले 30 दिनों (जनवरी 2025) में साइन अप किया है
    • उनकी last_name वैल्यू, कारोबार के नाम हैं. जैसे, "Pet Supply Co", "Animal Care LLC", और "Happy Paws Inc"
    • इनकी संख्या करीब 100 है. यह एक ऐसा ग्रुप है जो इस महीने से पहले मौजूद नहीं था

प्रमोशन कोड को कनेक्ट करना

  1. एजेंट को अपने-आप पता चल सकता है कि BigQuery में मौजूद कई B2B ऑर्डर में, promo_code की वैल्यू BIGORDER25 है. अगर यह जानकारी अपने-आप मिलती है, तो बहुत अच्छा है. जांच की प्रोसेस जारी है.अगर एजेंट ने प्रोमो कोड के बारे में नहीं बताया है, तो उसे यह जानकारी देने के लिए कहें:
    I noticed a promo_code field on the orders table in BigQuery. 
    Check what promo codes appear on the B2B-Wholesale orders?
    
  2. एजेंट, BigQuery से फिर से क्वेरी करता है. इससे पता चलता है कि B2B-Wholesale के करीब 92% ऑर्डर में promo_code = 'BIGORDER25' मौजूद है. लगभग सभी B2B गतिविधि, एक ही प्रमोशनल कैंपेन से जुड़ी होती है.एजेंट को अब यह जानने की इच्छा होनी चाहिए कि यह प्रोमो कोड कहां से आया. यह आपसे पूछ सकता है कि क्या एनवायरमेंट में कहीं और भी प्रमोशनल डेटा मौजूद है. (यह Cloud Storage में मौजूद है.)

सेक्शन की खास जानकारी: एजेंट ने Cloud SQL से क्वेरी की, ताकि यह पता चल सके कि B2B ग्राहक, जनवरी 2025 में साइन अप करने वाले सभी नए कारोबार हैं. BigQuery की इस खोज के साथ कि उनके ~92% ऑर्डर में promo_code = 'BIGORDER25' शामिल है, अब यह निशान प्रमोशनल कैंपेन की ओर इशारा करता है. सोर्स ढूंढने में लगा समय.

7. खोई हुई चीज़ ढूंढना

दो सेवाएं बंद हो गई हैं, एक और बंद होनी है. आपको पता है कि क्या हुआ (B2B ऑर्डर की वजह से, एओवी कम हो रहा है) और कौन ऐसा कर रहा है (पिछले 30 दिनों में शामिल हुए नए कारोबारी ग्राहक). अब आपको यह पता लगाना है कि क्यों. इसका जवाब Cloud Storage में है.

GCS बकेट की जांच करना

  1. चैट पैनल में, यह टाइप करें:
    Good catch on the promo code. 
    We might have promotional campaign data in our GCS bucket. 
    Can you check what's there?
    
  2. एजेंट के पास Cloud Storage के लिए, पहले से कॉन्फ़िगर किया गया एमसीपी टूल नहीं है. इसलिए, यह gcloud storage कमांड चलाने के लिए, अपने टर्मिनल टूल का इस्तेमाल करने लगता है. यह gcloud storage ls जैसे निर्देश चलाने की अनुमति मांगेगा. इन निर्देशों को अनुमति दें. इसके बाद, चैट पैनल में Ran लॉग को बड़ा करके देखें कि promo_events.json फ़ाइल को पढ़ने और पार्स करने के लिए, किन सीएलआई निर्देशों का इस्तेमाल किया गया था.
  3. एजेंट को फ़ाइल में तीन प्रमोशनल कैंपेन की पहचान करनी चाहिए:

    कैंपेन

    प्रमोशन कोड

    छूट

    टारगेट

    तारीख

    गर्मियों में पालतू जानवरों की देखभाल से जुड़े सामान की सेल

    PETSUMMER15

    15% की छूट

    सभी

    जून 2024

    B2B होलसेल पुश

    BIGORDER25

    25% की छूट

    B2B

    जनवरी 2025

    लॉयल्टी प्रोग्राम में शामिल सदस्यों के लिए छुट्टियों के दौरान मिलने वाला बोनस

    LOYAL10

    10% की छूट

    लॉयल्टी प्रोग्राम के सदस्य

    दिसंबर 2024

    यहां देखें. BIGORDER25 प्रोमो कोड, B2B होलसेल पुश नाम के कैंपेन से मैप किया गया है: B2B ग्राहकों के लिए 25% की छूट. इसके लिए, कम से कम 50 यूनिट का ऑर्डर करना होगा. यह पक्का सबूत है.

पूरी जानकारी का इस्तेमाल करना

  1. एजेंट से, मिली हुई सभी जानकारी को एक साथ रखने के लिए कहें:
    Put it all together. 
    What happened to our average order value?
    
  2. एजेंट, तीनों डेटा सोर्स को कनेक्ट करके, साफ़ तौर पर और व्यवस्थित तरीके से जानकारी देता है. इसमें कुछ इस तरह की जानकारी होनी चाहिए:
    1. एओवी में गिरावट आई है, लेकिन यह मौजूदा कारोबार में गिरावट नहीं है. ऑनलाइन और ऑफ़लाइन एओवी, ~110 डॉलर पर स्थिर बना हुआ है.
    2. जनवरी 2025 में, B2B-Wholesale का एक नया चैनल लॉन्च किया गया. इस चैनल पर, ~25,000 ऑर्डर मिले. साथ ही, इस चैनल का एओवी (~75 से 100 डॉलर) भी काफ़ी कम था.
    3. B2B ग्राहकों के 100 नए कारोबारी खाते हैं. इन सभी खातों ने पिछले 30 दिनों में साइन अप किया है (Cloud SQL).
    4. यह गतिविधि, प्रमोशनल कैंपेन ("B2B होलसेल पुश") की वजह से हुई है. इसमें 50 यूनिट (क्लाउड स्टोरेज) के कम से कम ऑर्डर पर 25% की छूट दी जा रही है.
    5. B2B ऑर्डर की संख्या ज़्यादा होने की वजह से, रेवेन्यू में कोई बदलाव नहीं हुआ है. ऐसा इसलिए, क्योंकि B2B ऑर्डर की संख्या ज़्यादा होने से, कम कीमतों पर होने वाली बिक्री से होने वाले नुकसान की भरपाई हो जाती है. हालांकि, 25% की थोक छूट देने पर, यूनिट मार्जिन में काफ़ी कमी (लगभग 65% की गिरावट) आ जाती है. शिपिंग और ऑपरेशनल ओवरहेड को ध्यान में रखने पर, इससे कुल मुनाफ़े पर काफ़ी असर पड़ता है.
    यह वह पल होता है, जब जांच में अहम सुराग मिलता है. सीएफ़ओ के सवाल का जवाब साफ़ तौर पर दिया गया है: एओवी में गिरावट इसलिए आई, क्योंकि मार्केटिंग पर आधारित B2B प्रोग्राम की वजह से जनवरी में, कम कीमत वाले ज़्यादा ऑर्डर मिले. मौजूदा कारोबार में कोई समस्या नहीं है.

सेक्शन की खास जानकारी: आपको Cloud Storage में एक अहम जानकारी मिली है. यह B2B प्रमोशन कैंपेन है, जिसमें एक साथ कई ऑर्डर करने पर 25% की छूट दी जा रही है. एजेंट ने तीनों सेवाओं से मिली जानकारी को एक साथ मिलाकर, साफ़ तौर पर बताया. जांच पूरी हो गई है. इसके बाद, आपको इन नतीजों को लागू करना होगा.

8. पाइपलाइन बनाना

आपने केस सुलझा लिया है. अब सीएफ़ओ चाहते हैं कि यह विश्लेषण अपने-आप अपडेट हो. इस सेक्शन में, एजेंट से dbt प्रोजेक्ट बनाने के लिए कहा जाएगा. यह प्रोजेक्ट, BigQuery डेटा को स्टेज करता है और एओवी के मौजूदा विश्लेषण के लिए फ़ैक्ट टेबल बनाता है.

इस चरण में, एजेंट जांचकर्ता से इंजीनियर की भूमिका में आ जाता है. आपको दिखेगा कि यह एक ही प्रॉम्प्ट से, पूरे dbt प्रोजेक्ट को तैयार कर रहा है और पूरी पाइपलाइन चला रहा है.

dbt प्रोजेक्ट को स्कैफ़ोल्ड करना

  1. चैट पैनल में, यह प्रॉम्प्ट टाइप करें. यह जवाब, चरण-दर-चरण जानकारी देने के बजाय, लक्ष्य पर आधारित है. आपने एजेंट को यह बताया है कि आपको क्या चाहिए, न कि यह बताया है कि उसे कैसे बनाना है:
    I want to productionize our AOV analysis so it updates automatically. Build a dbt project that:
    1. Creates staging models for the BigQuery tables (orders and order_items) and a mart called fct_order_analysis that calculates AOV by channel and month
    2. Add a uniqueness test on order_id and run dbt build
    
  2. खुद से ठीक होने की सुविधा को देखें: अगर "Ns के लिए काम किया" लॉग को बड़ा किया जाता है, तो आपको दिख सकता है कि एजेंट dbt की जांच करता है. अगर यह मौजूद नहीं है, तो Python वर्चुअल एनवायरमेंट (.venv) बनाने के लिए, कमांड अपने-आप चलती हैं. यह आपके लिए एनवायरमेंट सेटअप कर रहा है!

वर्चुअल एनवायरमेंट सेट अप करने वाला एजेंट

  1. लागू करने के प्लान की समीक्षा करें: एजेंट, लागू करने का एक औपचारिक प्लान जनरेट करेगा. इसके बाद, आपको प्रस्तावित फ़ाइलों और आर्किटेक्चर की समीक्षा करने का विकल्प मिलता है. अगर ज़रूरी हो, तो टिप्पणियां जोड़ें. इसके बाद, प्लान को लागू करने के लिए, आगे बढ़ें पर क्लिक करें.

एजेंट के लिए प्लान लागू करने की जानकारी

  1. एजेंट के प्लान को लागू करते समय, चैट पैनल पर नज़र रखें. एजेंट, ज़रूरी .sql फ़ाइलें और YAML कॉन्फ़िगरेशन लिखता है. जब यह प्रोसेस पूरी हो जाएगी और प्रोजेक्ट कंपाइल हो जाएगा, तब आपको बदलावों की खास जानकारी दिखेगी. इन फ़ाइलों को अपने फ़ाइल फ़ोल्डर में जोड़ने के लिए, सभी स्वीकार करें पर क्लिक करें.

एजेंट कोड में किए गए बदलावों को स्वीकार करना

  1. बाईं ओर मौजूद एक्सप्लोरर में जाकर, हाल ही में जनरेट किए गए dbt प्रोजेक्ट को एक्सप्लोर करें. आपको कुछ ऐसा स्ट्रक्चर दिखेगा:
    dbt/
    ├── models/
    │   ├── marts/
    │   │   └── fct_order_analysis.sql
    │   └── staging/
    │       ├── schema.yml
    │       ├── sources.yml
    │       ├── stg_order_items.sql
    │       └── stg_orders.sql
    ├── dbt_project.yml
    └── profiles.yml
    

File Explorer में dbt प्रोजेक्ट का स्ट्रक्चर

  1. एजेंट ने जो एसक्यूएल जनरेट किया है उसकी समीक्षा करने के लिए, .sql मॉडल फ़ाइलों पर क्लिक करें. ध्यान दें कि यह कैसे काम करता है:
    • स्टेजिंग मॉडल: सोर्स के रेफ़रंस वाले, साफ़ किए गए और नाम बदले गए कॉलम
    • मार्ट मॉडल: चैनल के हिसाब से जॉइन लॉजिक और एओवी का हिसाब लगाना
  1. एजेंट की पुष्टि के लिए चैट पैन देखें. इससे पता चलेगा कि सभी मॉडल तैयार हो गए हैं और सभी टेस्ट पास हो गए हैं. मार्ट से मिले एओवी के नतीजों से, जांच के दौरान मिली जानकारी की पुष्टि होनी चाहिए:
    - Online: ~$110
    - Offline: ~$110
    - B2B-Wholesale: ~$75 to $77
    

सेक्शन की खास जानकारी: एजेंट ने एक ही लक्ष्य-उन्मुख प्रॉम्प्ट से dbt प्रोजेक्ट बनाया: स्टेजिंग और मार्ट मॉडल तैयार किए, dbt build को सफलतापूर्वक चलाया, और एओवी की गड़बड़ी की पुष्टि की. इसके बाद, आपको एक मुश्किल सवाल पूछना है, ताकि यह देखा जा सके कि एजेंट इस सवाल का जवाब कैसे देता है.

9. टेस्ट फ़ेल होने पर, एजेंट डीबग करता है

पाइपलाइन काम करती है, लेकिन यह सिर्फ़ BigQuery डेटा का इस्तेमाल करती है. प्रॉडक्ट टीम, Cloud SQL से ग्राहक और पालतू जानवर की प्रोफ़ाइल का डेटा लेकर, विश्लेषण को बेहतर बनाना चाहती है. इससे वे खाने-पीने की ज़रूरतों के आधार पर प्रॉडक्ट का सुझाव दे सकेंगी. इसका मतलब है कि एजेंट को Cloud SQL की सीमा को पार करना होगा और डेटा मॉडलिंग से जुड़ी एक छोटी सी गड़बड़ी को ठीक करना होगा. यह गड़बड़ी, क्लासिक डाइमेंशनल मॉडलिंग "फ़ैन-आउट" जॉइन से जुड़ी है.

आपके इस्तेमाल किए जा रहे मॉडल और उसकी गहराई से विश्लेषण करने की क्षमताओं के आधार पर, एजेंट इस अनुरोध को दो तरीकों में से किसी एक तरीके से हैंडल करेगा: गड़बड़ी से पहले ही बचना (विकल्प A) या टेस्ट फ़ेलियर होने के बाद खुद ठीक होना (विकल्प B). देखते हैं कि आपका एजेंट कौनसी कार्रवाई करता है!

अनुरोध ट्रिगर करना

  1. चैट पैनल में, यह टाइप करें:
    Enrich fct_order_analysis with customer data and pet profile data from our Cloud SQL database. 
    Include customer type and each customer's pets and dietary needs so we can recommend products. 
    Keep the uniqueness test on order_id and run dbt build.
    
  2. एजेंट को काम करते हुए देखें. यह Cloud SQL टेबल का पता लगाएगा, फ़ेडरेटेड क्वेरी या मटीरियलाइज़ की गई कॉपी के ज़रिए BigQuery में डेटा को ब्रिज करने का तरीका पता लगाएगा, नए स्टेजिंग मॉडल बनाएगा, और fct_order_analysis.sql में बदलाव करेगा.

विकल्प A: प्रोऐक्टिव एजेंट (गड़बड़ी से बचने के लिए)

अगर ऐडवांस रीज़निंग मॉडल का इस्तेमाल किया जा रहा है, तो एजेंट कोई भी कोड लिखने से पहले, ग्रेन में बदलाव का पता लगा सकता है. यह समझता है कि एक ग्राहक के पास कई पालतू जानवर हो सकते हैं. इसलिए, सीधे तौर पर शामिल होने से ऑर्डर डुप्लीकेट हो जाएंगे. साथ ही, order_id पर किए गए यूनीकनेस टेस्ट में तुरंत फ़ेल हो जाएंगे.

  1. प्रोऐक्टिव एग्रीगेशन का पालन करें: Chat पैनल में दिए गए जवाब या वॉकथ्रू आर्टफ़ैक्ट में, एजेंट यह बता सकता है कि उसने "क्लासिक फ़ैन-आउट" को रोकने के लिए, पेट डेटा को शामिल करने से पहले ही एग्रीगेट कर दिया था. आम तौर पर, यह एग्रीगेशन फ़ंक्शन (जैसे, ARRAY_AGG() या STRING_AGG()) का इस्तेमाल करके, हर ग्राहक के लिए एक से ज़्यादा पालतू जानवरों की जानकारी को छोटा कर देता है.
  2. नतीजे देखें: dbt build पहली बार में ही पास हो गया, क्योंकि एजेंट ने फ़ैक्ट टेबल की बारीकी से जांच की थी. इसकी पुष्टि करने के लिए, जनरेट किया गया वॉकट्रू आर्टफ़ैक्ट देखें. इसमें अक्सर क्वेरी के नतीजों के साथ-साथ, टेस्ट के सफल नतीजे भी दिखते हैं.

इस इमेज में, एग्रीगेशन की सुविधा को चालू करने और टेस्ट के सफल होने की जानकारी दी गई है

अगर आपके एजेंट ने ऐसा किया है, तो बधाई हो! आपने एआई इंजीनियरिंग को बेहतर तरीके से काम करते हुए देखा. fct_order_analysis.sql में जनरेट किए गए एसक्यूएल की समीक्षा करें. इससे आपको पता चलेगा कि एग्रीगेशन को कैसे स्ट्रक्चर किया गया है. इसके बाद, अगले सेक्शन जवाब देना पर जाएं.

विकल्प B: सेल्फ़-हीलिंग एजेंट (डीबगिंग और डाइग्नोस्टिक्स)

अगर मॉडल, सबसे पहले एक सामान्य डायरेक्ट लेफ्ट जॉइन लिखता है, तो एसक्यूएल क्वेरी अपने-आप सही तरीके से चलेगी. हालांकि, ऑटोमेटेड dbt test सुइट, ग्रेन में हुए बदलाव का पता लगा लेगा!

  1. टेस्ट के फ़ेल होने की वजह जानें: आपको चैट पैन में, स्क्रिप्ट के एक्ज़ीक्यूशन की प्रोग्रेस के लॉग में टेस्ट के फ़ेल होने की वजह दिखेगी:
    Completed with 1 error
    
    Failure in test unique_fct_order_analysis_order_id
    Got 287 results, configured to fail if != 0
    
    order_id पर यूनीकनेस टेस्ट के दौरान, डुप्लीकेट एंट्री मिली हैं. ऐसा इसलिए हुआ, क्योंकि एक से ज़्यादा पालतू जानवर रखने वाले खरीदारों ने कई ऑर्डर किए थे.
  2. एजेंट को समस्या का पता लगाने और उसे ठीक करने दें: टेस्ट पूरा नहीं हुआ. इसलिए, एजेंट से इसे डीबग करने के लिए कहें. चैट पैनल में, यह टाइप करें:
    The uniqueness test failed. Can you figure out why and fix it?
    
  3. डेटा की जांच करना: एजेंट डेटा के बारे में क्वेरी करेगा. साथ ही, pet_profiles में एक से ज़्यादा संबंधों का पता लगाएगा. वह बताएगा कि इसे सीधे तौर पर जोड़ने से, डेटा का ग्रेन एक लाइन प्रति ऑर्डर से बदलकर एक लाइन प्रति ऑर्डर प्रति पालतू जानवर हो जाता है. इसके बाद, वह पालतू जानवरों की प्रोफ़ाइलों को पहले से एग्रीगेट करने के लिए, मॉडल को फिर से लिखेगा:
    -- Pre-aggregating pets per customer to resolve fan-out
    LEFT JOIN (
      SELECT
        customer_id,
        COUNT(*) AS num_pets,
        STRING_AGG(DISTINCT pet_type, ', ') AS pet_types,
        STRING_AGG(DISTINCT dietary_needs, ', ') AS dietary_needs
      FROM pet_profiles
      GROUP BY customer_id
    ) pet_agg ON c.customer_id = pet_agg.customer_id
    
  4. समस्या ठीक होने की पुष्टि करना: एजेंट dbt build को फिर से चलाता है. इस बार, सभी मॉडल तैयार हो जाते हैं और सभी टेस्ट पास हो जाते हैं!

सेक्शन की खास जानकारी: आपके एजेंट ने बग से बचने के लिए पहले से ही कार्रवाई की है या टेस्ट में फ़ेल होने के बाद, खुद ही समस्या ठीक कर ली है. आपने देखा कि एजेंट ने Cloud SQL की सीमा को पार किया, ग्राहक और पालतू जानवर की प्रोफ़ाइल के डेटा को इंटिग्रेट किया, और फ़ैक्ट टेबल की ग्रैन्युलैरिटी को बनाए रखा. पाइपलाइन अब मज़बूत, पूरी, और पूरी तरह से टेस्ट की जा चुकी है!

10. जवाब देना

आज गुरुवार है. आपने हफ़्ते की शुरुआत, परेशान सीएफ़ओ और तीन क्लाउड सेवाओं में बिखरे हुए डेटा के साथ की. अब आपके पास समस्या की असल वजह और प्रोडक्शन पाइपलाइन है. जवाब देने में लगने वाला समय. साथ ही, आंकड़ों के आधार पर अनुमान लगाकर, आगे के लिए सुझाव देना.

कारोबार के बारे में कम शब्दों में बताने वाली खास जानकारी लिखना

  1. चैट पैनल में, यह टाइप करें:
    Write an executive summary covering:
    - Main findings and the quantitative margin impact
    - Project AOV for the subsequent quarter if the B2B program continues at its current trajectory
    - A data-driven recommendation
    
  2. एजेंट को काम करते हुए देखें.
  3. एजेंट के बारे में कम शब्दों में दी गई खास जानकारी की समीक्षा करें. किसी सामान्य और अच्छी तरह से स्ट्रक्चर किए गए जवाब में इन बातों का ध्यान रखा जाना चाहिए:
    • मुख्य जानकारी: जनवरी में एओवी में गिरावट सिर्फ़ नए B2B-होलसेल चैनल की वजह से आई. ऑनलाइन और ऑफ़लाइन, दोनों ही तरह के स्टोर में कीमत ~110 डॉलर पर स्थिर बनी हुई है.
    • मुख्य वजह: "B2B होलसेल पुश" (एक साथ कई ऑर्डर करने पर 25% की छूट) की वजह से, 100 नए खाते बने और ~25,000 ऑर्डर मिले.
    • मार्जिन पर असर: थोक में किए गए ऑर्डर की वजह से, यूनिट के हिसाब से औसत मुनाफ़े में ~65% की कमी आई. यह कमी, ~7.50 डॉलर से ~2.60 डॉलर तक हुई.
    • रेवेन्यू: B2B के लिए ज़्यादा वॉल्यूम होने की वजह से, कुल रेवेन्यू में कोई बदलाव नहीं होता, क्योंकि कम कीमतों की वजह से होने वाले नुकसान की भरपाई हो जाती है.

AI.FORECAST फ़ंक्शन की मदद से, एओवी का अनुमान लगाना

  1. एजेंट को आगे की संभावनाओं के बारे में भी अनुमान लगाना चाहिए. एमसीपी टूल कॉल ढूंढें, जहां एजेंट BigQuery के ख़िलाफ़ AI.FORECAST क्वेरी चलाता है. यह TimesFM के बिल्ट-इन फ़ाउंडेशन मॉडल का इस्तेमाल करता है.इससे पुराने रुझानों के आधार पर, अगले 90 दिनों के लिए एओवी का अनुमान लगाया जाता है. क्वेरी में दो स्थितियों के आधार पर, अगले 90 दिनों के लिए एओवी का अनुमान लगाया जाना चाहिए: कैंपेन जारी रखना (एओवी में गिरावट) बनाम कैंपेन बंद करना (एओवी में ~110 रुपये की बढ़ोतरी).
  1. एजेंट के रणनीतिक सुझावों की समीक्षा करें. सुझावों के एक दमदार सेट में ये शामिल हो सकते हैं:
    • छूट की संरचना में बदलाव करें: यूनिट-लेवल के मार्जिन को सुरक्षित रखने के लिए, मार्जिन फ़्लोर लागू करें या एक साथ कई प्रॉडक्ट खरीदने पर मिलने वाली छूट को सीमित करें.
    • ज़्यादा से ज़्यादा एमओक्यू लागू करें: खुदरा खरीदारों को थोक कीमत का गलत इस्तेमाल करने से रोकें.
    • अलग-अलग रिपोर्टिंग: खुदरा और B2B डिवीज़न को अलग-अलग ट्रैक करें, ताकि खुदरा कारोबार की परफ़ॉर्मेंस को छिपाया न जा सके.

पूरी जानकारी

सोमवार को, ऑर्डर की औसत वैल्यू में सात प्रतिशत की गिरावट की वजह से, फ़ायर ड्रिल शुरू हुई. सीएफ़ओ के पास इसका साफ़ तौर पर समाधान है:

  • खुदरा स्वास्थ्य: खुदरा कारोबार से जुड़े मुख्य चैनल, बेसलाइन पर स्थिर बने हुए हैं.
  • थोक खरीदारों की संख्या में बढ़ोतरी: एओवी में गिरावट की वजह, नया B2B थोक चैनल और BIGORDER25 कैंपेन है.
  • मार्जिन पर असर: थोक में खरीदने पर 25% की छूट देने से, यूनिट मार्जिन में काफ़ी गिरावट आई. इससे, रेवेन्यू में कोई बदलाव न होने के बावजूद मुनाफ़े पर असर पड़ा.
  • रणनीतिक पूर्वानुमान: AI.FORECAST प्रोजेक्शन से पता चलता है कि थोक खरीदारों के लिए तय किए गए टियर को फिर से व्यवस्थित करने से, औसत ऑर्डर वैल्यू (एओवी) को वापस लाया जा सकेगा.

आपने डेटा के आधार पर सुझाव दिया है, ताकि थोक मार्जिन की कम से कम सीमा तय की जा सके. साथ ही, खुदरा/B2B रिपोर्टिंग को अलग किया जा सके.

सेक्शन की खास जानकारी: आपने एजेंट से मार्जिन विश्लेषण के साथ एक्ज़ीक्यूटिव समरी लिखने, AI.FORECAST प्रोजेक्शन जनरेट करने, और डेटा पर आधारित सुझाव देने के लिए कहा था. जांच पूरी हो गई है.

11. क्लीन अप करें

अपने Google Cloud खाते से लगातार शुल्क लिए जाने से बचने के लिए, इस कोडलैब में बनाई गई संसाधनों को मिटाएं. इसके लिए, teardown स्क्रिप्ट चलाएं.

  1. Antigravity IDE के सबसे नीचे मौजूद टर्मिनल पैनल में (या Cloud Shell में), कोडलैब डायरेक्ट्री पर जाएं और यह कमांड चलाएं:
cd ~/devrel-demos/codelabs/agentic-data-labs/scripts
chmod +x teardown.sh
./teardown.sh
  1. स्क्रिप्ट उन सभी संसाधनों को दिखाएगी जिन्हें वह मिटाने वाली है. साथ ही, आगे बढ़ने से पहले पुष्टि करने के लिए कहेगी:
    • Cloud SQL इंस्टेंस (cymbal-pets-ops): यह सबसे महंगा संसाधन है
    • BigQuery डेटासेट (cymbal_pets): सभी टेबल और मॉडल
    • Cloud Storage बकेट (gs://YOUR_PROJECT_ID-cymbal-pets-raw)
    • BigQuery कनेक्शन (cymbal-pets-cloudsql)
  2. पुष्टि करने के लिए, y टाइप करें. इसे हटाने में करीब दो से तीन मिनट लगते हैं.
[INFO]  Deleting Cloud SQL instance cymbal-pets-ops...
[ OK ]  Cloud SQL instance deleted.
[INFO]  Deleting BigQuery dataset cymbal_pets...
[ OK ]  BigQuery dataset deleted.
[INFO]  Deleting GCS bucket gs://YOUR_PROJECT_ID-cymbal-pets-raw...
[ OK ]  GCS bucket deleted.

12. बधाई हो!

आपने द सिंबल पेट्स इन्वेस्टिगेशन पूरा कर लिया है! आपने सीएफ़ओ के एक सामान्य सवाल से लेकर, पूरी तरह से काम करने वाले एआई एजेंट का इस्तेमाल करके, अनुमान पर आधारित सुझाव तक का सफ़र तय किया. यह एआई एजेंट, आपके पूरे Google Cloud डेटा एस्टेट पर काम करता है.

आपने क्या-क्या हासिल किया

  1. 🔍 सभी सेवाओं में एक्सप्लोर किया गया: डेटा एजेंट किट के नॉलेज कैटलॉग का इस्तेमाल करके, BigQuery, Cloud SQL, और Cloud Storage में ऐसेट का पता लगाया गया और उनकी झलक देखी गई.
  2. 🕵️‍♂️ एआई की मदद से जांच की गई: एमसीपी टूल का इस्तेमाल करके, एक ही चैट पैनल बातचीत में कई सेवाओं से क्वेरी की गई. इससे, बी-टू-बी प्रमोशन वाले किसी बड़े कैंपेन में एओवी की अनियमितता का पता लगाया जा सका.
  3. 🔧 प्रोडक्शन पाइपलाइन बनाई: लेन-देन और ग्राहक से जुड़े डेटा को साफ़ करने, जोड़ने, और उसकी जाँच करने के लिए, पूरा dbt प्रोजेक्ट बनाया.
  4. 🐛 फ़ैन-आउट बग को डीबग किया गया: एजेंट ने बारीकी से जांच करके, फ़ैन-आउट बग का पता लगाया. साथ ही, dbt एसक्यूएल मॉडल को फिर से फ़ैक्टर किया, ताकि ग्राहक के पालतू जानवरों की प्रोफ़ाइल को पहले से एग्रीगेट किया जा सके.
  5. 📈 अनुमानित और सुझाई गई: एओवी के रुझानों का मॉडल बनाने के लिए, BigQuery के बिल्ट-इन AI.FORECAST का इस्तेमाल किया गया. साथ ही, सीएफ़ओ को डेटा पर आधारित सुझाव दिया गया.

मुख्य सिद्धांत

सिद्धांत

आपने क्या सीखा

MCP टूल

सुरक्षित और ऑडिट किए जा सकने वाले कनेक्शन. इनकी मदद से, एआई एजेंट आपकी ओर से BigQuery, Cloud SQL, Spanner, और अन्य डेटाबेस जैसी सेवाओं से क्वेरी कर सकता है. हर कॉल, चैट पैनल में दिखता है

एजेंट की स्किल

पहले से बने निर्देशों के सेट (जैसे, dbt-bigquery या discovering-gcp-data-assets). इनसे एजेंट को, डोमेन के हिसाब से सबसे सही तरीके सिखाए जाते हैं. इसके लिए, आपको प्रॉम्प्ट देने की ज़रूरत नहीं होती

अलग-अलग सेवाओं से जुड़ी जांच

एजेंट, एक ही बातचीत में Google Cloud की कई सेवाओं के बारे में क्वेरी करता है. इसके लिए, न तो कनेक्शन सेटअप करने की ज़रूरत होती है और न ही कंसोल के बीच कॉन्टेक्स्ट स्विच करने की

लक्ष्य के हिसाब से प्रॉम्प्ट देना

एजेंट को यह बताना कि आपको क्या चाहिए ("ऐसा dbt प्रोजेक्ट बनाओ जो चैनल के हिसाब से AOV का हिसाब लगाए"), न कि कैसे. साथ ही, उसे लागू करने का तरीका चुनने देना

डेटा एजेंट किट

यह एक्सटेंशन, MCP टूल, एजेंट की क्षमताओं, और डेटा डिस्कवरी को एक साथ जोड़ता है. इससे आपको अपने चुने हुए आईडीई में, Google Cloud के पूरे डेटा एस्टेट को ऐक्सेस करने की सुविधा मिलती है

अगले चरण