Google Forms के सर्वे के जवाबों को BigQuery में बदलना और लोड करें

1. परिचय

सर्वे करने की कई वजहें हैं: ग्राहक की संतुष्टि का आकलन करना, मार्केट रिसर्च करना, प्रॉडक्ट या सेवा को बेहतर बनाना या कर्मचारी की दिलचस्पी का आकलन करना. हालांकि, अगर आपने पहले कभी सर्वे के डेटा पर काम करने की कोशिश की है, तो हो सकता है कि आप यह समझ पाएं कि स्टैंडर्ड फ़ॉर्मैट के साथ काम करना मुश्किल है. इस गाइड में, हमने एक ऑटोमेटेड पाइपलाइन बनाई है, जो Google Forms के नतीजे कैप्चर करती है, Cloud Dataprep की मदद से डेटा को विश्लेषण के लिए तैयार करती है, उसे BigQuery में लोड करती है, और आपकी टीम को Looker या Data Studio जैसे टूल का इस्तेमाल करके विज़ुअल विश्लेषण करने की अनुमति देती है.

आपको क्या बनाना होगा

इस कोडलैब में, आपको Dataprep का इस्तेमाल करके, उदाहरण के तौर पर दिए गए Google Forms के सर्वे में मिले जवाबों को ऐसे फ़ॉर्मैट में बदलना होगा जो डेटा के आंकड़ों के लिए काम का हो. आपको बदले गए डेटा को BigQuery में भेजना होगा. यहां एसक्यूएल के साथ ज़्यादा बारीकी से सवाल पूछे जा सकते हैं और बेहतर विश्लेषण के लिए उसे दूसरे डेटासेट के साथ जोड़ा जा सकता है. आखिर में, पहले से बने डैशबोर्ड को एक्सप्लोर किया जा सकता है. इसके अलावा, नई रिपोर्ट बनाने के लिए, अपने बिज़नेस इंटेलिजेंस टूल को BigQuery से कनेक्ट किया जा सकता है.

आपको इनके बारे में जानकारी मिलेगी

  • Dataprep का इस्तेमाल करके, सर्वे के डेटा को बदलने का तरीका
  • सर्वे डेटा को BigQuery में पुश करने का तरीका
  • सर्वे के डेटा से ज़्यादा जानकारी पाने का तरीका

आपको इनकी ज़रूरत होगी

  • ऐसा Google Cloud प्रोजेक्ट जिसमें बिलिंग, BigQuery, और Dataprep चालू हो
  • Dataprep की बुनियादी जानकारी काम की है. हालांकि, यह ज़रूरी नहीं है
  • BigQuery और एसक्यूएल की बुनियादी जानकारी काम की है, लेकिन यह ज़रूरी नहीं है

2. Google Forms के जवाबों को मैनेज करना

हम हमारे सर्वे के उदाहरण में, Google फ़ॉर्म से मिले जवाबों को बारीकी से देखेंगे.

f3d25efd2cc923f5.png

सर्वे के नतीजे, "जवाबों" से एक्सपोर्ट किए जा सकते हैं टैब, Google शीट आइकन पर क्लिक करके और एक नई स्प्रेडशीट बनाकर या परिणामों को किसी मौजूदा स्प्रेडशीट में लोड करके. जब तक आप "जवाब स्वीकार करना" से चुने हुए का निशान नहीं हटाते हैं, तब तक Google Forms अपने जवाब को स्प्रेडशीट में जोड़ेगा बटन.

d499e5a4dccdf5fd.png

4939332a5d8f9f19.png

चलिए, अब हर टाइप के जवाब और Google Sheets फ़ाइल में उसके अनुवाद के बारे में जानते हैं.

3. सर्वे के जवाबों को बदलें

सर्वे के सवालों को चार फ़ैमिली ग्रुप में रखा जा सकता है. इन सवालों को एक्सपोर्ट करने के लिए, अलग-अलग फ़ॉर्मैट का इस्तेमाल किया जाएगा. सवाल के हिसाब से, आपको डेटा को खास तरीके से फिर से तैयार करना होगा. यहां हम हर ग्रुप की समीक्षा करते हैं. साथ ही, यह भी बताते हैं कि किस तरह के बदलाव लागू करने हैं.

एक विकल्प वाले सवाल: छोटा जवाब, पैराग्राफ़, ड्रॉपडाउन, लीनियर स्केल वगैरह

  • सवाल का नाम: कॉलम का नाम
  • जवाब: सेल की वैल्यू
  • बदलाव की ज़रूरी शर्तें: किसी बदलाव की ज़रूरत नहीं है; तो रिस्पॉन्स कैसे लोड होता है.

3eeedc50b0fd54fd.png

कई विकल्पों वाले सवाल: कई विकल्प, चेकबॉक्स

  • सवाल का नाम: कॉलम का नाम
  • रिस्पॉन्स: सेमीकोलन सेपरेटर के साथ वैल्यू की सूची (उदाहरण के लिए, "Resp 1; Resp 4; Resp 6")
  • बदलाव की ज़रूरी शर्तें: वैल्यू की सूची को एक्सट्रैक्ट करना और पिवट करना ज़रूरी है, ताकि हर जवाब एक नई पंक्ति बन जाए.

cab8a38a96a13ce4.png

कई विकल्पों वाले ग्रिड से जुड़े सवाल

यहां कई विकल्प वाले सवाल का एक उदाहरण दिया गया है. आपको हर लाइन से एक वैल्यू चुननी होगी.

c6ea3d47d4dd5e78.png

  • सवाल का नाम: हर सवाल, "सवाल [Option]" फ़ॉर्मैट के साथ कॉलम का नाम बन जाता है.
  • रिस्पॉन्स: ग्रिड में मौजूद हर रिस्पॉन्स, एक यूनीक वैल्यू वाला कॉलम बन जाता है.
  • बदलाव की ज़रूरी शर्तें: टेबल में हर सवाल/जवाब एक नई पंक्ति में बना होना चाहिए और उसे दो कॉलम में बांटा जाना चाहिए. एक कॉलम में सवाल के विकल्प के बारे में बताया गया है और दूसरे कॉलम में जवाब के बारे में बताया गया है.

9223d0271516c58d.png

कई विकल्पों वाले चेकबॉक्स के ग्रिड से जुड़े सवाल

यहां चेकबॉक्स ग्रिड का एक उदाहरण दिया गया है. हर पंक्ति में से एक या उससे ज़्यादा वैल्यू चुनी जा सकती हैं.

4e3189b8cc2d4a8b.png

  • सवाल का नाम: हर सवाल, "सवाल [Option]" फ़ॉर्मैट के साथ कॉलम का नाम बन जाता है..
  • रिस्पॉन्स: ग्रिड में मौजूद हर रिस्पॉन्स, सेमी-कोलन से अलग की गई वैल्यू की लिस्ट के साथ एक कॉलम बन जाता है.
  • बदलाव की ज़रूरी शर्तें: इन सवालों के टाइप में "चेकबॉक्स" शामिल होता है और "एक से ज़्यादा विकल्प ग्रिड" और इसी क्रम में इन्हें हल किया जाना चाहिए.

पहले, हर जवाब की वैल्यू की सूची को एक्सट्रैक्ट करना और बदलना होगा, ताकि हर जवाब किसी सवाल के लिए एक नई लाइन बन जाए.

दूसरा: हर जवाब, टेबल में एक नई लाइन में बना होना चाहिए और उसे दो कॉलम में बांट दिया जाना चाहिए. एक कॉलम में सवाल के विकल्प का ज़िक्र है और दूसरे कॉलम में जवाब है.

3c3c2bd098e03003.png

इसके बाद, हम आपको Cloud Dataprep के साथ इन बदलावों को हैंडल करने का तरीका बताएंगे.

4. Cloud Dataprep फ़्लो बनाएं

"Google Forms Analytics डिज़ाइन पैटर्न" इंपोर्ट करना में Cloud Dataprep में

Google Forms Analytics डिज़ाइन पैटर्न फ़्लो पैकेज डाउनलोड करें (अनज़िप किए बिना). Cloud Dataprep ऐप्लिकेशन में, बाईं ओर दिए गए नेविगेशन बार में फ़्लो आइकॉन पर क्लिक करें. इसके बाद, फ़्लो पेज पर जाकर, संदर्भ मेन्यू से 'इंपोर्ट करें' चुनें.

ba7c0cb0eec398df.png

फ़्लो इंपोर्ट करने के बाद, उसमें बदलाव करने के लिए इंपोर्ट किए गए फ़्लो को चुनें. इसके बाद, आपकी स्क्रीन कुछ इस तरह दिखेगी:

44978861eb34ec71.png

Google Sheets के सर्वे के नतीजों की स्प्रेडशीट कनेक्ट करना

फ़्लो के बाईं ओर, डेटा सोर्स को उस Google Sheets से फिर से कनेक्ट करना होगा जिसमें Google Forms के नतीजे हों. Google शीट के डेटासेट ऑब्जेक्ट पर राइट क्लिक करें और "बदलें" चुनें.

55c16f0c04366f0c.png

इसके बाद, "डेटासेट इंपोर्ट करें" पर क्लिक करें मॉडल के निचले हिस्से पर मौजूद लिंक पर क्लिक करें. "पाथ में बदलाव करें" पर क्लिक करें पेंसिल.

8afeef260c96277f.png

इसके बाद, मौजूदा वैल्यू को इस लिंक से बदलें, जो Google Forms के कुछ नतीजों से Google Sheets पर ले जाता है. हमारे उदाहरण या अपनी कॉपी का इस्तेमाल करें: https://docs.google.com/spreadsheets/d/1DgIlvlLceFDqWEJs91F8rt1B-X0PJGLY6shkKGBPWpk/edit?usp=sharing

"जाएं" पर क्लिक करें और फिर "इंपोर्ट करें और फ़्लो में जोड़ें" टैप करें. मॉडल पर वापस आने के बाद, "बदलें" पर क्लिक करें बटन पर क्लिक करें.

BigQuery टेबल को कनेक्ट करना

फ़्लो के दाईं ओर, आपको आउटपुट को अपने BigQuery इंस्टेंस से जोड़ना होगा. हर आउटपुट के लिए, आइकॉन पर क्लिक करें और फिर उसकी प्रॉपर्टी में इस तरह से बदलाव करें.

सबसे पहले, "मैन्युअल डेस्टिनेशन" में बदलाव करके शुरू करें

a3fc2cb80153ec25.png

नीचे दी गई "पब्लिश करने की सेटिंग" में स्क्रीन, 'बदलाव करें' बटन पर क्लिक करें

85791e6162a370de.png

"पब्लिश करने की कार्रवाई" दिखने पर स्क्रीन के लिए, आपको BigQuery कनेक्शन पर क्लिक करके और उसकी प्रॉपर्टी में बदलाव करके कनेक्शन सेटिंग बदलनी होगी.

1f3e4887baaeaffd.png

वह BigQuery डेटासेट चुनें जिसमें आपको Google Forms के नतीजे लोड करने हैं. "डिफ़ॉल्ट" को चुना जा सकता है अगर आपने अब तक BigQuery डेटासेट नहीं बनाया है.

f4eaa05ecf9de162.png

"मैन्युअल डेस्टिनेशन" में बदलाव करने के बाद, "शेड्यूल किए गए डेस्टिनेशन" के लिए भी उसी तरीके पर जाएं आउटपुट.

46edea1b8ca63270.png

समान चरणों का पालन करते हुए हर आउटपुट के लिए दोहराना. कुल मिलाकर, आपको 8 डेस्टिनेशन में बदलाव करना होगा.

5. Cloud Dataprep फ़्लो के बारे में जानकारी

"Google Forms के Analytics डिज़ाइन पैटर्न" का बुनियादी आइडिया इस फ़्लो का इस्तेमाल, सर्वे के जवाबों में बदलाव करने के लिए किया जाता है, जैसा कि पहले बताया गया है. ऐसा करने के लिए, सवाल की हर कैटगरी को Cloud Dataprep के डेटा को बदलने की खास रेसिपी में बांटा जाता है.

इस फ़्लो में, सवालों को चार टेबल में बांट दिया जाता है. आसान तरीके से समझने के लिए, सवालों की चार कैटगरी के हिसाब से ऐसा किया जाता है

afa421849b1bd398.png

हमारा सुझाव है कि आप "क्लीन हेडर" से शुरू होने वाली हर रेसिपी को एक-एक करके एक्सप्लोर करें और फिर "SingleChoiceSELECT-Questions" और फिर एक-दूसरे की रेसिपी बताई गई हैं.

सभी रेसिपी पर टिप्पणियां की जाती हैं, ताकि बदलाव के अलग-अलग चरणों के बारे में बताया जा सके. रेसिपी के दौरान, आपके पास किसी चरण में बदलाव करने और किसी कॉलम में पहले/बाद की स्थिति की झलक देखने का विकल्प होता है.

449da06d96cd520e.png

4ac6e14f578d0707.png

6. Cloud Dataprep फ़्लो चलाएं

अब आपका सोर्स और डेस्टिनेशन सही तरीके से कॉन्फ़िगर हो गए हैं. इसलिए, अब रिस्पॉन्स को BigQuery में बदलने और लोड करने के लिए फ़्लो चलाया जा सकता है. हर एक आउटपुट को चुनें और "Run" पर क्लिक करें बटन. अगर दी गई BigQuery टेबल मौजूद है, तो Dataprep नई पंक्तियां जोड़ेगा. ऐसा न होने पर, एक नई टेबल बन जाएगी.

47cf50f6d17a5b1e.png

"नौकरी का इतिहास" पर क्लिक करें आइकॉन पर क्लिक करें. आगे बढ़ने और BigQuery टेबल लोड होने में कुछ मिनट लगेंगे.

afc79eeb27202fb4.png

सभी जॉब के पूरे होने के बाद, सर्वे के नतीजे, विश्लेषण के लिए तैयार साफ़, व्यवस्थित, और नॉर्मलाइज़ किए गए फ़ॉर्मैट में BigQuery में लोड किए जाएंगे.

7. BigQuery में सर्वे डेटा का विश्लेषण करना

BigQuery के लिए Google Console में, आपको हर नई टेबल की जानकारी दिखेगी

df370873572511ac.png

BigQuery में सर्वे के डेटा की मदद से, आप सर्वे के जवाबों को गहराई से समझने के लिए आसानी से ज़्यादा बेहतर सवाल पूछ सकते हैं. उदाहरण के लिए, मान लें कि आपको यह समझने की कोशिश करनी है कि अलग-अलग प्रोफ़ेशनल टाइटल वाले लोग, आम तौर पर किस प्रोग्रामिंग भाषा का इस्तेमाल करते हैं. आप इस तरह की कोई क्वेरी लिख सकते हैं:

SELECT
   programming_answers.Language  AS programming_answers_language,
   project_answers.Title  AS project_answers_title,
   AVG((case when programming_answers.Level='None' then 0 
when programming_answers.Level='beginner' then 1
when programming_answers.Level='competent' then 2 
when programming_answers.Level='proficient' then 3
when programming_answers.Level='expert' then 4 
else null end) ) AS programming_answers_average_level_value
FROM `my-project.DesignPattern.A000111_ProjectAnswers` AS project_answers
INNER JOIN `my-project.A000111_ProgrammingAnswers` AS programming_answers
ON programming_answers.RESPONSE_ID = project_answers.RESPONSE_ID
GROUP BY 1,2
ORDER BY 3 DESC

अपने विश्लेषणों को और ज़्यादा कारगर बनाने के लिए, आप ग्राहक प्रबंधन (सीआरएम) डेटा पर सर्वे के जवाबों में शामिल हो सकते हैं, ताकि यह देख सकें कि भागीदार किसी ऐसे खाते को मैप कर रहे हैं या नहीं जो पहले से आपके डेटा वेयरहाउस में शामिल है. इससे आपके कारोबार को, ग्राहक सहायता या नए लॉन्च के लिए उपयोगकर्ताओं को टारगेट करने के बारे में सोच-समझकर फ़ैसला लेने में मदद मिल सकती है.

यहां हम दिखाते हैं कि जवाब देने वाले व्यक्ति के डोमेन और खाते की वेबसाइट के आधार पर, खाते की टेबल पर सर्वे के डेटा को कैसे जोड़ा जा सकता है. अब खाता टाइप के हिसाब से, जवाबों का डिस्ट्रिब्यूशन देखा जा सकता है. इससे आपको यह समझने में मदद मिलती है कि जवाब देने वाले कितने लोग मौजूदा ग्राहक खातों से जुड़े हैं.

SELECT
   account.TYPE  AS account_type,
   COUNT(DISTINCT project_answers.Domainname) AS project_answers_count_domains
FROM `my-project.A000111_ProjectAnswers` AS project_answers
LEFT JOIN `my-project.testing.account` AS account 
ON project_answers.Domainname=account.website
GROUP BY 1

8. विज़ुअल ऐनलिटिक्स

अब सर्वे का डेटा, डेटा वेयरहाउस में मौजूद है. इसलिए, बिज़नेस इंटेलिजेंस टूल में इस डेटा का विश्लेषण आसानी से किया जा सकता है. हमने Data Studio और Looker में, उदाहरण के तौर पर कुछ रिपोर्ट बनाई हैं.

Looker

अगर आपके पास पहले से Looker इंस्टेंस है, तो इस पैटर्न के लिए सैंपल सर्वे और सीआरएम डेटा का विश्लेषण शुरू करने के लिए, इस फ़ोल्डर में LookML का इस्तेमाल करें. बस एक नया Looker प्रोजेक्ट बनाएं, LookML जोड़ें, और अपने BigQuery कॉन्फ़िगरेशन से मैच करने के लिए, फ़ाइल में कनेक्शन और टेबल के नाम बदलें. अगर आपके पास Looker इंस्टेंस नहीं है और आपको इस बारे में ज़्यादा जानना है, तो यहां डेमो शेड्यूल करें.

129db05d6f85f484.png

Data Studio

इसके अलावा, Data Studio में रिपोर्ट बनाने के लिए, Google क्रॉस "खाली रिपोर्ट" वाले फ़्रेम पर क्लिक करें और BigQuery से कनेक्ट करते हैं. Data Studio में दिए गए सभी निर्देशों का पालन करें. अगर आपको ज़्यादा जानकारी चाहिए, तो आसानी से सिखाने के साथ-साथ Data Studio की मुख्य सुविधाओं के बारे में जानकारी यहां देखें. यहां पर आपको पहले से बने Data Studio के डैशबोर्ड भी मिल सकते हैं.

5e744869e3fe3f8f.png

9. साफ़ हो रहा है

ट्यूटोरियल के लिए बनाए गए क्लाउड प्रोजेक्ट को मिटाना, बिलिंग की जानकारी आसानी से हटाने का सबसे आसान तरीका है. इसके अलावा, अलग-अलग संसाधनों को मिटाया भी जा सकता है.

  1. Cloud Console में, संसाधनों को मैनेज करें पर जाएं
  2. प्रोजेक्ट की सूची में, वह प्रोजेक्ट चुनें जिसे मिटाना है. इसके बाद, मिटाएं पर क्लिक करें.
  3. डायलॉग बॉक्स में, प्रोजेक्ट आईडी टाइप करें. इसके बाद, प्रोजेक्ट मिटाने के लिए, शट डाउन करें पर क्लिक करें.