تجسم داده های BigQuery خود در Data Studio

۱. مقدمه

دیتا استودیو و بیگ‌کوئری با هم ترکیبی قدرتمند را تشکیل می‌دهند که به شما امکان می‌دهد داشبوردهایی ایجاد کنید که کاربران را قادر می‌سازد اطلاعات و بینش‌های موجود در داده‌های شما را درک کنند. این داشبوردها را می‌توان به راحتی با استفاده از رابط کاربری آشنای گوگل درایو به اشتراک گذاشت و برای توزیع گسترده‌تر، در سایت‌ها جاسازی کرد.

دیتا استودیو چیست؟

دیتا استودیو ابزار رایگان گوگل برای مصورسازی داده‌ها است که به شما امکان می‌دهد:

  • داده‌های خود را از طریق نمودارها و جداول بسیار قابل تنظیم، تجسم کنید .
  • به سرعت و به راحتی به منابع داده مختلف متصل شوید .
  • بینش‌های خود را با تیم خود یا با جهان به اشتراک بگذارید .
  • با تیم خود روی گزارش‌ها همکاری کنید .
  • با گزارش‌های نمونه داخلی و تجسم‌های انجمن، گزارش‌ها را حتی سریع‌تر ایجاد کنید

این آزمایشگاه کد، شما را در اتصال BigQuery و Data Studio برای ایجاد داشبوردها و گزارش‌هایی که می‌توانند به شما در درک بهتر داده‌هایتان کمک کنند، راهنمایی می‌کند. ما از مجموعه داده‌های عمومی از برنامه Cloud Public Datasets برای نشان دادن نحوه انجام این کار استفاده خواهیم کرد.

آنچه خواهید ساخت

در این آزمایشگاه کد، شما یک داشبورد Data Studio خواهید ساخت. داشبورد شما با اتصال BigQuery به Data Studio و تعیین بهترین انواع مصورسازی برای مجموعه داده، یک مجموعه داده عمومی BigQuery را مصورسازی خواهد کرد.

آنچه یاد خواهید گرفت

  • نحوه اتصال BigQuery و Data Studio
  • چگونه داده‌ها را در Data Studio مصورسازی کنیم

آنچه نیاز دارید

  • یک حساب کاربری گوگل کلود. اگر از قبل حساب کاربری ندارید، می‌توانید به سرعت و بدون نیاز به کارت اعتباری در BigQuery sandbox ثبت نام کنید.
  • دانش پایه SQL مفید است، اما الزامی نیست
  • درک اولیه از بهترین شیوه‌های مصورسازی داده‌ها

۲. راه‌اندازی

دسترسی به مجموعه داده‌های عمومی BigQuery

برای این آزمایشگاه کد، شما ۳۱۱ درخواست از شهر سانفرانسیسکو را مصورسازی خواهید کرد. این مجموعه داده، به همراه بیش از ۱۵۰ مجموعه داده دیگر، از طریق برنامه مجموعه داده‌های عمومی BigQuery در دسترس هستند. برای یافتن مجموعه داده‌های دیگر، کل کاتالوگ مجموعه داده‌های موجود را بررسی کنید. مجموعه داده درخواست‌های ۳۱۱ که ما استفاده می‌کنیم، نماینده خوبی برای نوع درخواست‌های خدمات مشتری است که بسیاری از شرکت‌ها باید مدیریت کنند.

راه‌اندازی پروژه گوگل کلود شما

در کنسول ابری ، در صفحه انتخاب پروژه، یک پروژه ابری را انتخاب یا ایجاد کنید. این گزینه در منوی کشویی در قسمت بالای سمت چپ صفحه نمایش موجود است. مطمئن شوید که صورتحساب برای پروژه گوگل ابری شما فعال است. یاد بگیرید که چگونه تأیید کنید که صورتحساب برای پروژه شما فعال است .

4378f8fd21828a66.png

۳. اتصال دیتا استودیو و بیگ‌کوئری

دیتا استودیو چیست؟

دیتا استودیو ابزار رایگان تجسم داده‌های گوگل است که به کاربران کمک می‌کند تا قدرت داده‌های خود را با داشبوردهای تعاملی و گزارش‌های جذاب که الهام‌بخش تصمیمات تجاری هوشمندانه‌تر هستند، آزاد کنند. شما می‌توانید از طریق بیش از ۲۰۰ رابط که مستقیماً در دیتا استودیو تعبیه شده‌اند، به بیش از ۵۰۰ مجموعه داده متصل شوید. این رابط‌ها شامل رابط‌هایی به محصولات گوگل مانند گوگل آنالیتیکس، بیگ‌کوئری و شیت و همچنین منابع داده خارجی می‌شوند.

بیگ‌کوئری چیست؟

بیگ‌کوئری (BigQuery) انبار داده ابری گوگل کلود (Google Cloud) است که به طور کامل مدیریت می‌شود، بسیار مقیاس‌پذیر است و برای چابکی کسب‌وکار طراحی شده است. بیگ‌کوئری شما را قادر می‌سازد تا با استفاده از ANSI SQL، پتابایت‌ها داده را با سرعت بسیار بالا تجزیه و تحلیل کنید، با تجزیه و تحلیل‌های پیش‌بینی‌کننده و بلادرنگ به بینش دست یابید و به راحتی به داده‌ها دسترسی پیدا کنید و بینش‌ها را به اشتراک بگذارید. همه اینها بدون سربار عملیاتی انجام می‌شود.

ایجاد منبع داده

اولین قدم برای ایجاد یک گزارش در Data Studio، ایجاد یک منبع داده برای گزارش است. یک گزارش ممکن است شامل یک یا چند منبع داده باشد. وقتی یک منبع داده BigQuery ایجاد می‌کنید، Data Studio از رابط BigQuery استفاده می‌کند.

برای افزودن منبع داده BigQuery به گزارش Data Studio، باید مجوزهای لازم را داشته باشید. علاوه بر این، مجوزهای اعمال شده بر مجموعه داده‌های BigQuery، بر گزارش‌ها، نمودارها و داشبوردهایی که در Data Studio ایجاد می‌کنید نیز اعمال خواهد شد. هنگامی که یک گزارش Data Studio به اشتراک گذاشته می‌شود، اجزای گزارش فقط برای کاربرانی که مجوزهای لازم را دارند قابل مشاهده هستند.

برای ایجاد یک منبع داده:

  1. استودیوی داده باز.
  2. در صفحه گزارش‌ها ، در قسمت «شروع با یک الگو» ، روی الگوی خالی کلیک کنید. این یک گزارش جدید بدون عنوان ایجاد می‌کند.

801a709b4a392db7.png

  1. در صورت درخواست، تنظیمات بازاریابی و تنظیمات حساب و حریم خصوصی را تکمیل کنید و سپس روی ذخیره کلیک کنید. ممکن است لازم باشد پس از ذخیره تنظیمات، دوباره روی الگوی خالی کلیک کنید.
  2. در پنجره «افزودن داده به گزارش» ، بخش «اتصال به داده» را مشاهده کنید و با کلیک روی «BigQuery» را انتخاب کنید.

3fb927eb5317986e.png

  1. برای مجوزدهی (Authorization) ، روی مجوزدهی (Authorize) کلیک کنید. این به Google Data Studio اجازه می‌دهد تا به پروژه‌های GCP شما دسترسی داشته باشد.
  2. در پنجره‌ی درخواست مجوز ، روی «اجازه دادن» کلیک کنید تا به Google Data Studio امکان مشاهده‌ی داده‌ها در BigQuery داده شود. اگر قبلاً از Google Data Studio استفاده کرده‌اید، ممکن است این پیام را دریافت نکنید.
  3. در منوی سمت چپ، خواهید دید که به طور پیش‌فرض «پروژه‌های من» انتخاب شده است. انتخاب خود را به «مجموعه داده‌های عمومی» تغییر دهید.
  4. برای پروژه صورتحساب ، روی نام پروژه GCP که قبلاً ایجاد کرده‌اید کلیک کنید.
  5. در قسمت مجموعه داده‌های عمومی ، روی san_francisco_311 کلیک کنید.
  6. برای جدول، روی 311_service_requests کلیک کنید.
  7. در گوشه پایین سمت راست پنجره، روی افزودن کلیک کنید. اگر کادر محاوره‌ای با عنوان «شما در حال اضافه کردن داده‌ها به این گزارش هستید» ظاهر شد، برای ادامه روی «افزودن به گزارش» کلیک کنید.
  8. در منوی Data Studio، در قسمت Resources، روی Manage added data sources کلیک کنید. c1aadb68dd5bf34f.png
  9. برای مشاهده فیلدهای جدول و انواع داده‌های آنها، روی ویرایش در کنار 311_service_requests در صفحه منابع داده کلیک کنید. می‌توانید از این صفحه برای تنظیم ویژگی‌های فیلد یا ایجاد فیلدهای محاسباتی جدید استفاده کنید. f0250903710fc9ed.png
  10. این مجموعه داده شامل نقطه جغرافیایی داخلی هر محله است که به گونه‌ای نمایش داده می‌شود که Data Studio بتواند به صورت بومی از آن استفاده کند. در کنار فیلد neighborhood_center_ds ، نوع داده را با کلیک روی text و سپس انتخاب Latitude و Longitude از فیلد کشویی Geo تغییر دهید. این به Data Studio می‌گوید که فیلد داده ما باید به صورت جغرافیایی نمایش داده شود.

۱f۹۷۹cf۵۴۶۸۱ae۱۲.png

اکنون مجموعه داده BigQuery خود را به Data Studio متصل کرده‌اید!

۴. ایجاد تجسم‌هایتان

اکنون که با موفقیت مجموعه داده‌های BigQuery خود را متصل کرده‌اید (در این مورد، درخواست‌های BigQuery Public Dataset San Francisco 311 )، می‌توانید تجسم داده‌ها را شروع کنید. Data Studio به طور خودکار اولین تجسم شما را بر اساس داده‌هایتان ایجاد می‌کند. می‌توانید فعلاً آن را حذف کنید تا یک الگوی خالی ایجاد شود.

۹۴aea5bb5fc4ffe1.png

ایجاد نقشه درختی

ما با ایجاد یک نقشه درختی شروع می‌کنیم تا تجسم کنیم که چه نوع درخواست ۳۱۱ بیشتر انجام می‌شود. این کار با بیان اینکه روی کدام نوع درخواست‌ها تمرکز کنیم، نقطه شروعی برای تجسم‌های دیگر به ما می‌دهد.

  1. از منوی Data Studio روی Add a chart کلیک کنید، سپس Treemap را در پایین انتخاب کنید. ممکن است لازم باشد برای پیدا کردن آن به پایین اسکرول کنید.

۶۷۷۶۶۳۹۰۶bdd050f.png ۲. دیتا استودیو به شما این امکان را می‌دهد که روی یک ناحیه از بوم کلیک کنید یا آن را بکشید تا تجسم خود را ایجاد کنید. با قرار دادن آن در گوشه پایین سمت چپ داشبورد شروع کنید. دیتا استودیو به طور خودکار با حدس زدن فیلدهایی که می‌خواهید شامل شوند، یک نقشه درختی ایجاد می‌کند.

c593d3313b5ce89.png ۳. برای ایجاد تغییرات در داده‌های تجسم‌شده، روی نقشه درختی کلیک کنید. در پنل سمت راست صفحه، پارامترها را تغییر دهید تا با تجسم زیر مطابقت داشته باشند.

869db54f9ef19ea3.png

  1. روی Style در بالای پنل کلیک کنید. ما از این برای ایجاد برخی تغییرات جزئی جهت خواناتر کردن treemap استفاده خواهیم کرد. بیایید رنگ انواع درخواست با بیشترین مقادیر را تغییر دهیم. روی دکمه‌ای که در زیر هایلایت شده است کلیک کنید و سایه آبی با علامت تیک را انتخاب کنید. این کار کنتراست بهتری با متن treemap به ما می‌دهد.

db4e4505d51f1539.pngc04e33d3aa35e7b.png ۵. پس از تکمیل، داشبورد شما باید چیزی شبیه به این باشد:

af147fc5a4c40d15.png

۵. ساخت داشبورد

یکی از اهداف اصلی داشبورد، فراهم کردن امکان گزارش‌دهی آسان از معیارها به صورت مقیاس‌پذیرتر برای پشتیبانی از تصمیم‌گیری است. ما این کار را با گنجاندن داده‌ها و معیارهای لازم برای فراهم کردن زمینه مناسب برای یک مجموعه داده در قالبی که به راحتی قابل درک باشد، انجام می‌دهیم.

بیایید با اضافه کردن چند عنصر برای آسان‌تر کردن درک و تفسیر این اطلاعات، داشبورد خود را بسازیم. بیایید با اضافه کردن نقشه‌ای که نشان می‌دهد کدام محله‌ها بیشترین درخواست کلی را دارند و کارت‌های امتیازی که تعداد کل درخواست‌ها را برای ۳ نوع درخواست برتر به ما نشان می‌دهد، شروع کنیم.

اضافه کردن نقشه به داشبورد

  1. روی افزودن نمودار در منو کلیک کنید، سپس از منوی کشویی ، Google Maps را انتخاب کنید. همچنین می‌توانید از Geo Map استفاده کنید، اما بصری‌سازی‌های Google Maps زمینه بیشتری را فراهم می‌کنند که آن را برای این مورد استفاده مناسب‌تر می‌کند.

806f9ddfe45a242c.png ۲. نمودار را به همان روشی که نقشه درختی را اضافه کردید، به قسمت پایین سمت راست داشبورد اضافه کنید. ۳. نقشه را در داشبورد انتخاب کنید تا پارامترهای آن را تغییر دهید. سپس گزینه‌های زیر برگه Data را تغییر دهید تا با انتخاب‌های زیر مطابقت داشته باشند. برای انجام این کار، فیلد "محله" را به بعد Tooltip و "تعداد رکورد" را به اندازه Bubble در زیر metric اضافه کنید.

f764cf8ec84558d.png ۴. پس از تکمیل، داشبورد شما باید شبیه به این باشد:

59c06b3b041ff950.png

اضافه کردن کارت‌های امتیاز به داشبورد شما

در مرحله بعد، سه کارت امتیاز به داشبورد اضافه خواهیم کرد. کارت‌های امتیاز به شما امکان می‌دهند مقدار یک متغیر فیلتر شده را نشان دهید، که به کاربران داشبورد کمک می‌کند تا روی معیارهایی که از همه مهم‌تر هستند تمرکز کنند. ما سه فیلتر ایجاد خواهیم کرد و سپس آنها را روی کارت‌های امتیاز اعمال خواهیم کرد. این کار باعث ایجاد سه کارت امتیاز می‌شود که تعداد درخواست‌های خدمات را با نوع «نظافت خیابان و پیاده‌رو»، «گرافیتی» و «اردوگاه‌ها» به کاربران نشان می‌دهد. این سه نوع خدمات، همانطور که توسط نقشه درختی ساخته شده قبلی تعیین شده است، رایج‌ترین نوع خدمات درخواستی هستند.

  1. روی افزودن نمودار در منو کلیک کنید، سپس از منوی کشویی، Scorecard را انتخاب کنید. دو گزینه خواهید دید: Scorecard و Scorecard با اعداد فشرده. هر یک از این موارد برای مورد استفاده مورد نظر مناسب خواهد بود.

cf41ed6d758d4b3d.png ۲. کارت امتیازی را بالای نقشه درختی در داشبورد اضافه کنید و مطمئن شوید که فیلد "تعداد رکورد" به عنوان معیار انتخاب شده است. آن را کپی و جایگذاری کنید تا دو کارت امتیازی دیگر با فاصله در سراسر داشبورد ایجاد شود. d72dff7b5ada3ab3.png ۳. سمت چپ‌ترین کارت امتیازی را انتخاب کنید. در پنل داده‌ها در سمت راست، گزینه «افزودن فیلتر» را انتخاب کنید و فیلتری ایجاد کنید که با پارامترهای زیر مطابقت داشته باشد. کارت امتیازی به طور خودکار به‌روزرسانی می‌شود تا تعداد رکوردها را فیلتر کند تا درخواست‌های خدماتی که معیارهای فیلتر را برآورده می‌کنند، شامل شود.

5f88670d31341a11.png ۴. همین کار را برای کارت امتیازی وسط و راست انجام دهید تا کارت‌های امتیازی ایجاد کنید که تعداد درخواست‌ها را با دسته‌های «گرافیتی» و «اردوگاه‌ها» نشان می‌دهند. کلیک روی «افزودن فیلتر» ، «انتخابگر فیلتر» را نشان می‌دهد که تمام فیلترهای ایجاد شده قبلی را نشان می‌دهد. برای ایجاد فیلترهای جدید، روی «ایجاد فیلتر» در پایین کلیک کنید. پس از ایجاد فیلترها، باید متوجه شوید که مقادیر به طور خودکار به‌روزرسانی می‌شوند تا پارامترهای جدید کارت امتیازی را منعکس کنند. ۵. با نگه داشتن کلید شیفت و کلیک روی هر سه شیء کارت امتیازی، آنها را همزمان انتخاب کنید، سپس روی «سبک‌ها» در پنل کلیک کنید تا سبک کارت‌های امتیازی را تغییر دهید. تغییراتی که اکنون ایجاد می‌کنید، به طور همزمان در هر سه کارت امتیازی اعمال می‌شود. سبک کارت‌های امتیازی را به‌روزرسانی کنید تا با تنظیمات پنل زیر مطابقت داشته باشد، اما اگر رنگ‌های شما کمی تغییر کرد، نگران نباشید. ما «نام معیار را مخفی کنید» (که در حال حاضر به عنوان «تعداد رکورد» در داشبورد نشان داده می‌شود) را انتخاب خواهیم کرد تا بتوانیم متن خودمان را در جای خود قرار دهیم و معنای این معیارها را برای بینندگان داشبورد قابل فهم‌تر کنیم. 41e5c8035b09e55f.png ۶. بالای کارت‌های امتیازی متن اضافه کنید تا کاربران بدانند معیارها چه چیزی را نشان می‌دهند. در نوار ابزار، روی نماد متن کلیک کنید. یک کادر روی بوم بکشید و سپس متن خود را در کادر وارد کنید.

۶۶۰۱۶۱۸۰۰۹f۹۲f.png

داشبورد شما باید به این شکل باشد: ۲۷f6ec27f3b39816.png

۶. ایجاد فیلترها

فیلترها در Data Studio به شما امکان می‌دهند داده‌های منعکس شده در یک نمودار را اصلاح یا کاهش دهید. شما با تعیین معیارها، مشابه دستور WHERE در SQL، یک فیلتر تعریف می‌کنید. فیلترها می‌توانند طیف خاصی از مقادیر را برای یک یا چند بعد از مجموعه داده‌های شما هدف قرار دهند، مانند محدود کردن داده‌ها به یک محدوده تاریخ خاص. می‌توانید فیلترها را در سطوح مختلف اعمال کنید:

  • سطح نمودار: فیلتر فقط روی یک نمودار خاص اعمال می‌شود.
  • سطح گروه: فیلتر روی گروهی از نمودارهای انتخاب شده اعمال می‌شود.
  • سطح صفحه: تمام نمودارهای موجود در آن صفحه فیلتر می‌شوند.
  • سطح گزارش: تمام نمودارهای موجود در گزارش فیلتر می‌شوند.

حالا که بخش عمده‌ای از داشبورد را آماده کرده‌ایم، بیایید یک کنترل فیلتر اضافه کنیم که به بینندگان این امکان را می‌دهد که هنگام بررسی گزارش‌ها، به صورت تعاملی یک یا چند محله را که می‌خواهند در تصاویر گزارش منعکس شوند، انتخاب کنند.

  1. روی کنترل فیلتر در منوی Data Studio کلیک کنید

1a87123245ba52b4.png ۲. برای قرار دادن کنترل فیلتر، درست مانند کاری که قبلاً هنگام اضافه کردن نمودارها انجام دادید، روی بوم داشبورد کلیک کنید. ۳. اگر از قبل ابعاد فیلتر روی "محله" در پنل داده تنظیم نشده است، مطمئن شوید که این مقدار تنظیم شده است. ۴. با کلیک روی فیلتر در داشبورد، آن را انتخاب کنید. سپس در نوار منوی بالا روی "ترتیب" کلیک کنید و "سطح صفحه را ایجاد کنید" را انتخاب کنید. اگر این گزینه برای انتخاب در دسترس نباشد، فیلتر از قبل روی سطح صفحه تنظیم شده است و هنگام تغییر، تمام نمودارهای آن صفحه را فیلتر می‌کند.

با این کار، شما یک داشبورد مناسب برای استفاده دارید!

۷. آن را آزمایش کنید و به اشتراک بگذارید

تست داشبورد شما

حالا که داشبورد کامل شده است، بیایید از دیدگاه بیننده به آن نگاهی بیندازیم تا مطمئن شویم همه چیز طبق انتظار کار می‌کند.

روی «مشاهده» در گوشه بالا سمت راست کلیک کنید، و می‌توانید داشبورد را از دید بینندگان خود مشاهده کنید.

d4d3065d022ff92a.png

اشتراک گذاری داشبورد

وقتی همه چیز مطابق میل شما شد، آماده اشتراک‌گذاری داشبورد خود هستید. دیتا استودیو با استفاده از رابط کاربری آشنای اشتراک‌گذاری که در گوگل شیت، داکز و سایر محصولات جی سوئیت استفاده می‌شود، اشتراک‌گذاری داشبوردها را ساده می‌کند.

با تغییر نام داشبورد خود شروع کنید تا کاربران بتوانند راحت‌تر آن را پیدا کنند. روی نام گزارش ("بدون عنوان") در گوشه بالا سمت چپ کلیک کنید و آن را به "درخواست‌های 311 سانفرانسیسکو بر اساس محله" تغییر دهید.

کلیک روی دکمه اشتراک‌گذاری در گوشه بالا سمت راست، رابط اشتراک‌گذاری را با گزینه‌های مختلفی باز می‌کند، از جمله اشتراک‌گذاری با کاربران خاص از طریق ایمیل، اشتراک‌گذاری بر اساس دامنه یا در دسترس عموم قرار دادن آن برای همه کاربران. این تنظیم آخر به ویژه در صورتی مفید است که بخواهید گزارش را در یک وب‌سایت عمومی قرار دهید.

752a2679c7d6b8ec.png

مراحل بعدی

با جستجوی عبارت "Data Studio" در بالای صفحه، codelab های بیشتری را بررسی کنید تا درباره اینکه چگونه ابزارهای هوش تجاری Google Cloud می‌توانند از نیازهای شما پشتیبانی کنند، بیشتر بدانید. منتظر Codelab های آینده باشید که جدیدترین ابزار BI Google Cloud، یعنی Looker ، را بررسی می‌کنند!

همچنین می‌توانید با استفاده از BigQuery BI Engine و با استفاده از حداکثر ۱۰۰ گیگابایت فضای ذخیره‌سازی درون حافظه، سرعت داشبوردهای خود را افزایش دهید. BI Engine یک سرویس تجزیه و تحلیل سریع درون حافظه است که به کاربران امکان می‌دهد مجموعه داده‌های پیچیده را در BigQuery با زمان پاسخ به پرس‌وجو در کمتر از یک ثانیه و با همزمانی بالا به صورت تعاملی بررسی کنند. این سرویس به طور یکپارچه با Data Studio ادغام می‌شود تا کاوش و تجزیه و تحلیل داده‌ها را تسریع کند و داشبوردهای شما را برای بینندگانتان قدرتمندتر سازد.