データポータルで BigQuery データを可視化する

データポータルで BigQuery データを可視化する

この Codelab について

subject最終更新: 10月 11, 2020
account_circle作成者: Shane Glass

1. はじめに

データポータルBigQuery を組み合わせることで、ユーザーがデータの情報と分析情報を理解できるようにするダッシュボードを作成できます。これらのダッシュボードは、使い慣れた Google ドライブのインターフェースを使用して簡単に共有でき、サイトに埋め込んでさらに広範囲に配布することもできます。

データポータルとは

データポータルは、Google の無料のデータ可視化ツールです。このツールを使用すると、次のことができます。

  • 詳細な設定が可能なグラフや表を使ってデータを視覚化できます。
  • さまざまなデータソースにすばやく簡単に接続できます。
  • インサイトをチームと共有したり、公開したりできます
  • レポートでチームと共同作業を行うことができます
  • 組み込みのサンプル レポートとコミュニティ ビジュアリゼーションを使用して、レポートをさらに迅速に作成する

この Codelab では、BigQuery とデータポータルを接続して、データをより深く理解するのに役立つダッシュボードとレポートを作成する方法について説明します。この方法を説明するために、Cloud 一般公開データセット プログラムの一般公開データセットを使用します。

作業内容

この Codelab では、データポータル ダッシュボードを作成します。このダッシュボードでは、BigQuery をデータポータルに接続し、データセットに最適な可視化タイプを決定することで、BigQuery 公開データセットを可視化します。

学習内容

  • BigQuery とデータポータルを接続する方法
  • データポータルでデータを可視化する方法

必要なもの

  • Google Cloud アカウント。まだお持ちでない場合は、クレジット カードなしで BigQuery サンドボックスにすぐに登録できます。
  • SQL の基礎知識があると役立ちますが、必須ではありません
  • データ可視化のベスト プラクティスに関する基本的な知識

2. 設定方法

BigQuery の一般公開データセットにアクセスする

この Codelab では、サンフランシスコ市の 311 リクエストを可視化します。このデータセットと 150 以上のデータセットは、BigQuery 一般公開データセット プログラムを通じて利用できます。利用可能なデータセットのカタログ全体を調べて、他のデータセットを探します。使用する 311 リクエスト データセットは、多くの企業が管理する必要があるカスタマー サービス リクエストの種類の優れたプロキシです。

Google Cloud プロジェクトを設定する

Cloud コンソールのプロジェクト セレクタページで、Cloud プロジェクトを選択または作成します。このオプションは、画面の左上にあるプルダウン メニューから選択できます。Google Cloud プロジェクトの課金が有効になっていることを確認します。プロジェクトで課金が有効になっていることを確認する方法はこちらです

4378f8fd21828a66.png

3. データポータルと BigQuery の接続

データポータルとは

データポータルは、Google の無料のデータ可視化ツールです。インタラクティブなダッシュボードと魅力的なレポートでデータのパワーをフル活用することを可能にし、ビジネス上の意思決定をさらにスマートなものにします。データポータルに直接組み込まれた 200 以上のコネクタから 500 以上のデータセットに接続できます。これには、Google アナリティクス、BigQuery、スプレッドシートなどの Google サービスや、外部データソースへのコネクタが含まれます。

BigQuery とは

BigQuery は、ビジネスのアジリティを高めるように設計された、Google Cloud のフルマネージドでスケーラビリティと費用対効果の高いクラウド データ ウェアハウスです。BigQuery を使用すると、ANSI SQL を使用してペタバイト規模のデータを極めて高速に分析し、リアルタイム分析と予測分析で分析情報を取得し、データに簡単にアクセスして分析情報を共有できます。運用上のオーバーヘッドは発生しません。

データソースを作成する

データポータルでレポートを作成するには、まずレポートのデータソースを作成します。レポートには 1 つ以上のデータソースを含めることができます。BigQuery データソースを作成する際は、データポータルで BigQuery コネクタが使用されます。

BigQuery データソースをデータポータル レポートに追加するには、適切な権限が必要です。また、BigQuery データセットに設定されている権限は、データポータルで作成したレポート、グラフ、ダッシュボードにも適用されます。データポータル レポートが共有された場合は、適切な権限を持つユーザーにのみレポートの構成要素が表示されます。

データソースを作成するには:

  1. データポータルを開きます。
  2. [レポート] ページの [テンプレートを使って開始] で、[空のレポート] テンプレートをクリックします。これによって、新しい無題のレポートが作成されます。

801a709b4a392db7.png

  1. プロンプトが表示されたら、[マーケティング設定] と [アカウントとプライバシー] に値を設定して、[保存] をクリックします。設定を保存した後、もう一度 [空のレポート] テンプレートのクリックが必要になる場合があります。
  2. [データのレポートへの追加] ウィンドウで、[データに接続する] セクションを表示し、[BigQuery] をクリックして選択します。

3fb927eb5317986e.png

  1. [承認] セクションにある [承認] をクリックします。これにより、Google データポータルから GCP プロジェクトにアクセスできるようになります。
  2. [許可のリクエスト] ダイアログ ボックスで [許可] をクリックすると、Google データポータルで BigQuery のデータを表示できるようになります。以前に Google データポータルを使用している場合には、このプロンプトが表示されない可能性があります。
  3. 左側のナビゲーションで、[自分のプロジェクト] がデフォルトで選択されていることを確認します。選択を [一般公開データセット] に変更します。
  4. [課金プロジェクト] で、以前に作成した GCP プロジェクトの名前をクリックします。
  5. [一般公開データセット] で [san_francisco_311] をクリックします。
  6. テーブルで、[311_service_requests] をクリックします。
  7. ウィンドウの右下にある [追加] をクリックします。「このレポートにデータを追加しようとしています」というダイアログ ボックスが表示されたら、[レポートに追加] をクリックして続行します。
  8. データポータルのメニューで [リソース] の [追加済みのデータソースの管理] をクリックします。c1aadb68dd5bf34f.png
  9. [データソース] ページの 311_service_requests の横にある [編集] をクリックして、テーブルのフィールドとそのデータ型を表示します。このページを使用して、フィールドのプロパティを調整したり、新しい計算フィールドを作成したりできます。f0250903710fc9ed.png
  10. このデータセットには、データポータルでネイティブに使用できる形式で表された、各地域の内部地理座標が含まれています。[neighborhood_center_ds] フィールドの横にある [テキスト] をクリックし、[地域] プルダウン フィールドから [緯度、経度] を選択して、データ型を変更します。これにより、データポータルでデータ フィールドを地理的に表現できるようになります。

1f979cf54681ae12.png

これで、BigQuery データセットがデータポータルに接続されました。

4. ビジュアリゼーションの作成

これで、BigQuery データセット(この場合は BigQuery 一般公開データセットの San Francisco 311 requests)が正常に接続されたので、データの可視化を開始できます。データポータルでは、データに基づいて最初の可視化が自動的に作成されます。このテンプレートを削除して、空のテンプレートを作成できます。

94aea5bb5fc4ffe1.png

ツリーマップを作成する

まず、ツリーマップを作成して、最も頻繁に寄せられる 311 リクエストの種類を可視化します。これにより、どのタイプのリクエストに注目すべきかを知ることができ、他の可視化の出発点となります。

  1. Data Studio のメニューから [グラフを追加] をクリックし、下部の [ツリーマップ] を選択します。表示されていない場合は、下にスクロールしてください。

677663906bdd050f.png 2. データポータルでは、キャンバス内の領域をクリックまたはドラッグして、可視化を作成できます。まず、ダッシュボードの左下隅に配置します。含めるフィールドが推測され、ツリーマップが自動的に作成されます。

c593d3313b5ce89.png 3. ツリーマップをクリックして、可視化されたデータを変更します。画面右側のパネルで、以下の可視化に合わせてパラメータを変更します。

869db54f9ef19ea3.png

  1. パネルの上部にある [スタイル] をクリックします。この情報を使用して、ツリーマップをより読みやすくするために、いくつかの小さな変更を行います。値が最も多いリクエスト タイプの色を変更してみましょう。下のハイライト表示されたボタンをクリックし、チェックマークの付いた青の色合いを選択します。これにより、ツリーマップのテキストとのコントラストが向上します。

db4e4505d51f1539.png c04e33d3aa35e7b.png 5. 完了すると、ダッシュボードは次のようになります。

af147fc5a4c40d15.png

5. ダッシュボードの作成

ダッシュボードの主な目的の 1 つは、意思決定をサポートするために、よりスケーラブルなベースで指標を簡単にレポートできるようにすることです。そのため、データセットの適切なコンテキストを提供するために必要なデータと指標を、わかりやすい形式で含めています。

この情報を理解しやすく解釈しやすくするために、いくつかの要素を追加して、ダッシュボードの構築を続けましょう。まず、リクエストの合計数が最も多い地域をハイライト表示する地図と、上位 3 つのリクエストの合計数を表示するスコアカードを追加しましょう。

ダッシュボードに地図を追加する

  1. メニューの [グラフを追加] をクリックし、プルダウンで [Google マップ] を選択します。地図グラフを使用することもできますが、Google マップの可視化の方がコンテキストが豊富で、このユースケースに適しています。

806f9ddfe45a242c.png 2. ツリーマップと同じ方法で、グラフをダッシュボードの右下部分に追加します。3. ダッシュボードで地図を選択して、パラメータを変更します。次に、[データ] タブのオプションを、以下の選択内容と一致するように変更します。そのためには、[neighborhood] フィールドを [ツールチップ] ディメンションに追加し、[レコード数] を指標の [バブルサイズ] に追加します。

fc764cf8ec84558d.png 4. 完了すると、ダッシュボードは次のようになります。

59c06b3b041ff950.png

ダッシュボードにスコアカードを追加する

次に、ダッシュボードに 3 つのスコアカードを追加します。スコアカードでは、フィルタされた変数の値を表示できます。これにより、ダッシュボードのユーザーは最も重要な指標に集中できます。3 つのフィルタを作成し、スコアカードに適用します。これにより、ユーザーに「道路と歩道の清掃」、「落書き」、「野営地」のタイプのサービス リクエストの数を表示する 3 つのスコアカードが作成されます。これらは、先ほど作成したツリーマップで特定された、最もリクエストの多い 3 つのサービスタイプです。

  1. メニューの [グラフを追加] をクリックし、プルダウンで [スコアカード] を選択します。[スコアカード] と [数字が短縮表示されたスコアカード] の 2 つのオプションが表示されます。どちらも目的のユースケースで機能します。

cf41ed6d758d4b3d.png 2. ダッシュボードのツリーマップの上にスコアカードを追加し、指標として [レコード数] フィールドが選択されていることを確認します。コピーして貼り付け、ダッシュボード全体に 2 つのグラフを配置します。d72dff7b5ada3ab3.png 3. 一番左のスコアカードを選択します。右側の [データ] パネルで、[フィルタを追加] を選択し、以下のパラメータに一致するフィルタを作成します。スコアカードが自動的に更新され、フィルタ条件を満たすサービス リクエストがレコード数に反映されます。

5f88670d31341a11.png 4. 中央と右端のスコアカードについても同様に操作して、「落書き」と「野営」のカテゴリのリクエスト数を表示するスコアカードを作成します。[フィルタを追加] をクリックすると、すでに作成されているすべてのフィルタが表示される「フィルタ選択ツール」が表示されます。下部の [フィルタを作成] をクリックして、新しいフィルタを作成します。フィルタを作成すると、スコアカードの新しいパラメータを反映するように値が自動的に更新されます。5. Shift キーを押しながら 3 つのスコアカード オブジェクトをすべて選択し、パネルの [スタイル] をクリックして、スコアカードのスタイルを変更します。ここで行った変更は、3 つのスコアカードすべてに一度に反映されます。スコアカードのスタイルを更新して、以下のパネル設定と一致させます。色が若干異なる場合は、そのままにしておいてください。指標名(ダッシュボードでは現在「レコード数」と表示されています)を非表示にして、独自のテキストを入力し、ダッシュボードの閲覧者が指標の意味をより理解できるようにします。41e5c8035b09e55f.png 6. スコアカードの上にテキストを追加して、指標が何を表しているかをユーザーに知らせます。ツールバーで、テキスト アイコンをクリックします。キャンバスにボックスを描画し、ボックスにテキストを入力します。

66016180009f92f.png

ダッシュボードは次のようになります。27f6ec27f3b39816.png

6. フィルタの作成

データポータルのフィルタを使用すると、グラフに反映されるデータを絞り込むことができます。フィルタは、SQL の WHERE ステートメントと同様に、条件を設定して定義します。フィルタは、データセットの 1 つ以上のディメンションの特定の値の範囲を対象にできます(データを特定の期間に制限するなど)。フィルタはさまざまなレベルで適用できます。

  • グラフ単位: フィルタは特定の 1 つのグラフにのみ適用されます。
  • グループレベル: 選択したグラフのグループにフィルタが適用されます。
  • ページレベル: そのページのすべてのグラフがフィルタされます。
  • レポート単位: レポート内のすべてのグラフがフィルタされます。

ダッシュボードの大部分が完成したので、フィルタ コントロールを追加しましょう。これにより、レポートのビジュアルを確認する際に、レポートに反映する 1 つまたは複数の近隣地域をインタラクティブに選択できるようになります。

  1. データポータルのメニューで [フィルタ オプション] をクリックします。

1a87123245ba52b4.png 2. ダッシュボードのキャンバス内をクリックして、グラフを追加したときと同じようにフィルタ コントロールを配置します。3. フィルタのディメンションが [データ] パネルで [地域] に設定されていることを確認します(まだ設定されていない場合)。4. ダッシュボードでフィルタをクリックして選択します。次に、上部のメニューバーの [配置] をクリックし、[ページレベルにする] を選択します。そのオプションを選択できない場合は、フィルタがすでにページレベルに設定されており、変更するとそのページのすべてのグラフがフィルタされます。

これで、使用する適切なダッシュボードが作成されました。

7. テストして共有する

ダッシュボードをテストする

ダッシュボードが完成したので、ビューアの視点から見て、すべてが想定どおりに動作することを確認しましょう。

右上にある [表示] をクリックすると、視聴者の視点からダッシュボードを表示できます。

d4d3065d022ff92a.png

ダッシュボードを共有する

すべてが思いどおりに表示されたら、ダッシュボードを共有する準備が整います。データポータルでは、Google スプレッドシートやドキュメントなどの G Suite サービスで使用されている共有のインターフェースと同じものを使用して、ダッシュボードを簡単に共有できます。

まず、ユーザーがダッシュボードを見つけやすいように、ダッシュボードの名前を変更します。左上にあるレポート名(「無題」)をクリックし、「San Francisco 311 Requests by Neighborhood」に変更します。

右上にある [共有] ボタンをクリックすると、共有インターフェースが開き、メールで個々のユーザーと共有する、ドメインで共有する、すべてのユーザーが利用できるように公開するなどのオプションが表示されます。最後の設定は、レポートを公開ウェブサイトに埋め込む場合に特に便利です。

752a2679c7d6b8ec.png

次のステップ

ページの最上部で「Data Studio」を検索して、他のコードラボ もご覧ください。Google Cloud のビジネス インテリジェンス ツールがお客様のニーズにどのように対応できるかについて、詳しく説明しています。Google Cloud の最新の BI ツールである Looker を取り上げる今後の Codelab にご期待ください。

BigQuery BI Engine を使用して最大 100 GB のインメモリ ストレージを活用することで、ダッシュボードを高速化することもできます。BI Engine は、BigQuery 内の複雑なデータセットをインタラクティブに探索できる高速なインメモリ分析サービスです。クエリの応答時間は 1 秒未満で、同時実行性にも優れています。データポータルとシームレスに統合されるため、データ探索や分析がスピードアップし、視聴者にとってダッシュボードがさらに強力なものになります。