Vertex AI Search を使用してノーコードのユニバーサル従業員ヘルプデスク アプリを構築する

1. はじめに

この Codelab では、Vertex AI Search を使用して、コード不要のユニバーサル従業員向けヘルプデスク アプリを構築します。

たとえば、グローバルな小売企業である Cymbal で働いているとします。従業員は、「出張の予約に関するポリシーは何ですか?」や「スニーカーの在庫は何足ありますか?」といった質問をよくします。

通常、これらの回答を見つけるには、まったく異なるシステムにログインする必要があります。さまざまなシステムに対応するだけでなく、質問への回答を得るには、大量の非構造化 HR データを読み込んだり、構造化された財務データに対して複雑な SQL プロンプトを実行したりする必要があります。

この Codelab では、これらのデータセットに接続する単一の統合アプリを構築します。これにより、従業員は Vertex AI の検索拡張生成(RAG)機能を使用して、質問に対する会話形式のグラウンディングされた回答を得ることができます。

演習内容

この Codelab では、次の手順を完了します。

  • データソースを設定する。非構造化 HR ドキュメント用の Cloud Storage バケットと、構造化された財務データ用の BigQuery データセットを作成します。
  • データストアを構成する。Cloud Storage と BigQuery のデータソースに接続された Vertex AI Search データストアを作成します。
  • アプリを接続する。 Vertex AI Search アプリを作成し、両方のデータストアをリンクします。
  • アプリをテストする。 統合された検索インターフェースを操作して、両方のデータストアの情報を合成したグラウンディングされた回答を確認します。
  • 次のステップを確認する。生成 AI モデルをチューニングして検索アプリをデプロイするためのオプションを確認します。

Vertex AI Search を示すアプリのアーキテクチャ図

必要なもの

  • ウェブブラウザ(Chrome など)。
  • 課金を有効にした Google Cloud プロジェクト。
  • ローカルマシンにインストールされた Git。

この Codelab は、あらゆるレベルのデベロッパーを対象としています。

2. 始める前に

Google Cloud プロジェクトを作成し、必要な API を有効にします。

  1. Google Cloud コンソールの [プロジェクト セレクタ] ページで、Google Cloud プロジェクト を選択または作成します。
  2. Cloud プロジェクトに対して課金が有効になっていることを確認します。詳しくは、プロジェクトで課金が有効になっているかどうかを確認する方法をご覧ください。

必要な IAM のロール

この Codelab では、Google Cloud プロジェクトのプロジェクト オーナー ロールがあることを前提としています。

API を有効にする

  1. Google Cloud コンソールで、[Cloud Shell をアクティブにする] をクリックします。Cloud Shell を使用したことがない場合は、信頼できる環境で Cloud Shell を起動するかどうかを選択できるペインが表示されます。Cloud Shell を承認するよう求められたら、[承認] をクリックします。
  2. Cloud Shell で、必要な API をすべて有効にします。
    gcloud services enable \
      discoveryengine.googleapis.com \
      aiplatform.googleapis.com \
      bigquery.googleapis.com \
      storage.googleapis.com
    

3. GitHub リポジトリのクローンを作成する

Cymbal 従業員向けヘルプデスク アプリで検索がどのように機能するかを示すには、モックファイルが必要です。このセクションでは、これらのファイルを取得するために、GitHub リポジトリのクローンをローカルマシンに作成します。これらのファイルは、後の手順で Cloud コンソール インターフェースを使用して Google Cloud にアップロードします。

  1. ローカルマシンのターミナルで、next-26-sessions リポジトリのクローンを作成します。
    git clone https://github.com/GoogleCloudPlatform/next-26-sessions.git
    
  2. ダウンロードしたリポジトリ ディレクトリに移動します。
    cd next-26-sessions/BRK1-063-the-knowledge-source/cymbal-employee-helpdesk
    
  3. このディレクトリでダウンロードしたファイルを確認します。HRFinance の 2 つのフォルダがあります。
    • HR 。このフォルダには、.doc.txt.html ファイルなど、多数の非構造化ファイルが含まれています。HR ファイルを Cloud Storage バケットにアップロードします。
    • Finance 。このフォルダには、2 つの .jsonl ファイルが含まれています。これらのファイルを BigQuery データセットにアップロードします。

4. 非構造化ファイル用の Cloud Storage バケットを作成する

このセクションでは、Cloud Storage バケットを作成し、GitHub リポジトリのクローンを作成する セクションでダウンロードした HR フォルダ内のドキュメントをアップロードします。この例の HR ドキュメントのような非構造化データは、事前定義された形式に従っておらず、テキスト ファイル、ドキュメント、マルチメディア コンテンツなどを含めることができます。

  1. Cloud コンソールで、[**バケット**] ページに移動します。
  2. [作成] をクリックします。
  3. [バケットの作成] ページで、バケットの名前を入力します。名前はグローバルに一意である必要があります。例: cymbal-app-hr-12
  4. デフォルトのオプションをそのまま使用します。
  5. [作成] をクリックします。バケットが作成され、[バケットの詳細] ページが表示されます。[バケットの詳細] ページが表示されない場合は、作成したバケットをクリックします。
  6. [**バケットの詳細**] ページで、[**アップロード**] > [**フォルダをアップロード**] をクリックし、HR フォルダを [**GitHub リポジトリのクローンを作成する**] セクションでダウンロードします。
  7. アップロードを確認します。バケットの作成
  8. [バケットの詳細] ページで、HR フォルダをクリックしてファイルの一覧を表示します。バケット内のファイル

5. 構造化ファイル用の BigQuery データセットを作成する

このセクションでは、BigQuery データセットを作成し、GitHub リポジトリのクローンを作成する セクションでダウンロードした Finance フォルダ内のドキュメントを新しいテーブルに読み込みます。この例の財務ドキュメントのような構造化データは、データベース内のレコードなど、事前定義された形式に従います。

  1. Cloud コンソールで、[BigQuery] ページに移動します。
  2. [エクスプローラ] ペインで、プロジェクト名をクリックし、[アクションを表示](縦に 3 つ並んだ点)> [データセットを作成] をクリックします。データセットの作成
  3. [データセットを作成] ペインで、データセット ID に「cymbal_finance」と入力します。
  4. [データのロケーション] で、US (multiple regions in United States) を選択します。
  5. デフォルトのオプションをそのまま使用して、[データセットを作成] をクリックします。
  6. [エクスプローラ] ペインで、プロジェクトを開き、cymbal_finance データセットをクリックします。
  7. データセットの詳細ペインで、[テーブルを作成] をクリックします。
  8. [テーブルの作成] ページの [ソース] セクションで、次の操作を行います。
    1. [**テーブルの作成元**] で [**アップロード**] を選択します。
    2. [ファイルを選択] で [参照] をクリックし、ダウンロードした Finance フォルダに移動して、cymbal_employee_finance.jsonl を選択します。
    3. [**ファイル形式**] で [**JSONL(改行区切り JSON)**] を選択します。
  9. [宛先] セクションで、テーブル 名に「employee_finance」と入力します。
  10. [スキーマ] セクションで、[自動検出] チェックボックスをオンにします。
  11. その他のデフォルト設定はそのままにして、[テーブルを作成] をクリックします。
  12. 手順 7 ~ 11 を繰り返して、新しいテーブルにデータを読み込みます。手順 8b で product_inventory.jsonl を選択し、手順 9 で product_inventoryテーブル名として入力します。データセットの詳細ペインにテーブルが表示されない場合は、[更新] をクリックします。
  13. データセットと 2 つのテーブルが正常に作成されると、次の画像のようになります。Cymbal の財務データセット

6. Vertex AI Search アプリを作成する

  1. Cloud Console で、Vertex AI Search のページに移動します。
  2. [カスタム検索(一般)] タイルで、[作成] をクリックします。
  3. [検索アプリの構成] ページで、[Enterprise Edition の機能] オプションと [生成レスポンス] オプションが選択されていることを確認します。
  4. アプリに「cymbal-employee-portal」という名前を付けます。
  5. 会社名 に「Cymbal Corp」と入力します。
  6. アプリのロケーションglobal のままにします。
  7. [続行] をクリックします。

7. データストアを作成して接続する

[データストア] ページで、アプリに接続するデータストアを作成します。非構造化 HR データ用に 1 つ、構造化された財務データ用に 2 つのデータストアを作成する必要があります。

非構造化データのデータストアを作成する

  1. [データストア] ページで、[データストアを作成] をクリックします。
  2. [データソースを選択] で [Cloud Storage] を選択します。
  3. [**Cloud Storage からデータをインポート**] ペインで、[**非構造化データのインポート(ドキュメント検索と RAG)**] に移動し、[**ドキュメント**] を選択します。
  4. [同期の頻度] オプションは [1 回限り] のままにします。
  5. [インポートするフォルダまたはファイルを選択] で、[フォルダ] をクリックします。
  6. gs://... フィールドに、非構造化ファイル用の Cloud Storage バケットを作成する セクションで作成したバケットの名前を入力します。たとえば、バケットの名前が cymbal-app-hr-12 の場合は、「cymbal-app-hr-12/HR」と入力します。HR フォルダから取り込むことで、このデータストアには HR ドキュメントのみが含まれるようになります。
  7. [続行] をクリックします。
  8. データストアの名前として「cymbal-hr」と入力します。
  9. [続行] をクリックします。
  10. [一般的な料金] のオプションはそのままにします。
  11. [作成] をクリックします。

[作成] をクリックすると、[データストア] ページに戻ります。

構造化データのデータストアを作成する

BigQuery の構造化データ用に 2 つのデータストアを作成します。1 つは従業員の財務情報用、もう 1 つは商品在庫用です。

従業員の財務データ用のデータストアを作成する

  1. [データストア] ページで、[データストアを作成] をもう一度クリックします。
  2. [**データソースを選択**] で [**BigQuery**] を選択します。
  3. [構造化データのインポート] で、[独自のスキーマを持つ BigQuery テーブル] を選択します。
  4. [同期の頻度] オプションは [1 回限り] のままにします。
  5. [**インポートするテーブルを選択**] で、[**参照**] をクリックします。表示された [パスを選択] ダイアログで、プロジェクトの cymbal_finance データセットから employee_finance テーブルを選択します。他のプロジェクトから同様の名前のテーブルが表示されることがあるため、プロジェクトのテーブルを選択してください。
  6. [続行] をクリックします。
  7. [スキーマを確認してキー プロパティを割り当てる] ページを確認します。
  8. [続行] をクリックします。
  9. データストアの名前として「cymbal-finance」と入力します。
  10. [続行] をクリックします。
  11. [一般的な料金] のオプションはそのままにします。
  12. [作成] をクリックします。

[作成] をクリックすると、[データストア] ページに戻ります。

商品在庫データ用のデータストアを作成する

  1. [データストア] ページで、[データストアを作成] をもう一度クリックします。
  2. [**データソースを選択**] で [**BigQuery**] を選択します。
  3. [構造化データのインポート] で、[独自のスキーマを持つ BigQuery テーブル] を選択します。
  4. [同期の頻度] オプションは [1 回限り] のままにします。
  5. [**インポートするテーブルを選択**] で、[**参照**] をクリックします。表示された [パスを選択] ダイアログで、プロジェクトの cymbal_finance データセットから product_inventory テーブルを選択します。
  6. [続行] をクリックします。
  7. [スキーマを確認してキー プロパティを割り当てる] ページを確認します。
  8. [続行] をクリックします。
  9. データストアの名前として「cymbal-inventory」と入力します。
  10. [続行] をクリックします。
  11. [一般的な料金] のオプションはそのままにします。
  12. [作成] をクリックします。

[作成] をクリックすると、[データストア] ページに戻ります。

8. データストアをアプリに接続する

[データストア] ページのリストに、cymbal-hr(非構造化)、cymbal-finance(構造化)、cymbal-inventory(構造化)の 3 つのデータストアが表示されます。これらのデータストアをアプリに接続する手順は次のとおりです。

  1. [データストア] ページで、作成した 3 つのデータストア(cymbal-hrcymbal-financecymbal-inventory)をすべて選択します。続行する前に、3 つのデータストアをすべて選択してください。
  2. [続行] をクリックします。
  3. [一般的な料金] のオプションはそのままにします。
  4. [作成] をクリックします。

9. Cymbal 従業員ポータル アプリをテストする

  1. cymbal-employee-portal アプリで、[プレビュー] をクリックします。
  2. [検索] ボックスに次の質問を入力します。
    What are the stipends that I get as an employee of Cymbal located in London?
    
  3. 商品在庫に関する質問を入力します。
    How many units of sneakers do we have in stock?
    
  4. 別の質問を入力します。
    What is the stipend for an executive in Cymbal?
    

検索アプリが複数のソースから情報を取得してレスポンスを作成していることに注目してください。これらの質問に回答するために、アプリは BigQuery に保存されている構造化された財務データと、Cloud Storage 内の非構造化 HR ドキュメントの両方を検索しました。

これは、Vertex AI Search の強力な機能を示しています。さまざまなデータ形式と異なるデータストアの回答を 1 つのまとまりのあるエクスペリエンスに統合できます。

AI モデルをチューニングして、より正確でドメイン固有の回答を提供することもできます。生成エクスペリエンスのカスタマイズについて詳しくは、回答とフォローアップのドキュメントをご覧ください。

10. アプリをデプロイするためのオプション

エンドユーザーにアプリケーションをデプロイすることは、この Codelab の範囲外ですが、これが実際のシナリオにどのように変換されるかを知っておくと便利です。Vertex AI Search アプリを組織のワークフローに統合するには、次のようないくつかの方法があります。

  • 事前構築済みのウェブ ウィジェット。HTML の script タグを使用して、すぐに使用できる検索またはチャット インターフェースを、会社の既存のイントラネットまたはウェブページに直接埋め込むことができます。これは、アプリをユーザーに公開する最も簡単な方法です。
  • カスタム API との連携。ユーザー エクスペリエンスを完全に制御するには、Vertex AI Search REST API またはクライアント ライブラリ(Python、Node.js、Java など)を使用して、カスタム フロントエンドをゼロから構築します。

11. クリーンアップ

Google Cloud アカウントに継続的に課金されないようにするには、この Codelab で作成したリソースを削除します。

  1. Cloud コンソールで、Vertex AI Search のページに移動します。
  2. [既存のアプリを表示] をクリックします。
  3. cymbal-employee-portal アプリで、[**その他**] の縦に 3 つ並んだ点をクリックし、[**削除**] をクリックします。
  4. 画面上のプロンプトに沿って削除を確認します。
  5. データストアを削除するには、コンソールの左側のナビゲーション パネルで [データストア] をクリックします。
  6. cymbal-hrcymbal-financecymbal-inventory データストアを削除します。
    1. cymbal-hr データストアで、[**その他**] の縦に 3 つ並んだ点をクリックし、[**削除**] をクリックします。
    2. 画面上のプロンプトに沿って削除を確認します。
    3. cymbal-finance データストアで、[**その他**] の縦に 3 つ並んだ点をクリックし、[**削除**] をクリックします。
    4. 画面上のプロンプトに沿って削除を確認します。
    5. cymbal-inventory データストアで、[**その他**] の縦に 3 つ並んだ点をクリックし、[**削除**] をクリックします。
    6. 画面上のプロンプトに沿って削除を確認します。
  7. [**バケット**] ページに移動し、作成したバケット(cymbal-app-hr-12 など)を削除します。
  8. [BigQuery] ページに移動し、cymbal_finance データセットを削除します。

12. 完了

ミッション完了!Vertex AI Search を使用して、統合されたエンタープライズ検索エクスペリエンスを構築できました。

Cloud Storage 内の非構造化エンタープライズ データと BigQuery の構造化レコードのギャップを埋めることで、複雑なビジネス推論が可能な強力なツールを作成しました。ML コードを 1 行も記述せずに実現できます。

学習した内容

  • 取り込み: Cloud Storage から非構造化ドキュメントを取り込み、BigQuery から構造化データを Vertex AI Search に取り込む方法。
  • マルチデータストアのクエリ 。マルチデータストア検索アプリにクエリを実行して、構造化データと非構造化データの両方から統合された回答を合成する方法。
  • チューニングとカスタマイズ 。生成 AI モデルをチューニングして、より正確でドメイン固有の回答を提供する方法。
  • デプロイのオプション 。事前構築済みのウィジェットまたはカスタム API を使用して、この推論機能を実際のアプリケーションに統合するさまざまな方法。

リファレンス ドキュメント