PAIR Guidebook と MakerSuite を使用して責任ある AI のプロトタイピングを学ぶ

1. 始める前に

MakerSuite は、セットアップを行わずに、ブラウザからすぐに大規模言語モデルでプロトタイプを作成できるツールセットです。MakerSuite を使用すると、プロンプトをすばやく表示したり、アプリが直接アクセスできる API を作成したりできます。これにより、チームはジェネレーティブ AI に基づいた優れたアプリケーションを迅速に提供できます。People + AI Research(PAIR)ガイドブックでは、AI を使用して新製品を設計する方法を説明しています。人間中心のデータの取り扱いとユーザーの信頼の獲得に重点を置いており、MakerSuite の使用に適用されます。

この Codelab では、これら 2 つのリソースを活用して、責任ある AI ベースのエクスペリエンスを構築する方法を学びます。この Codelab の焦点は、こうした特定のリソースのエンドツーエンド ワークフローではなく、ジェネレーティブ AI を使用した責任あるプロトタイピングにあります。MakerSuite の一般的なワークフローについては、この MakerSuite の基本チュートリアルをご覧ください。また、AI プロダクトの設計に関する包括的なガイダンスについては、PAIR ガイドブックをご覧ください。

前提条件

  • AI に関する基礎知識。
  • 製品開発ワークフローに対するある程度の知識。

学習内容

  • PAIR Guidebook を使用して、さまざまなオーディエンスで AI エクスペリエンスがどの程度適切に機能しているかと、どのタスクで AI を使用すべきか、または使用しないかを判断する方法について学びます。
  • ユーザーの文化的背景の多様性を考慮したジェネレーティブ AI のエクスペリエンスを構築する方法。
  • ユーザーに対する説明可能性に焦点を当てることでユーザーの信頼を得る機会を AI 開発プロセスに組み込む方法。
  • 生成された AI マテリアルと人間中心の AI リソースの広範なツールキットを使用して、さらに調査する方法。

作業内容

この Codelab では、クリエイティブなライティング ツールを設計する際に、責任ある創造的 AI のための実践的なプロトタイピング プロセスについて説明します。また、AI を活用したオープンソースのテキスト エディタで、Google が開発した研究プロトタイプとしてリリースされた Wordcraft に、これらのプロンプトを組み込むことも可能です。

必要なもの

  • ブラウザ
  • Google アカウント。MakerSuite へのアクセスに使用します。

2. セットアップする

MakerSuite

MakerSuite は、セットアップを行わずに、ブラウザからすぐに大規模言語モデルでプロトタイプを作成できる Google のツールセットです。さまざまなプロンプトでモデルを簡単に試すことができます。結果に問題がなければ、これを Python コードにエクスポートし、Generative Language API を使用して同じモデルを呼び出すことができます。

MakerSuite を使用して大規模言語モデルをテストするには、ウェイティング リストに登録する必要があります。

People + AI 調査ガイドブック

People + AI Research(PAIR)ガイドブックは、デベロッパー、デザイナー、プロダクト マネージャー、生徒など、多くの人々が AI を責任を持って活用するためのリソースです。

ペアのガイドブックは、製品や AI に関連する主な質問(ジェネレーティブ AI など)のリストを作成する際に役立ちます。

  • 開発中の製品でいつ、どのように AI を使用するべきか
  • ユーザーから AI システムに対する信頼を得るために、どのようにするべきか
  • AI システムをユーザーにどのように説明するのか
  • 文化的な多様性に対応した、公平な AI エクスペリエンスにするにはどうすべきか

この Codelab を通じて PAIR Guidebook を使用して、プロトタイピングのための質問を作成し、さまざまな設計オプションを選択します。

Wordcraft のコードを入手する(オプション)

Wordcraft は、Google Research が開発した AI ベースのテキスト エディタで、AI を活用しながら文章を作成していくツールです。Wordcraft のコードはオープンソースで、この Codelab のプロンプトも試すことができます。

  • Wordcraft のコードを取得するには、次のコマンドを使用します。
git clone https://github.com/pair-code/wordcraft

また、zip ファイルをダウンロードすることもできます。

未定

3. ジェネレーティブ AI を利用して文章を書く

大規模言語モデル(LLM)は、文法、よく使われるフレーズ、およびその他の情報を学習するために、書籍、記事、ウェブサイトからの大量のテキストでトレーニングされる AI モデルです。このようなデータをもとに調整を行うことで、PaLM などの LLM は、複雑な ML プログラミングを行わなくても、単純な指示で多くの AI タスクを完了できるようになっています。また、質問に答えたり、情報を要約したり、翻訳をするなど、さまざまな AI タスクを実行できます。

この Codelab では、LLM を使用して文章の作成を支援するアプリをプロトタイピング作成します。Google の PaLM LLM は、文法や世界に関する一般的な情報を学習するだけでなく、ユーザーの指示やプロンプトに従うように設計されています。このため、MakerSuite でツールのプロトタイピングを行う場合は、ユーザーのプロンプトに対するレスポンスとして何を書くのかをモデルに教える必要があります。

MakerSuite でテキスト プロンプトを使用して AI で文章を作成する

  1. プロンプトを作成するには、左パネルにある [Create New] をクリックして、[Text prompt] を選択します。次のプロンプトで始めましょう。
You are a talented fiction author. Write a story about a given topic.
Topic: {{topic}}

このメッセージを入力すると、{{topic}} がプロンプトへの入力であることを検出し、[プロンプトをテストする] パネルを開いて、さまざまな入力でプロンプトが機能することを確認します。

  1. A boy discovers a lost cat in his yard」と入力して、モデルパネル([Run] ボタンの右側)をクリックし、temperature を 0.8 に設定します。
  2. [Run] をクリックして、プロンプトを実行します。すぐにプロンプトの出力がテーブルに表示されます。

temperature を 0.8 に設定すると、モデルは多様な文章を生成します。この場合、創造性のある文章を生成できますが、実行するたびに出力の結果が異なります。常に同じ結果を出力したい場合は、temperature を 0 に設定します。

たとえば、次のような出力が生成されます。

Henry sat on the edge of his porch and swung his legs back and forth. A small cat ran in front of him. Henry petted the cat. The cat began to purr. Henry picked up the cat and placed it on his lap. The cat began to snuggle close to him. Henry decided to keep the cat.
  1. このプロンプトを数回実行して、生成される文章にどのような違いがあるのか見てみましょう。

MakerSuite エディタのスクリーンショット。上部にプロンプトが表示され、その下の [Test your prompt] テーブルにテスト入力が表示されています。

ご覧のとおり、このモデルは論理的に流れる体系的なストーリーを書いていますが、同時にいくつかの仮定も立てています。たとえば、この文章は Henry という少年を中心に記述されています。この仮定は変更できます。主人公の名前を変えることも、猫を中心に描くように指定することもできます。

  1. プロンプトを更新して [Run] をクリックし、テスト入力でどのように変わるかを確認してください。

PAIR Guidebook を使用して、AI 支援に最適なタスクを特定する

ここまでは、簡単な説明を与えるだけで AI モデルが完全な文章を生成することを前提としていました。これはクリエイティブ ツールの設計上の正しい決定でしょうか?選択した文章を部分的に書き換えたいこともあるでしょう。MakerSuite ではこのようなプロトタイピングも可能で、たとえば、文章の一部をよりドラマチックにすることもできます。

これは焦点を絞り込んだ支援で、一度に複数のパラグラフを書き換えます。より高いレベルで見ると、プロンプトを少し変更するだけで、タスクの自動化ツールではなく、ユーザー拡張ツールのプロトタイピングが可能になります。

PAIR Guidebook は、AI 開発のプロセスにおいて、このような質問をして質問に回答するための原理的な手法を提供します。MakerSuite を使用するとアイデアのプロトタイプを迅速に作成できますが、PAIR ガイドブックでは、目的や関心のある視聴者に向けて、デザインの選択肢を最も有望な候補に絞り込むことができます。AI と連携してアプリを構築する際に、拡張と自動化のどちらが適しているかについては、Guidebooks をご覧ください。

まずは、このガイドブックで AI の使い方をご覧ください。このガイドブックのパターンからわかるように、AI には独自の価値を加えることをおすすめします。この場合、LLM は、文法、一般的なフレーズ、およびインターネットからのその他の情報に関する多くのデータでトレーニングされているため、モデルの能力を利用して、文章のアプリの出力で記述したいストーリーの世界を理解し、それを書き換える方法を提案することが役に立つ場合があります。これは、ガイドブックのパーソナライズされたおすすめコンテンツのパターンに基づいています。

さらに一歩、進みましょう。PAIR Guidebook では、ユーザーのニーズに関する章と、タスクを自動化または拡張する必要があるかどうかのガイダンスを提供しています。

拡張や自動化を検討する際には、プロトタイプが作成者に役立つアプリであることを前提としています。ユーザーは書くことが好きで、自分の書いたものを独創的なものしたいと思っているでしょう。また、これまでの執筆活動の中で出来上がった好みがあるかもしれませんが、これを伝えるのは容易ではありません。こうした点を踏まえると、拡張のほうが適切なアプローチのようです。

ペアリング ガイドブックによると、プロトタイピング用アプリは書き込み用のツールではなく、書き換えツールと考えることができます。たとえば、プロンプトを変更すれば、異なるスタイルが可能になります。

  1. 新しいテキスト プロンプトを作成します。
Edit the paragraph below. Make it \{\{rewrite style\}\}. Only respond with the updated text. Do not include any explanation.

Paragraph: {{paragraph}}

ここで、\{\{rewrite style\}\}{{paragraph}} は両方ともテキスト入力です。

  1. テストパネルでは、短くドラマチックにより機敏に文法的に苦手な詩的といった、さまざまなスタイルで書き換えを行ってみます。

文化的な背景を考慮した文章を設計する

ここまでは、文化的な背景の少ない文章を使ってパラグラフを書き換えるプロンプトを試してきました。責任ある AI のエクスペリエンスを設計する場合は、入力の多様性を試すと良い結果が得られることが少なくありません。

たとえば、次のようなテスト入力を試してみましょう。

  • 古風な趣のあるパリのカフェの静かな一角で、1 人の常連客が淹れたてのコーヒーの香りを味わいながら、彼の人生の流れを永遠に変えてしまった、長い間忘れていたあの瞬間を思い出している。
  • ムンバイのローカル列車の混雑の中で、中年の女性が見知らぬ人と会話を始めた。同じ街に住みながら、こんなに違う生活をしている。なんて魅力的なのだろうと彼女は思った。
  • にぎやかな上海の露店市の活気に満ちた混沌の中で、屋台の主人は少しの間、人の流れに目を移した。

不公平なバイアスや過去の固定観念を避けるよう、さまざまな文化的、地理的コンテキストを責任を持ってテストします。LLM は、オンラインで見つかった既存のデータから世界の多くの地域について知識を持っていますが、特定の地理的位置の詳細をすべて把握しているとは限らないことに注意してください。PAIR Guidebook が示すように、拡張タスクにおいては、ユーザーがコントロールできるようにすることが重要です。たとえば、プロットや話の詳細を柔軟にコントロールできるように、プロトタイプのリライト能力を拡張できます。

また、多くの生成モデルでは、オンライン情報の膨大なトレーニング データセットに多く見られるパターンにより、デフォルトの前提条件が示される場合もあります。これらのモデルでは、同じように有効な他の前提条件も扱うことができます。この点は知っておく必要があります。たとえば、上記の段落を書き換えるプロンプトでは、書き換えスタイルを変更して「shorter. 知らない人も女性だということをお忘れなく

4. 信頼関係を築く

ユーザーの信頼がなければ、どんなに革新的な AI 機能でも使われることはないでしょう。AI を有能で、信頼でき、役に立つものだとユーザーが感じなければ、信頼を得ることはできません。特定の機能をいつ、どのように使えばよいかをユーザーに知らせることで、信頼関係を築きやすくなり、また、ユーザー エクスペリエンス全体の向上につながります。

AI システムの信頼性を判断する際に参考となる PAIR ガイドブックが用意されています。

早い段階で信頼を得る

ジェネレーティブ AI では、ユーザーに機能の意図を伝え、AI の限界を理解してもらうことが特に重要です。たとえば、言語モデルは主としてテキストの次の部分を予測するように設計されているため、出力の実際の精度が必ずしも実際と異なる場合があります。そのため、プロトタイプが独創的なものであり、あくまで参考情報として受けていただくことを、ユーザーに理解していただくことが重要です。ユーザーが事実を確認したいと考え、事実を確認したい場合、信頼できるリソースを介してオンラインで検索する必要があります。

このプロトタイプが事実情報の作成を目的としているのではなく、特にフィクションの作成を目的としていることを理解できるよう、いくつかの方法をブレインストーミングします。

信頼の維持

また、ジェネレーティブ AI モデルは非常に有能ですが、多くの具体的なユースケースでは、タスクが正しく完了しているかどうかをユーザーが検証することはできません。たとえば、このプロトタイプは、ターゲットを絞ったテキストの完成とターゲット フィクションの書き換え(ユーザーが簡単に確認できる機能)を中心に設計されています。一方、生成モデルがテキストの大半を書き換えるプロンプトを簡単に受け入れるように設計されていると、偶発的な微妙な誤りにユーザーが気付かない可能性があります。一般に、ユーザーが簡単に検証できるタスクに対してインタラクティブなジェネレーティブ AI を使用するほうが、ユーザーの信頼を得やすくなります。

信頼を維持する最後の機会は生成モデルの操縦性です。前の AI モデルでは、非常に限定されたタスクに絞り込みましたが、生成モデルの出力はエンドユーザーが非常にカスタマイズしやすいものになります(「よりドラマチック」、「より簡潔」などのリライトを要求した場合を参照)。このような操縦性があると、ユーザー エクスペリエンスは向上します。ただし、この操縦性をモデルの機能に制限する場合は注意が必要です。たとえば、このプロトタイプでは、テキストのリライト方法をユーザーに確認するのではなく、該当するリライトの指示リストと提案をエンドユーザーに提供できます。

失った信頼を回復する

最善を尽くしても、モデルで最適でない結果が得られる場合があります。そのような場合は、ユーザーが AI アクションを元に戻せるようにすることが重要です。同様に、パフォーマンスが変動する特徴を特定し、ユーザーが AI アシストを明示的にリクエストした場合にのみトリガーするほうが適切です。

  • 元に戻す機能を作成する方法や、ユーザーの信頼を取り戻すためのその他の方法について、いくつかブレインストーミングを行います。

この課題に対する解決策は Codelab のソリューションにあります。

5. すべてをまとめる

ここまでは MakerSuite でプロンプトのテストを行ってきました。これらのプロンプトに問題がなければ、プロンプトをプロトタイプで直接使用できます。

  • まず、プロンプトを保存して、右上隅の [Get code] を取得します。まだの場合は、API キーを有効にする必要があります。表示された [Get code] ダイアログで [Enable API key] をクリックします。

MakerSuite のツールバー右上に [Get code] ボタンがあります。

MakerSuite は、アプリケーションで直接使用できるコードを生成します。たとえば、ウェブ アプリケーションで使用する場合は、JavaScript コードを選択します。コードは、ダイアログからコピーして直接ウェブアプリに貼り付けることができます。MakerSuite でプロンプトを更新した場合は、対象コードのプロンプト変数を使用して、コード内で更新する必要があります。

Makersuite 生成のコードを表示するダイアログ。ユーザーは、cURL、JavaScript、または Python ライブラリから選択できます。また、プロンプト情報を JSON として取得することもできます。

この API をクリエイティブ作成用の事前構築済みアプリに統合する場合は、Wordcraft コードをダウンロードできます。

Codelab のソリューション

Wordcraft のコードは GitHub から入手できます。

git clone https://github.com/pair-code/wordcraft

また、リポジトリを ZIP ファイルとしてダウンロードすることもできます。

6. 完了

PAIR Guidebook と MakerSuite を使用して責任ある AI をプロトタイピングする Codelab を修了し、いくつかの Google ツールを使用して責任ある AI のエクスペリエンス(この場合はクリエイティブ作成アプリ)のプロトタイプを作成する方法を学びます。これらの点に注意して、独創的なアプリケーションを開発してください。

参考資料