了解如何使用 PAIR Guidebook 和 MakerSuite 对 Responsible AI 进行原型设计

1. 准备工作

MakerSuite 是一套工具,可让您直接在浏览器中使用大型语言模型进行原型设计,无需进行任何设置。使用 MakerSuite,您可以快速尝试提示,创建您的应用可以直接访问的 API,这有助于团队基于生成式 AI 快速交付出色的应用。人与 AI 研究 (PAIR) 指南提供了有关如何使用 AI 设计新产品的指导,侧重于以人为本的数据做法并赢得用户信任 - 指南适用于使用 MakerSuite。

在此 Codelab 中,您将学习如何利用这两项资源,打造负责任的 AI 体验。本 Codelab 的重点是利用生成式 AI 负责性原型设计,而不是这些特定资源的端到端工作流。如需了解 MakerSuite 的一般工作流程,请参阅应用制作工具的基本教程,并参阅 PAIR 指南,获取设计 AI 产品的更全面指南。

前提条件

  • 对 AI 有基本的了解。
  • 了解产品开发工作流程。

学习内容

  • 如何使用 PAIR 指南来探索 AI 体验在不同受众群体中的效果,以及如何确定哪些任务应使用或不应该使用 AI。
  • 如何打造从用户丰富的文化实践中汲取灵感的生成式 AI 体验。
  • 如何在 AI 开发流程中将机会放在用户的可解释性上,从而赢得用户信任。
  • 如何使用更广泛的 AI 生成材料和以人为本的 AI 资源工具包进行进一步的探索。

构建内容

此 Codelab 将引导您在设计创意撰写工具时,亲身体验负责任的生成式 AI 的原型设计过程。如果您感兴趣,甚至可以将自己设计的提示集成到 Wordcraft(一个基于 AI 的开源文本编辑器)中,该编辑器是 Google 开发的研究原型。

所需条件

  • Browser
  • Google 帐号,用于访问 MakerSuite

2. 进行设置

MakerSuite

MakerSuite 是一套 Google 工具,可让您直接在浏览器中使用大型语言模型进行原型设计,无需进行任何设置。您可以快速试用模型,并尝试不同的提示。构建满意的内容后,您可以轻松将其导出为 Python 代码,然后使用 Generative Language API 调用相同的模型。

如需使用 MakerSuite 测试大型语言模型,请注册加入等位名单。

人员 + AI 研究指南

人与 AI 研究 (PAIR) 指南是一项资源,旨在帮助开发者、设计人员、产品经理、学生和许多其他人员以负责任的方式使用 AI。

配对指南可帮助您和您的团队生成与产品(包括生成式 AI)相关的关键问题列表。

  • 何时以及如何在我的产品中使用 AI?
  • 如何帮助用户建立对我的 AI 系统的信任?
  • 如何向用户介绍我的 AI 系统?
  • AI 体验如何体现文化包容性和公平性?

在整个 Codelab 中,您都需要使用 PAIR 指南,以便进行原型设计,并可以选择不同的设计选项。

获取 Wordcraft 代码(可选)

Wordcraft 是 Google Research 团队开发的一款基于 AI 的文本编辑器,旨在探索如何协作完成人类和 AI 故事创作。Wordcraft 代码是开源的,因此您可以自行尝试在此 Codelab 中的提示进行实验。

  • 如需获取 Wordcraft 的代码,请使用以下命令:
git clone https://github.com/pair-code/wordcraft

或者,您也可以下载相应的 zip 文件:

待定

3. 使用生成式 AI 撰写故事

大型语言模型 (LLM) 是一种基于大量书籍、文章和网站中的文本进行训练的 AI 模型,旨在学习语法、常用短语和其他信息。根据这些数据和一些额外的微调,PaLM 等 LLM 可以根据简单的指令完成许多人工智能任务,而无需复杂的机器学习编程。它还可以回答问题、汇总信息、翻译语言,以及执行许多其他 AI 任务。

在此 Codelab 中,您将使用 LLM 对应用进行原型设计,以帮助作者撰写故事。除了提供有关世界、语法等的一般信息之外,Google 的 PaLM LLM 还可以按照用户说明或提示操作。因此,为了在 MakerSuite 中设计工具的原型,您需要教授模型,应编写什么作为用户提示引发的响应。

在 MakerSuite 中使用文本提示编写 AI 辅助案例

  1. 如需创建提示,请点击左侧面板中的新建,然后选择文本提示。您可以从以下提示着手:
You are a talented fiction author. Write a story about a given topic.
Topic: {{topic}}

您输入此提示后,MakerSuite 会检测 {{topic}} 是否为提示的输入,并打开测试您的提示面板,以便您查看提示如何与各种输入共同作用。

  1. 输入 A boy discovers a lost cat in his yard,然后点击模型面板(位于运行按钮右侧),并将温度设为 0.8
  2. 最后,点击运行以运行您的提示。您应该很快就会在表格中看到提示输出。

通过将温度设置为 0.8,即可告知模型倾向于在其输出中包含多样性信息。这样做可以生成更多有创意的故事,但每次运行时都会产生不同的输出。如果您希望每次的输出都完全相同,请将温度设置为 0

一种可能的输出如下:

Henry sat on the edge of his porch and swung his legs back and forth. A small cat ran in front of him. Henry petted the cat. The cat began to purr. Henry picked up the cat and placed it on his lap. The cat began to snuggle close to him. Henry decided to keep the cat.
  1. 尝试多次运行该提示,您会注意到创建的不同故事。

Makersuite 编辑器的屏幕截图。视图顶部会显示提示,下面会显示测试输入的测试提示表。

如您所见,该模型会编写一个逻辑上结构化的故事,但也有一些假设。这个故事以一个小男孩亨利为中心。您可以更改这些假设,方法是指定主角的名字,甚至指定故事的焦点是小猫还是人类。

  1. 更新提示,然后点击运行,看看它在所有测试输入中的工作原理。

参照 PAIR 指南,确定最适合 AI 协助的任务

到目前为止,假设 AI 模型只编写了一条简短的说明,从而撰写了一个完整的故事。但这是否适合您的广告素材工具的设计决策?例如,假设有一个辅助作者帮助作者重写其选择的故事的某些部分。举例来说,您可以在 MakerSuite 中对这种互动进行原型设计,让故事片段更加引人注目

这样一来,您就可以更有针对性地协助自己修改段落。概括来讲,您只需对提示进行一些更改,就可以对用户增强工具(而非任务自动化工具)进行原型设计。

配对指南提供了一种在 AI 开发过程中提出和回答这类问题的原则性方法。虽然 MakeSuite 可以帮助您快速设计想法,但您也可以借助 PAIR Guidebooks 将设计选项缩减为最具潜力的设计选项,从而实现您的目标和目标受众群体。通过本指南,了解与 AI 合作构建应用时,增强还是自动化是正确的方法。

从本指南中的我应该如何使用 AI?开始提问。正如本指南模式模式所指出的,如果能使用 AI 作为唯一价值,最好使用 AI。在这种情况下,由于 LLM 包含大量有关语法、常用短语和来自互联网的其他信息的数据,因此利用该模型了解您在编写应用的输出中描述的案例世界并提出重写方式可能很有帮助。该功能基于本指南中的个性化建议模式。

更进一步。PAIR 指南提供了一个介绍用户需求的章节,其中介绍了应自动执行的任务还是扩充任务

在考虑扩充项或自动化时,请注意您的原型设计对编写者来说非常有用。因此,用户似乎喜欢写作,想要拥有个人写作的所有权,并且从一开始就设定了难以传达的偏好。总而言之,此举或许是更具潜力的方案。

根据 PAIR 指南,您可能会将自己进行原型设计的应用视为非编写工具,而是重写。例如,您可以将提示更改为允许采用不同的写作风格。

  1. 创建新的文本提示:
Edit the paragraph below. Make it \{\{rewrite style\}\}. Only respond with the updated text. Do not include any explanation.

Paragraph: {{paragraph}}

此处的 \{\{rewrite style\}\}{{paragraph}} 都是文本输入。

  1. 在测试面板中,您可以尝试各种重写样式,例如更短、更戏剧、更智能、语法更奇怪、诗歌等。

专为全球各地的故事设计

到目前为止,您已经测试了重写段落提示,使其具有缺乏强有力的文化背景。在设计 Responsible AI 体验时,尝试各种输入方式通常很有用。

尝试多种测试输入,例如:

  • 在一家古色古香的巴黎咖啡馆的安静角落里,一位孤独的顾客品尝着现煮咖啡的香气,他的思绪飘向一个被遗忘已久的时刻,这个时刻永远改变了他的人生轨迹。
  • 在孟买当地火车的混乱场景中,一名中年妇女与一名陌生人搭讪。她认为,如果住在同一个城市,生活会如此不同,这真是太神奇了。
  • 在熙熙攘攘的上海街头一片生机勃勃的热闹场景中,一位街头小吃摊贩花了一点时间观察来来往往的人群。

请以负责任的方式尝试其他文化和地理背景,注意避免不公平偏见和历史成见。请注意,虽然 LLM 可以根据网上的现有数据判断世界上的许多地方,但 LLM 可能无法掌握特定地理位置的所有详细信息。正如配对指南所述,在增强任务中为用户提供掌控性非常重要。例如,您可以扩展原型的重写功能,从而更好地控制故事情节和故事细节。

许多生成模型有时也表现出默认的假设,这在一定程度上是由于其在线训练的大型数据集更流行的模式。需要注意的是,可以指导模型做出其他同样有效的假设。例如,对于上面的重写段落提示,您可以通过更改重写样式,在编写“short. 记住,陌生人也是女性。”

4. 建立信任

在没有用户信任的情况下,即使是最具创新性的 AI 功能也可能未被使用。信任是用户认为 AI 功能强大、性能可靠且实用的结果。这有助于用户建立信任,从而鼓励他们了解如何以及何时使用特定功能,从而提升整体用户体验。

配对指南提供了一些建议,可帮助用户确定自己对 AI 系统的信任程度:

尽早建立信任

借助生成式 AI,可以传达特征意图并帮助用户了解 AI 的限制,这一点尤其有用。例如,由于语言模型主要用于预测文本中的下一个词,因此其输出有时可能并不准确。因此,请务必帮助用户了解此原型是一款富有创意的写作辅助工具,而非真实事实。如果用户希望事实核查详情,并希望看到真实信息,则应通过可信资源在线搜索。

您可以就几种可能的方式来构思,帮助用户了解此原型并非用于写实信息,而是为了撰写小说。

维护信任

同样,虽然生成式 AI 模型的功能强大,但对于许多特定用例,用户并非总能验证任务是否正确完成。例如,该原型围绕有针对性的文本完成目标和重写小说(用户可以轻松验证的功能)而设计。相比之下,生成模型很容易提示您重写大部分文本,但用户可能会错过可能出现的细微错误。一般来说,专注于交互式生成式 AI 功能,以处理用户可以轻松验证的任务有助于赢得他们的信任。

要想赢得信任,最后一次机会是利用生成式模型的可控性。与以前为特定任务设计的 AI 模型不同,生成模型的输出更容易让最终用户自定义(如要求更具戏剧性、更短或类似的重写所证明的那样)。虽然这种可控性有助于提升用户体验,但应注意在模型功能内约束这种可控性。例如,在此原型中,您可以提供已找到对最终用户有益的重写说明列表,而不是要求用户提供重写文字的方式。

从失去信任中恢复

虽然您会竭尽所能,但在某些情况下,模型可能会产生不理想的结果。在这种情况下,务必允许用户撤消任何 AI 操作。同样,通常最好识别具有可变性能的功能,并且仅在用户明确请求 AI 协助时才触发这些功能。

  • 集思广益,探讨您可以通过几种不同的方式创建撤消功能,或以其他方式恢复用户的信任。

您可以在此 Codelab 解决方案中查看这些挑战的解决方案。

5. 综合应用

到目前为止,您已在 MakerSuite 中尝试了提示。如果您对这些提示感到满意,请直接在原型中使用它们。

  • 首先,保存您的提示,然后点击右上角的获取代码。如果您尚未启用 API 密钥,则还需要在显示的获取代码对话框中点击启用 API 密钥,以启用 API 密钥。

makersuite 工具栏。“获取代码”按钮位于右上角。

MakerSuite 会生成可直接在应用中使用的代码。例如,若要与 Web 应用搭配使用,请选择 JavaScript 代码。您可以直接从对话框中复制代码,并将其粘贴到 Web 应用中。如果您要在 MakerSuite 中更新提示,请务必使用代码中的提示变量在代码中更新该提示。

一个对话框,显示由 Makersuite 生成的代码。用户可以选择使用 cURL、JavaScript 或 Python 库,或者以 JSON 格式检索提示信息。

如果您想将此 API 集成到某个预写应用中,以便发挥创意,您可以下载 Wordcraft 代码。

Codelab 解决方案

您可以从 GitHub 获取 Wordcraft 的代码:

git clone https://github.com/pair-code/wordcraft

或者,您也能以 Zip 文件的形式下载该代码库:

6. 恭喜

您已完成借助 PAIR Guidebook 和 MakerSuite 对 Responsible AI 进行原型设计 Codelab,并学习了如何使用一些 Google 工具对 Responsible AI 体验(在本例中为创意写作应用)进行原型设计。我们迫不及待要一睹您的应用程序了!

深入阅读