Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

使用适用于 Looker 和 BigQuery 的对话式分析 API 构建聊天应用

1. 准备工作

此 Codelab 将引导您使用对话式分析 API (CA API) 与 Looker 和 BigQuery 搭配使用，构建自己的数据查询聊天应用。为了充分发挥这些工具的价值，您应熟悉 BigQuery、Looker、LLM 和代理，以及 Python。

学习内容

完成此 Codelab 后，您将学习到以下内容：

如何将对话式分析与 Looker 搭配使用
如何设置和使用对话式分析 Python Streamlit 快速入门应用（以及该应用的工作原理）
使用 Looker 进行语义建模以搭配“对话式分析”的好处

所需条件

要完成本 Codelab，您需要：

安装了 ASC 人口统计数据 Looker 组成块的 Looker 实例
对 Looker 实例的 API 和开发者访问权限
安装了 Python v3.11+、Git 和 gcloud 的本地环境。
已为您的用户账号设置以下 IAM 角色的云项目：
roles/bigquery.dataViewer BigQuery Data Viewer
roles/bigquery.user BigQuery User
roles/looker.instanceUser Looker Instance User

2. 使用 BigQuery 构建并试用聊天应用

我们先来设置并试用以 BigQuery 为数据源的对话式分析快速入门应用。

进行身份验证并启用 Cloud API

使用您的用户账号在本地进行身份验证：

gcloud auth login

启用 Cloud 项目 API。请将 YOUR_PROJECT_ID 替换为您的 Google Cloud 项目 ID：

gcloud services enable geminidataanalytics.googleapis.com bigquery.googleapis.com cloudaicompanion.googleapis.com --project=YOUR_PROJECT_ID

设置应用默认凭据 (ADC) 和结算：

gcloud auth application-default login
gcloud auth application-default set-quota-project YOUR_PROJECT_ID

设置快速入门应用

将快速入门 GitHub 代码库克隆到本地环境。请参阅以下示例命令：

git clone "https://github.com/looker-open-source/ca-api-quickstarts"

进入您克隆的 ca-api-quickstarts 目录：

cd ca-api-quickstarts

在 .streamlit 目录中创建一个 secrets.toml 文件。YOUR_LOOKER_CLIENT_ID 和 YOUR_LOOKER_CLIENT_SECRET 应该是 Looker 实例中的 Looker 客户端 ID 和 Looker 客户端密钥。文件内容应如下所示：

[cloud]
project_id = "YOUR_PROJECT_ID"

[looker]
client_id = "YOUR_LOOKER_CLIENT_ID"
client_secret = "YOUR_LOOKER_CLIENT_SECRET"

您可以使用以下示例命令来创建该文件。请务必将这些值替换为您的项目 ID、客户端 ID 和客户端密钥：

cat > .streamlit/secrets.toml <<'EOF'
[cloud]
project_id = "YOUR_PROJECT_ID"

[looker]
client_id = "YOUR_LOOKER_CLIENT_ID"
client_secret = "YOUR_LOOKER_CLIENT_SECRET"
EOF

安装快速入门应用的 Python 要求：

pip install -r requirements.txt

运行快速入门应用：

streamlit run app.py

在您选择的浏览器中打开 https://localhost:8501。

试用快速入门应用

您现在位于快速入门应用的代理页面。您没有可用的数据代理。

现在，我们来创建一个说话像海盗的数据智能体。在创建智能体表单中执行以下操作：
设置显示名称字段：

Pirate BQ Agent

设置系统指令字段：

You are a pirate. Answer questions like a pirate

选择 BigQuery 选项。
设置项目字段：

bigquery-public-data

设置数据集字段：

google_trends

设置表格字段：

top_rising_terms

选择创建代理。

现在，让我们通过左侧主导航栏前往聊天页面。我们新创建的客服人员可以聊天。我们先添加提示/消息“你好，你怎么样？”，开始对话：
现在，我们来简单了解一下此数据集：“此数据集是关于什么的？”

再问一个问题，例如：
“数据集中有哪些 [输入州] 的位置？”
“Can you give me the data for the last 2 weeks for [City, State?]”
“你能创建可视化图表吗？”

您刚刚在自己的聊天应用中与数据代理和 BigQuery 数据进行了多轮对话。

3. 在 Looker 中对数据进行建模和探索

现在，我们将在 Looker 中对同一 BigQuery 数据进行建模和探索。

查询 BigQuery 人口普查数据

连接到更大的关系型数据集时会发生什么情况？首先，我们将创建一个新代理。

返回到代理页面上的创建代理表单。
设置显示名称字段：

BQ Census Agent

设置系统指令字段：

You are really excited about census data, you love learning about the demographics in your area because you want to come up with marketing campaigns for your company

选择 BigQuery 选项。
设置项目字段：

bigquery-public-data

设置数据集字段：

census_bureau_acs

设置表格字段：

blockgroup_2018_5yr

选择创建代理。
向新创建的代理提出以下两个问题：
“您有哪些数据？”
“你能否向我展示数据预览？”

使用 Looker 对人口普查数据进行建模

现在，我们将使用 LookML 模型来定义 BigQuery 人口普查数据。我们将解决刚才看到的问题。

登录 Looker 实例
如需找到 ACS 人口统计数据块文件，请前往左侧主导航栏，选择开发，然后选择 marketplace_acs_census-v2。
我们来看一下 Looker 视图。打开 imported_project 目录、acs_census-v2 目录和 geography 目录。
最后，打开 cbsa.view 文件。
在第 17 行，我们可以看到 LookML 正在创建派生表。换句话说，此代码通过联接两个 BigQuery 公开数据集（一个包含人口普查数据，另一个包含地理边界数据）来创建一个新的合并表。LookML 允许我们通过创建永久性派生表来查询多个数据集，从而实现联接。

此外，联接是在可版本化的代码 (LookML) 中定义的，而不是在系统指令中定义的，这使得代理开发更具可伸缩性。借助 LookML，您可以围绕数据定义特定的假设和限制，以便在用户通过数据代理与数据对话时提供支持。

探索 Looker 建模的人口普查数据

我们来在探索中运行一个快速查询，以演示我们有一个集中式数据源可供查询。

在左侧主导航菜单中，依次选择探索、人口普查数据块和州和县。
依次选择衡量指标教育 > 副学士学位。
选择以下维度：
地理位置 > 街区群组
地理位置 > 县 > 县名称
地理位置 > 省/市 > 省/市。
运行查询（右上角），您现在会看到这些地理位置 ID（称为“Block Group”）已与人类可读的字符串相关联。
打开可视化标签页，您将看到地图中的这些数据。

4. 试用 Looker 聊天应用

现在，我们为 Looker 创建数据代理。

前往快速入门应用的代理页面中的创建代理表单：
设置显示名称字段：

Cartoon character data analyst

设置系统指令字段：

You are [fill in your favorite cartoon character, Bugs Bunny is a favorite]. Answer questions like that cartoon character

选择 Looker 选项。
将 Url 字段设置为 Looker 实例的网址：“https://...”
设置模型字段：

data_block_acs_bigquery

设置 Explore 字段：

cbsa

选择创建代理。
前往聊天页面，然后选择新创建的代理。
我们先添加提示/消息“你好，你怎么样？”，开始对话：
我们来让代理描述一下数据集：“您有哪些可用数据？”
我们再问几个问题：
“纽约哪个县的人口最多？”
“那么，人均高中毕业生人数最多的国家/地区是哪个？”
你能告诉我按性别和州划分的人口数据吗？
“我想查看人口最多的前 10 个州的条形图。”

5. 快速入门应用还能做什么？

您现在可以：

在本地设置聊天应用
创建了 BigQuery 数据代理和 Looker 数据代理
与数据智能体进行对话
了解了 Looker 语义模型作为聊天上下文的优势

接下来，我们来试用一下快速入门应用的其他功能：

重新加载快速入门应用的网页，然后前往聊天页面。
您可以查看与 BigQuery 和 Looker 代理的所有过往对话，以及其中的所有相应消息。应用的前端不会存储过往对话或消息，而是从 CA API 中提取它们。

现在，前往代理页面，然后从列表中选择您的 Looker 代理。
您可以更新代理的配置，也可以根据需要删除代理。应用的前端中不存储任何代理。

6. 可选挑战和进一步探索

如果您愿意，可以借此机会熟悉对话式分析和快速入门应用。或者，您可以挑战一下自己，修改快速入门应用。您可以尝试以下建议和挑战，也可以跳到最后一部分。

详细了解 CA API 和快速入门应用

详细了解用于控制智能体行为的深入系统指令。
设置另一个指向新 BigQuery 数据集的数据代理。
在 Looker 实例中安装新的 Looker 模块，创建代理，并将其指向新的 Looker 数据集。

快速入门应用修改挑战

您熟悉 Looker 嵌入吗？如果是，请尝试在快速入门应用中嵌入 Looker 信息中心。考虑使用 Streamlit 的 iframe 组件。
找到包含视频网址的公开数据集，并更新应用的聊天渲染逻辑，以在聊天中显示视频。

7. 总结和要点

本测验到此结束！您已使用对话式分析 API 构建聊天应用、创建数据代理并与数据对话。我们来回顾一些关键功能和概念！

对话式分析功能

我们介绍了对话式分析的许多功能，例如：

创建、更新、列出、获取和删除数据代理。
将数据代理指向 BigQuery 或 Looker 作为数据源。
创建、列出和获取对话及其各自的消息。
生成用于在对话中实现沉浸式可视化的 Vega 图表规范。
将对话中的过往消息用作未来消息的有用上下文。

将 Looker 与 CA API 搭配使用的优势

Looker 可对数据进行集中式、可测试且可管控的语义建模。结合使用对话式分析，Looker 提供了一种可扩缩的方式来为数据代理提供上下文。

后续操作

如需了解更多指南、功能和应用场景，请参阅对话式分析文档。
及时了解并贡献于快速入门应用代码库。