Приложение чата с PaLM API в Cloud Run

1. Введение

В этом практическом занятии показано, как создать и развернуть приложение для чата на основе ИИ в веб-приложении в качестве сервиса Cloud Run в Google Cloud. Это приложение для чата позволяет пользователям задавать вопросы и получать ответы, используя модель PaLM for Chat Bison ( text-chat ).

Что вы построите

Вы создадите

  • Для запуска приложения необходима среда в Google Cloud.
  • Образ Docker для приложения
  • Сервис Cloud Run, который запускает приложение.

2. Требования

  • Браузер, например Chrome или Firefox.
  • Проект Google Cloud с включенной функцией выставления счетов.

3. Прежде чем начать

  1. В консоли Google Cloud на странице выбора проекта выберите или создайте проект Google Cloud.
  2. Убедитесь, что для вашего проекта Google Cloud включена функция выставления счетов. Узнайте, как проверить, включена ли функция выставления счетов для проекта.
  3. Активируйте Cloud Shell из консоли Google Cloud, следуя инструкциям здесь.
  4. Если ваш проект не задан, используйте следующую команду для его настройки:
gcloud config set project <YOUR_PROJECT_ID>
  1. В оболочке Cloud Shell установите следующие переменные среды:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Для активации необходимых API Google Cloud выполните следующие команды в терминале Cloud Shell:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Настройте свою среду.

  1. Чтобы скопировать пример кода в свой проект, клонируйте репозиторий в Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. Эта команда клонирует содержимое репозитория в папку genai-templates-googlecloud.
  2. Перейдите в папку нужного нам проекта, выполнив следующую команду в терминале Cloud Shell:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Для инициализации Vertex AI установите следующие переменные среды:

GCP_PROJECT: Идентификатор вашего проекта в Google Cloud. Например: my_project.

GCP_REGION: Регион, в котором вы хотите развернуть свою облачную функцию. Например: us-central1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Создайте образ Docker.

Чтобы создать образ Docker для приложения и загрузить его в реестр артефактов, выполните следующие действия:

  1. Установите переменную среды для репозитория Artifact Registry. Имена могут содержать только строчные буквы, цифры и дефисы, и должны начинаться с буквы и заканчиваться буквой или цифрой. Например: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Установите переменную окружения для имени вашего сервиса. Например: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
  1. Создайте свой репозиторий в формате Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Настройте аутентификацию Docker.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Создайте образ.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Чтобы проверить, загружен ли образ в Реестр артефактов, перейдите на страницу Реестра артефактов. Найдите на этой странице созданный вами репозиторий.

6. Разверните приложение.

  1. Разверните приложение в качестве сервиса в Cloud Run.
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Выполнение этого шага может занять несколько секунд.

  1. Чтобы запустить приложение для чата, нажмите на URL-адрес сервиса.

56c06b62e0ac95bf.png

Приложение чата открывается в новой вкладке, как показано на следующем скриншоте:

eebde9c35c171563.png

7. Уборка

Чтобы избежать списания средств с вашего аккаунта Google Cloud за ресурсы, использованные в этой статье, выполните следующие действия:

  1. В консоли Google Cloud перейдите на страницу «Управление ресурсами» .
  2. В списке проектов выберите проект, который хотите удалить, и нажмите кнопку «Удалить».
  3. В диалоговом окне введите идентификатор проекта, а затем нажмите «Завершить» , чтобы удалить проект.
  4. Если вы хотите сохранить свой проект, пропустите описанные выше шаги и удалите службу Cloud Run, перейдя в раздел Cloud Run, выбрав в списке служб ту, которую хотите удалить, и нажав кнопку УДАЛИТЬ.

8. Поздравляем!

Поздравляем! Вы успешно разработали и развернули чат-приложение на основе ИИ для веб-приложения в качестве сервиса Cloud Run в Google Cloud. Вы можете использовать это чат-приложение, чтобы пользователи могли вводить свои запросы, а приложение будет вызывать модель чата Vertex AI и предоставлять ответ.