Приложение чата с PaLM API в Cloud Run

1. Введение

В этой лаборатории кода показано, как создать и развернуть приложение чата на основе искусственного интеллекта в веб-приложении в качестве службы Cloud Run в Google Cloud. Это чат-приложение позволяет пользователям задавать вопросы и получать ответы, используя модель PaLM for Chat Bison ( текстовый чат ).

Что ты построишь

Вы создадите

  • Среда в Google Cloud для запуска приложения
  • Docker-образ для приложения
  • Служба Cloud Run, которая запускает приложение.

2. Требования

  • Браузер, например Chrome или Firefox.
  • Проект Google Cloud с включенной оплатой

3. Прежде чем начать

  1. В Google Cloud Console на странице выбора проекта выберите или создайте проект Google Cloud.
  2. Убедитесь, что для вашего проекта Google Cloud включена оплата. Узнайте, как проверить, включена ли оплата в проекте.
  3. Активируйте Cloud Shell из консоли Google Cloud, следуя инструкциям здесь.
  4. Если ваш проект не установлен, используйте следующую команду, чтобы установить его:
gcloud config set project <YOUR_PROJECT_ID>
  1. В Cloud Shell установите следующие переменные среды:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Включите необходимые API Google Cloud, выполнив следующие команды в терминале Cloud Shell:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Настройте свою среду

  1. Чтобы скопировать пример кода в свой проект, клонируйте репозиторий в Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. Эта команда клонирует содержимое репозитория в папку genai-templates-googlecloud.
  2. Перейдите в папку интересующего нас проекта, выполнив следующую команду из терминала Cloud Shell:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Установите следующие переменные среды для инициализации Vertex AI:

GCP_PROJECT: идентификатор вашего проекта Google Cloud. Например: мой_проект.

GCP_REGION: регион, в котором вы хотите развернуть свою облачную функцию. Например: нас-централ1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Создайте образ докера

Чтобы создать образ Docker для приложения и отправить его в реестр артефактов, выполните следующие действия:

  1. Установите переменную среды для репозитория реестра артефактов. Имена могут содержать только строчные буквы, цифры и дефисы, должны начинаться с буквы и заканчиваться буквой или цифрой. Например: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Установите переменную среды для имени вашей службы. Например: чат-флак-приложение.
export SERVICE_NAME='chat-flask-app'
  1. Создайте свой репозиторий в формате Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Настройте аутентификацию докера.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Создайте образ.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Чтобы проверить, отправлено ли изображение в реестр артефактов, перейдите на страницу реестра артефактов. Найдите репозиторий, который вы создали на этой странице.

6. Разверните приложение

  1. Разверните приложение как сервис в Cloud Run.
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Выполнение этого шага может занять несколько секунд.

  1. Чтобы запустить приложение чата, щелкните URL-адрес службы.

56c06b62e0ac95bf.png

Приложение чата откроется в новой вкладке, как показано на следующем снимке экрана:

eebde9c35c171563.png

7. Очистка

Чтобы избежать списания средств с вашей учетной записи Google Cloud за ресурсы, используемые в этом посте, выполните следующие действия:

  1. В консоли Google Cloud перейдите на страницу «Управление ресурсами» .
  2. В списке проектов выберите проект, который хотите удалить, и нажмите «Удалить».
  3. В диалоговом окне введите идентификатор проекта, а затем нажмите «Завершить работу» , чтобы удалить проект.
  4. Если вы хотите сохранить свой проект, пропустите вышеуказанные шаги и удалите службу Cloud Run, перейдя в Cloud Run и в списке служб отметьте ту, которую хотите удалить, и нажмите УДАЛИТЬ.

8. Поздравления

Поздравляем! Вы успешно создали и развернули приложение чата на основе искусственного интеллекта для веб-приложения в качестве службы Cloud Run в Google Cloud. Вы можете использовать это приложение чата, чтобы позволить вашим пользователям вводить свои запросы, и это приложение будет вызывать модель чата Vertex AI и предоставлять ответ.