Научитесь создавать прототипы ответственного ИИ с помощью руководства PAIR и MakerSuite

1. Прежде чем начать

MakerSuite — это набор инструментов, позволяющих создавать прототипы с использованием больших языковых моделей прямо в браузере — без какой-либо настройки. С помощью MakerSuite вы можете быстро протестировать различные варианты подсказок и создать API, к которому ваше приложение сможет получить прямой доступ, что помогает командам быстро создавать отличные приложения на основе генеративного ИИ. Руководство People + AI Research (PAIR) предлагает рекомендации по разработке новых продуктов с использованием ИИ, уделяя особое внимание человекоориентированным методам работы с данными и завоеванию доверия пользователей — эти рекомендации применимы и к использованию MakerSuite.

В этом практическом занятии вы узнаете, как использовать эти два ресурса вместе для создания ответственных решений на основе ИИ. Основное внимание в занятии уделяется ответственному прототипированию с использованием генеративного ИИ, а не полному циклу работы с этими конкретными ресурсами. Чтобы узнать об общем рабочем процессе MakerSuite, ознакомьтесь с этим базовым руководством по MakerSuite, а также обратитесь к руководству PAIR для получения более подробных рекомендаций по проектированию продуктов на основе ИИ.

Предварительные требования

  • Базовое понимание искусственного интеллекта.
  • Необходимы некоторые знания о рабочем процессе разработки продукта.

Что вы узнаете

  • Как использовать руководство PAIR для анализа того, насколько хорошо ваши решения на основе ИИ работают для разных аудиторий, и как определить, для каких задач следует, а для каких не следует использовать ИИ.
  • Как создавать генеративные приложения на основе искусственного интеллекта, которые используют богатство культурных практик пользователей.
  • Как интегрировать возможности в процесс разработки ИИ, которые позволяют завоевать доверие пользователей, сосредоточившись на объяснимости для пользователя.
  • Как использовать более широкий набор материалов по генеративному искусственному интеллекту и ресурсов по человекоориентированному ИИ для дальнейших исследований.

Что вы построите

В этом практическом занятии вы пройдете через процесс прототипирования ответственного генеративного ИИ, разрабатывая инструмент для творческого письма. При желании вы даже сможете интегрировать разработанные вами подсказки в Wordcraft, текстовый редактор с открытым исходным кодом и поддержкой ИИ, выпущенный Google в качестве исследовательского прототипа.

Что вам понадобится

  • Браузер
  • Для доступа к MakerSuite необходима учетная запись Google.

2. Настройка

MakerSuite

MakerSuite — это набор инструментов Google, позволяющий создавать прототипы с использованием больших языковых моделей прямо из браузера — без какой-либо настройки. Вы можете быстро тестировать модели и экспериментировать с различными запросами. Когда вы создадите что-то, что вас устроит, вы можете легко экспортировать это в код Python, а затем вызывать те же модели, используя API генеративного языка.

Чтобы поэкспериментировать с большими языковыми моделями с помощью MakerSuite, запишитесь в список ожидания.

Руководство по исследованиям в области взаимодействия человека и искусственного интеллекта.

Справочник People + AI Research (PAIR) — это ресурс, который помогает разработчикам, дизайнерам, менеджерам по продуктам, студентам и многим другим ответственно использовать ИИ.

Руководство PAIR поможет вам и вашей команде составить список ключевых вопросов, связанных с искусственным интеллектом, включая генеративный ИИ, в вашем продукте.

  • Когда и как мне следует использовать ИИ в своем продукте?
  • Как мне помочь пользователям укрепить доверие к моей системе искусственного интеллекта?
  • Как мне объяснить пользователям работу моей системы искусственного интеллекта?
  • Как сделать использование ИИ культурно инклюзивным и ориентированным на равенство?

В ходе этого практического занятия вы будете использовать руководство PAIR для разработки вопросов для прототипирования и выбора различных вариантов дизайна.

Получите код для Wordcraft (необязательно)

Wordcraft — это текстовый редактор на основе искусственного интеллекта, разработанный в Google Research, который исследует возможности совместного написания историй людьми и ИИ. Код Wordcraft является открытым, поэтому вы можете самостоятельно экспериментировать с подсказками в этом практическом руководстве.

  • Чтобы получить код для Wordcraft, используйте следующую команду:
git clone https://github.com/pair-code/wordcraft

В качестве альтернативы вы можете скачать ZIP-файл:

TBD

3. Используйте генеративный ИИ для написания рассказов.

Большая языковая модель (БЯМ) — это модель искусственного интеллекта, которая обучается на огромных массивах текста из книг, статей и веб-сайтов с целью изучения грамматики, распространенных фраз и другой информации. На основе этих данных и с помощью дополнительной доработки БЯМ, такая как PaLM, может выполнять множество задач искусственного интеллекта, основываясь на простых инструкциях, а не на сложном программировании машинного обучения. Она также может отвечать на вопросы, обобщать информацию, переводить языки и выполнять множество других задач ИИ.

В этом практическом занятии вы используете LLM для создания прототипа приложения, помогающего авторам писать рассказы. Помимо общей информации о мире, грамматике и так далее, LLM PaLM от Google разработан для следования инструкциям или подсказкам пользователя. Таким образом, для создания прототипа вашего инструмента в MakerSuite вы обучаете свою модель тому, что нужно написать в ответ на подсказку пользователя.

Создавайте истории с помощью ИИ, используя текстовые подсказки в MakerSuite.

  1. Чтобы создать текстовую подсказку, нажмите кнопку «Создать новую» на левой панели и выберите «Текстовая подсказка» . Начните с этой подсказки:
You are a talented fiction author. Write a story about a given topic.
Topic: {{topic}}

После ввода этого запроса MakerSuite определит, что является входным параметром запроса, и откроет панель «Проверьте свой запрос», чтобы вы могли увидеть, как ваш запрос работает с различными входными данными.

  1. Введите команду A boy discovers a lost cat in his yard , затем щелкните панель модели (справа от кнопки " Запуск ") и выберите температуру 0.8 .
  2. Наконец, нажмите кнопку «Выполнить» , чтобы запустить командную строку. Вскоре вы увидите вывод командной строки в таблице.

Установка значения температуры 0.8 указывает модели на то, что вы предпочитаете разнообразие в результатах. Это приводит к созданию более креативных историй, но при каждом запуске результаты будут разными. Если вы хотите получать абсолютно одинаковые результаты каждый раз, установите температуру на 0 .

Один из возможных вариантов результата выглядит следующим образом:

Henry sat on the edge of his porch and swung his legs back and forth. A small cat ran in front of him. Henry petted the cat. The cat began to purr. Henry picked up the cat and placed it on his lap. The cat began to snuggle close to him. Henry decided to keep the cat.
  1. Попробуйте запустить запрос несколько раз и обратите внимание на разные истории, которые при этом создаются.

Скриншот редактора Makersuite. На изображении сверху отображается подсказка, а ниже — таблица тестовых входных данных «Проверьте свою подсказку».

Как видите, модель создает структурированный, логично выстроенный сюжет, но при этом делает несколько предположений. Например, в центре сюжета — мальчик по имени Генри. Вы можете изменить эти предположения, указав имя главного героя или даже определив, хотите ли вы, чтобы сюжет был посвящен котенку или человеку.

  1. Обновите приглашение командной строки, а затем нажмите «Выполнить», чтобы посмотреть, как оно работает со всеми тестовыми входными данными.

Определите задачи, наиболее подходящие для помощи ИИ, используя руководство PAIR.

Пока что предполагается, что модель ИИ пишет законченный рассказ, имея лишь краткое описание. Но является ли это правильным проектным решением для вашего инструмента для творчества? Например, представьте себе помощника, который помогает авторам переписывать части рассказа по своему выбору. Вы можете создать прототип этого взаимодействия, например, в MakerSuite, сделав фрагмент истории более драматичным .

Это обеспечивает гораздо более целенаправленную помощь, позволяя переписывать абзацы по одному. На более высоком уровне, внеся несколько изменений в ваше задание, вы можете создать прототип инструмента для расширения возможностей пользователя, а не инструмента для автоматизации задач.

Руководство PAIR предлагает принципиальный подход к постановке и поиску ответов на подобные вопросы в процессе разработки ИИ. В то время как MakerSuite помогает быстро создавать прототипы идей, руководство PAIR позволяет сузить круг вариантов дизайна до наиболее перспективных для ваших целей и целевой аудитории. Используйте руководство, чтобы понять, какой подход — расширение функционала или автоматизация — лучше всего подходит для сотрудничества с ИИ при создании вашего приложения.

Начните с вопроса «Как мне использовать ИИ?» из руководства. Как отмечается в этом руководстве, лучше использовать ИИ, когда он приносит уникальную пользу. В данном случае, поскольку модели LLM обучаются на большом количестве данных о грамматике, распространенных фразах и другой информации из интернета, может быть полезно использовать способность модели понимать мир истории, которую вы хотите описать в результате работы вашего приложения для написания текстов, и предлагать способы ее переписывания. Это развивает идею персонализированных рекомендаций из руководства.

Идем дальше. В руководстве PAIR есть глава, посвященная потребностям пользователей, с рекомендациями о том, следует ли автоматизировать или дополнять задачи .

При рассмотрении вариантов расширения функциональности или автоматизации помните, что ваш прототип предназначен для использования в качестве полезного приложения для писателей. Поэтому, вероятно, ваши пользователи любят писать, хотят лично контролировать свои тексты и имеют предпочтения, сформировавшиеся за годы писательской деятельности, которые может быть сложно выразить словами. В совокупности это говорит о том, что подход с использованием расширения функциональности может быть более перспективным вариантом.

Исходя из руководства PAIR, возможно, имеет смысл рассматривать создаваемое вами прототипное приложение не как инструмент для написания текста, а как инструмент для его переписывания. Например, вы можете изменить задание, чтобы оно допускало разные стили письма.

  1. Создайте новую текстовую подсказку:
Edit the paragraph below. Make it \{\{rewrite style\}\}. Only respond with the updated text. Do not include any explanation.

Paragraph: {{paragraph}}

Здесь и \{\{rewrite style\}\} и являются текстовыми полями ввода.

  1. В ходе тестирования попробуйте различные стили переписывания текста, такие как более короткий , более драматичный , более остроумный , менее грамматически неуклюжий , поэтический и так далее.

Дизайн для историй со всего мира

До сих пор вы тестировали подсказку «переписать абзац» на примерах историй, в которых отсутствует четкий культурный контекст. При разработке проектов, использующих ответственный ИИ, часто бывает полезно опробовать разнообразные входные данные.

Попробуйте несколько тестовых входных данных, например:

  • В тихом уголке очаровательного парижского кафе одинокий посетитель наслаждался ароматом свежесваренного кофе, его мысли возвращались к давно забытому моменту, навсегда изменившему ход его жизни.
  • В суматохе пригородного поезда в Мумбаи женщина средних лет завязала разговор с незнакомцем. Как же это удивительно, подумала она, жить в одном городе и иметь такие разные жизни.
  • В разгар бурного хаоса оживленного шанхайского уличного рынка продавец уличной еды на мгновение остановился, чтобы понаблюдать за приливами и отливами толпы.

Экспериментируйте с другими культурными и географическими контекстами ответственно, избегая предвзятости и исторических стереотипов. Обратите внимание, что, хотя магистр права обладает знаниями о многих частях мира, основанными на существующих данных, найденных в интернете, он может неточно передать все детали конкретного географического места. Как указывается в руководстве PAIR, в задачах расширения функционала важно предоставлять пользователям контроль. Например, вы можете расширить возможности переписывания вашего прототипа, чтобы обеспечить больший контроль над сюжетом и деталями истории.

Многие генеративные модели иногда также демонстрируют предположения по умолчанию, отчасти из-за закономерностей, более распространенных в их огромных обучающих наборах данных онлайн-информации. Важно знать, что модели можно направлять на принятие других, столь же обоснованных предположений. Например, в вашем предложении переписать абзац выше вы можете указать пол незнакомца в поезде, изменив стиль переписывания и написав: « короче. Помните, что незнакомец тоже женщина ».

4. Завоевывайте доверие.

Без доверия пользователей даже самые инновационные возможности ИИ могут остаться невостребованными. Доверие возникает, когда пользователи чувствуют, что ИИ компетентен, надежен и полезен. Развитие доверия у пользователей может побудить их научиться использовать определенные функции и понимать, когда это необходимо, что в целом приведет к улучшению пользовательского опыта.

В руководстве PAIR предлагается несколько советов , которые помогут пользователям определить, насколько им следует доверять системам искусственного интеллекта:

Завоевывайте доверие с самого начала.

В случае генеративного ИИ особенно важно объяснять назначение функций и помогать пользователям понимать ограничения ИИ. Например, поскольку языковые модели предназначены в первую очередь для прогнозирования дальнейшего текста, их результаты могут быть не всегда точными с фактической точки зрения. Поэтому важно помочь пользователям понять, что этот прототип является вспомогательным средством для творческого письма и не предназначен для проверки фактов. Если пользователь хочет проверить достоверность информации, которую он считает достоверной, ему следует обратиться к надежным онлайн-ресурсам.

Придумайте несколько способов, как вы могли бы помочь пользователям понять, что этот прототип не предназначен для написания фактической информации, а разработан специально для написания художественной литературы.

Сохраняйте доверие

Аналогично, хотя модели генеративного ИИ обладают широкими возможностями, пользователи не всегда могут проверить правильность выполнения задач во многих конкретных сценариях использования. Например, этот прототип разработан для целенаправленного завершения текста и целенаправленной переработки художественной литературы — возможностей, которые пользователи могут легко проверить. В отличие от этого, хотя генеративные модели легко могут быть задействованы для переработки больших фрагментов текста, пользователи могут пропустить незаметные ошибки, которые могли бы возникнуть. В целом, сосредоточение интерактивных функций генеративного ИИ на задачах, которые пользователи могут легко проверить, помогает завоевать их доверие.

Ещё один способ сохранить доверие — использовать управляемость генеративных моделей. В отличие от предыдущих моделей ИИ, предназначенных для узкоспециализированной задачи, результаты работы генеративных моделей гораздо проще настраивать для конечных пользователей (что демонстрируется запросами на более радикальные , короткие или аналогичные варианты переписывания текста). Хотя такая управляемость может привести к улучшению пользовательского опыта, следует позаботиться о том, чтобы ограничить её возможностями модели. Например, в этом прототипе вместо того, чтобы спрашивать пользователей о способах переписывания текста, можно предложить пользователю список проверенных вариантов переписывания в качестве рекомендаций.

Восстановить утраченное доверие

Несмотря на все ваши усилия, могут быть случаи, когда модель дает неоптимальные результаты. В таких случаях важно предоставить пользователям возможность отменить любые действия ИИ. Аналогично, часто лучше выявлять функции с переменной производительностью и запускать их только тогда, когда пользователи явно запрашивают помощь ИИ.

  • Продумайте несколько различных способов создания функций отмены действий или других способов восстановления доверия пользователей.

Решения этих задач можно найти в разделе "Решения к лабораторной работе".

5. Соберите всё вместе

До сих пор вы экспериментировали с подсказками в MakerSuite. Когда вас устроят эти подсказки, используйте их непосредственно в своем прототипе.

  • Сначала сохраните запрос, а затем нажмите «Получить код» в правом верхнем углу. Если вы еще этого не сделали, вам также необходимо активировать свой API-ключ, нажав «Включить API-ключ» в появившемся диалоговом окне «Получить код» .

Панель инструментов Maker Suite. Кнопка «Получить код» находится в правом верхнем углу.

MakerSuite генерирует код, который можно использовать непосредственно в вашем приложении. Например, для использования в веб-приложении выберите код JavaScript. Вы можете скопировать код прямо из диалогового окна и вставить его в ваше веб-приложение. Если вы обновляете подсказку в MakerSuite, не забудьте обновить ее в своем коде, используя переменную подсказки из включенного кода.

Диалоговое окно, отображающее код, сгенерированный Makersuite. Пользователи могут выбрать между использованием cURL, библиотек JavaScript или Python, либо получением информации из командной строки в формате JSON.

Если вы хотите интегрировать этот API в готовое приложение для творческого письма, вы можете скачать код Wordcraft.

Решение Codelab

Код для Wordcraft можно найти на GitHub:

git clone https://github.com/pair-code/wordcraft

В качестве альтернативы вы можете загрузить репозиторий в виде ZIP-архива:

6. Поздравляем!

Вы успешно завершили курс « Научитесь создавать прототипы ответственного ИИ с помощью руководства PAIR и практического занятия по MakerSuite» и научились создавать прототипы ответственных приложений на основе ИИ (в данном случае, для приложения для творческого письма) с помощью нескольких инструментов Google. Нам не терпится увидеть, что вы создадите!

Дополнительная информация