Эта страница переведена с помощью Cloud Translation API.

Использование API преобразования текста в речь с C#

1. Обзор

Google Cloud Text-to-Speech API (бета-версия) позволяет разработчикам включать в свои приложения естественную синтетическую человеческую речь в качестве воспроизводимого звука. API преобразования текста в речь преобразует ввод текста или языка разметки речи (SSML) в аудиоданные, такие как MP3 или LINEAR16 (кодировка, используемая в файлах WAV).

В этой лабораторной работе вы сосредоточитесь на использовании API преобразования текста в речь с C#. Вы научитесь составлять список доступных голосов, а также синтезировать звук из текста.

Что вы узнаете

Как использовать Cloud Shell
Как включить API преобразования текста в речь
Как аутентифицировать запросы API
Как установить клиентскую библиотеку Google Cloud для C#
Как вывести список доступных голосов
Как синтезировать звук из текста

Что вам понадобится

Проект облачной платформы Google
Браузер, например Chrome или Firefox.
Знакомство с C#

Опрос

Как вы будете использовать этот урок?

Прочтите только до конца

Прочитайте его и выполните упражнения.

Как бы вы оценили свой опыт работы с C#?

Новичок

Средний

Опытный

Как бы вы оценили свой опыт использования сервисов Google Cloud Platform?

Новичок

Средний

Опытный

2. Настройка и требования

Самостоятельная настройка среды

Войдите в Google Cloud Console и создайте новый проект или повторно используйте существующий. Если у вас еще нет учетной записи Gmail или Google Workspace, вам необходимо ее создать .

Имя проекта — это отображаемое имя для участников этого проекта. Это строка символов, не используемая API Google. Вы всегда можете обновить его.
Идентификатор проекта уникален для всех проектов Google Cloud и является неизменяемым (невозможно изменить после его установки). Cloud Console автоматически генерирует уникальную строку; обычно тебя не волнует, что это такое. В большинстве лабораторий кода вам потребуется указать идентификатор проекта (обычно идентифицируемый как PROJECT_ID ). Если вам не нравится сгенерированный идентификатор, вы можете создать другой случайный идентификатор. Альтернативно, вы можете попробовать свой собственный и посмотреть, доступен ли он. Его нельзя изменить после этого шага и он сохраняется на протяжении всего проекта.
К вашему сведению, есть третье значение — номер проекта , которое используют некоторые API. Подробнее обо всех трех этих значениях читайте в документации .

Затем вам необходимо включить выставление счетов в Cloud Console, чтобы использовать облачные ресурсы/API. Прохождение этой лаборатории кода не будет стоить много, если вообще что-то стоить. Чтобы отключить ресурсы и избежать выставления счетов за пределами этого руководства, вы можете удалить созданные вами ресурсы или удалить проект. Новые пользователи Google Cloud имеют право на участие в программе бесплатной пробной версии стоимостью 300 долларов США .

Запустить Cloud Shell

Хотя Google Cloud можно управлять удаленно с вашего ноутбука, в этой лаборатории вы будете использовать Google Cloud Shell , среду командной строки, работающую в облаке.

Активировать Cloud Shell

В Cloud Console нажмите «Активировать Cloud Shell». .

Если вы запускаете Cloud Shell впервые, вы увидите промежуточный экран с описанием того, что это такое. Если вам был представлен промежуточный экран, нажмите «Продолжить» .

Подготовка и подключение к Cloud Shell займет всего несколько минут.

Эта виртуальная машина загружена всеми необходимыми инструментами разработки. Он предлагает постоянный домашний каталог объемом 5 ГБ и работает в Google Cloud, что значительно повышает производительность сети и аутентификацию. Большую часть, если не всю, работу в этой лаборатории кода можно выполнить с помощью браузера.

После подключения к Cloud Shell вы увидите, что вы прошли аутентификацию и что для проекта установлен идентификатор вашего проекта.

Выполните следующую команду в Cloud Shell, чтобы подтвердить, что вы прошли аутентификацию:

gcloud auth list

Вывод команды

 Credentialed Accounts
ACTIVE  ACCOUNT
*       <my_account>@<my_domain.com>

To set the active account, run:
    $ gcloud config set account `ACCOUNT`

Выполните следующую команду в Cloud Shell, чтобы убедиться, что команда gcloud знает о вашем проекте:

gcloud config list project

Вывод команды

[core]
project = <PROJECT_ID>

Если это не так, вы можете установить это с помощью этой команды:

gcloud config set project <PROJECT_ID>

Вывод команды

Updated property [core/project].

3. Включите API преобразования текста в речь.

Прежде чем вы сможете начать использовать API преобразования текста в речь, вы должны включить API. Вы можете включить API, используя следующую команду в Cloud Shell:

gcloud services enable texttospeech.googleapis.com

Примечание. Если эта команда выдает ОШИБКУ, убедитесь, что текущий идентификатор проекта соответствует идентификатору проекта вашей кодовой лаборатории.

Используйте следующую команду, чтобы найти текущий идентификатор проекта, используемый Cloud Shell:

gcloud info | grep "project"

Если идентификатор проекта неверен, используйте следующую команду, чтобы использовать правильный идентификатор проекта:

gcloud config set project <PROJECT_ID>

Замените <PROJECT_ID> правильным идентификатором проекта.

4. Установите клиентскую библиотеку Google Cloud Text-to-Speech API для C#.

Сначала создайте простое консольное приложение C#, которое вы будете использовать для запуска примеров API преобразования текста в речь:

dotnet new console -n TextToSpeechApiDemo

Вы должны увидеть созданное приложение и разрешенные зависимости:

The template "Console Application" was created successfully.
Processing post-creation actions...
...
Restore succeeded.

Затем перейдите в папку TextToSpeechApiDemo :

cd TextToSpeechApiDemo/

И добавьте в проект пакет Google.Cloud.TextToSpeech.V1 NuGet:

dotnet add package Google.Cloud.TextToSpeech.V1

info : Adding PackageReference for package 'Google.Cloud.TextToSpeech.V1' into project '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.
log  : Restoring packages for /home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj...
...
info : PackageReference for package 'Google.Cloud.TextToSpeech.V1' version '1.0.0-beta01' added to file '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.

Теперь вы готовы использовать API преобразования текста в речь!

5. Список доступных голосов

В этом разделе вы сначала перечислите все доступные голоса на английском языке для синтеза звука.

Сначала откройте редактор кода в правом верхнем углу Cloud Shell:

Перейдите к файлу Program.cs в папке TextToSpeechApiDemo и замените код следующим:

using Google.Cloud.TextToSpeech.V1;
using System;

namespace TextToSpeechApiDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var client = TextToSpeechClient.Create();
            var response = client.ListVoices("en");
            foreach (var voice in response.Voices)
            {
                Console.WriteLine($"{voice.Name} ({voice.SsmlGender}); Language codes: {string.Join(", ", voice.LanguageCodes)}");
            }
        }
    }
}

Уделите минуту или две изучению кода*.* Вернувшись в Cloud Shell, запустите приложение:

dotnet run

Вы должны увидеть следующий вывод:

en-US-Wavenet-D (Male); Language codes: en-US
en-AU-Wavenet-A (Female); Language codes: en-AU
en-AU-Wavenet-B (Male); Language codes: en-AU
en-AU-Wavenet-C (Female); Language codes: en-AU
en-AU-Wavenet-D (Male); Language codes: en-AU
en-GB-Wavenet-A (Female); Language codes: en-GB
en-GB-Wavenet-B (Male); Language codes: en-GB
en-GB-Wavenet-C (Female); Language codes: en-GB
...
en-GB-Standard-A (Female); Language codes: en-GB
en-GB-Standard-B (Male); Language codes: en-GB
en-AU-Standard-D (Male); Language codes: en-AU

Примечание. Если этот код C# вам не подходит, проверьте инструкции, которые вы выполнили на этапе проверки подлинности запросов API .

Используя следующую команду, чтобы проверить значение переменной среды GOOGLE_APPLICATION_CREDENTIALS :

echo GOOGLE_APPLICATION_CREDENTIALS

Он должен вывести значение " ~/key.json ".

Если да, то проверьте, что учетная запись службы была создана и находится по адресу " ~/key.json " , используя:

cat "~/key.json"

Вы должны увидеть что-то похожее на:

{

"type": "service_account",

"project_id": "PROJECT_ID",

"private_key_id": "ff31939192529e07f42e4535fb20bb029def1276",

"Private_key":...

Если вы этого не сделаете, вернитесь к шагу «Аутентификация запросов API» .

Краткое содержание

На этом этапе вы смогли составить список всех доступных голосов на английском языке для синтеза звука. Вы также можете найти полный список голосов, доступных на странице «Поддерживаемые голоса» .

6. Синтезируйте аудио из текста

Вы можете использовать API преобразования текста в речь для преобразования строки в аудиоданные. Вы можете настроить выходные данные синтеза речи различными способами, включая выбор уникального голоса или модуляцию выходных данных по высоте, громкости, скорости речи и частоте дискретизации .

Чтобы синтезировать аудиофайл из текста, перейдите к файлу Program.cs в папке TextToSpeechApiDemo и замените код следующим:

using Google.Cloud.TextToSpeech.V1;
using System;
using System.IO;

namespace TextToSpeechApiDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var client = TextToSpeechClient.Create();

            // The input to be synthesized, can be provided as text or SSML.
            var input = new SynthesisInput
            {
                Text = "This is a demonstration of the Google Cloud Text-to-Speech API"
            };

            // Build the voice request.
            var voiceSelection = new VoiceSelectionParams
            {
                LanguageCode = "en-US",
                SsmlGender = SsmlVoiceGender.Female
            };

            // Specify the type of audio file.
            var audioConfig = new AudioConfig
            {
                AudioEncoding = AudioEncoding.Mp3
            };

            // Perform the text-to-speech request.
            var response = client.SynthesizeSpeech(input, voiceSelection, audioConfig);
            
            // Write the response to the output file.
            using (var output = File.Create("output.mp3"))
            {
                response.AudioContent.WriteTo(output);
            }
            Console.WriteLine("Audio content written to file \"output.mp3\"");
        }
    }
}

Уделите минуту или две, чтобы изучить код и посмотреть, как он используется для создания аудиофайла из текста*.*

Вернувшись в Cloud Shell, запустите приложение:

dotnet run

Вы должны увидеть следующий вывод:

Audio content written to file "output.mp3"

В редакторе кода вы можете загрузить mp3-файл и воспроизвести его локально на своем компьютере.

a4b9578505422дад.png

Краткое содержание

На этом этапе вы смогли использовать API преобразования текста в речь для преобразования строки в аудиофайл mp3. Узнайте больше о создании голосовых аудиофайлов .

7. Поздравляем!

Вы узнали, как использовать API преобразования текста в речь с помощью C# для выполнения различных видов транскрипции аудиофайлов!

Очистить

Чтобы избежать списания средств с вашей учетной записи Google Cloud Platform за ресурсы, используемые в этом кратком руководстве:

Перейдите в консоль облачной платформы .
Выберите проект, который хотите закрыть, затем нажмите «Удалить» вверху: это запланирует удаление проекта.

Узнать больше

API преобразования текста в речь Google Cloud: https://cloud.google.com/text-to-speech/docs
C#/.NET на облачной платформе Google: https://cloud.google.com/dotnet/
Клиент Google Cloud .NET: https://googlecloudplatform.github.io/google-cloud-dotnet/

Лицензия

Эта работа распространяется под лицензией Creative Commons Attribution 2.0 Generic License.