1. Panoramica
L'API Cloud Text-to-Speech di Google (beta) consente agli sviluppatori di includere nelle loro applicazioni la sintesi vocale naturale e dal suono naturale come audio riproducibile. L'API Text-to-Speech converte testo o input Speech Synthesis Markup Language (SSML) in dati audio come MP3 o LINEAR16 (la codifica utilizzata nei file WAV).
In questo codelab, ti concentrerai sull'utilizzo dell'API Text-to-Speech con C#. Imparerai a elencare le voci disponibili e a sintetizzare l'audio dal testo.
Cosa imparerai a fare
- Come utilizzare Cloud Shell
- Come abilitare l'API Text-to-Speech
- Come autenticare le richieste API
- Come installare la libreria client di Google Cloud per C#
- Come elencare le voci disponibili
- Come sintetizzare l'audio dal testo
Che cosa ti serve
Sondaggio
Come utilizzerai questo tutorial?
Come valuteresti la tua esperienza con C#?
Come giudichi la tua esperienza di utilizzo dei servizi della piattaforma Google Cloud?
2. Configurazione e requisiti
Configurazione dell'ambiente da seguire in modo autonomo
- Accedi alla console Google Cloud e crea un nuovo progetto o riutilizzane uno esistente. Se non hai ancora un account Gmail o Google Workspace, devi crearne uno.
- Il Nome progetto è il nome visualizzato dei partecipanti del progetto. Si tratta di una stringa di caratteri non utilizzata dalle API di Google. Puoi sempre aggiornarla.
- L'ID progetto è univoco in tutti i progetti Google Cloud ed è immutabile (non può essere modificato dopo essere stato impostato). La console Cloud genera automaticamente una stringa univoca. di solito non ti importa cosa sia. Nella maggior parte dei codelab, dovrai fare riferimento al tuo ID progetto (in genere identificato come
PROJECT_ID
). Se l'ID generato non ti soddisfa, potresti generarne un altro casuale. In alternativa, puoi provarne una personalizzata per verificare se è disponibile. Non può essere modificato dopo questo passaggio e rimane per tutta la durata del progetto. - Per informazione, c'è un terzo valore, un numero di progetto, utilizzato da alcune API. Scopri di più su tutti e tre questi valori nella documentazione.
- Successivamente, dovrai abilitare la fatturazione nella console Cloud per utilizzare risorse/API Cloud. L'esecuzione di questo codelab non ha alcun costo. Per arrestare le risorse ed evitare di incorrere in fatturazione dopo questo tutorial, puoi eliminare le risorse che hai creato o eliminare il progetto. I nuovi utenti di Google Cloud sono idonei al programma prova senza costi di 300$.
Avvia Cloud Shell
Anche se Google Cloud può essere utilizzato da remoto dal tuo laptop, in questo codelab utilizzerai Google Cloud Shell, un ambiente a riga di comando in esecuzione nel cloud.
Attiva Cloud Shell
- Dalla console Cloud, fai clic su Attiva Cloud Shell .
Se è la prima volta che avvii Cloud Shell, ti verrà mostrata una schermata intermedia che descrive di cosa si tratta. Se ti è stata presentata una schermata intermedia, fai clic su Continua.
Il provisioning e la connessione a Cloud Shell dovrebbero richiedere solo qualche istante.
Questa macchina virtuale viene caricata con tutti gli strumenti di sviluppo necessari. Offre una home directory permanente da 5 GB e viene eseguita in Google Cloud, migliorando notevolmente le prestazioni di rete e l'autenticazione. Gran parte, se non tutto, del lavoro in questo codelab può essere svolto con un browser.
Una volta stabilita la connessione a Cloud Shell, dovresti vedere che hai eseguito l'autenticazione e che il progetto è impostato sul tuo ID progetto.
- Esegui questo comando in Cloud Shell per verificare che l'account sia autenticato:
gcloud auth list
Output comando
Credentialed Accounts ACTIVE ACCOUNT * <my_account>@<my_domain.com> To set the active account, run: $ gcloud config set account `ACCOUNT`
- Esegui questo comando in Cloud Shell per confermare che il comando gcloud è a conoscenza del tuo progetto:
gcloud config list project
Output comando
[core] project = <PROJECT_ID>
In caso contrario, puoi impostarlo con questo comando:
gcloud config set project <PROJECT_ID>
Output comando
Updated property [core/project].
3. Abilita l'API Text-to-Speech
Prima di poter iniziare a utilizzare l'API Text-to-Speech, devi abilitare l'API. Puoi abilitare l'API utilizzando il comando seguente in Cloud Shell:
gcloud services enable texttospeech.googleapis.com
4. Installa la libreria client dell'API Google Cloud Text-to-Speech per C#
Innanzitutto, crea una semplice applicazione console C# che utilizzerai per eseguire esempi dell'API Text-to-Speech:
dotnet new console -n TextToSpeechApiDemo
Dovresti vedere l'applicazione creata e le dipendenze risolte:
The template "Console Application" was created successfully.
Processing post-creation actions...
...
Restore succeeded.
Quindi, vai alla cartella TextToSpeechApiDemo
:
cd TextToSpeechApiDemo/
E aggiungi il pacchetto NuGet Google.Cloud.TextToSpeech.V1
al progetto:
dotnet add package Google.Cloud.TextToSpeech.V1
info : Adding PackageReference for package 'Google.Cloud.TextToSpeech.V1' into project '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.
log : Restoring packages for /home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj...
...
info : PackageReference for package 'Google.Cloud.TextToSpeech.V1' version '1.0.0-beta01' added to file '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.
Ora è tutto pronto per utilizzare l'API Text-to-Speech.
5. Elenco voci disponibili
In questa sezione, elenca innanzitutto tutte le voci disponibili in inglese per la sintesi audio.
Innanzitutto, apri l'editor di codice dall'angolo in alto a destra di Cloud Shell:
Vai al file Program.cs
all'interno della cartella TextToSpeechApiDemo
e sostituisci il codice con il seguente:
using Google.Cloud.TextToSpeech.V1;
using System;
namespace TextToSpeechApiDemo
{
class Program
{
static void Main(string[] args)
{
var client = TextToSpeechClient.Create();
var response = client.ListVoices("en");
foreach (var voice in response.Voices)
{
Console.WriteLine($"{voice.Name} ({voice.SsmlGender}); Language codes: {string.Join(", ", voice.LanguageCodes)}");
}
}
}
}
Prenditi un minuto o due per studiare il codice*.* Torna in Cloud Shell ed esegui l'app:
dotnet run
Dovresti vedere l'output seguente:
en-US-Wavenet-D (Male); Language codes: en-US
en-AU-Wavenet-A (Female); Language codes: en-AU
en-AU-Wavenet-B (Male); Language codes: en-AU
en-AU-Wavenet-C (Female); Language codes: en-AU
en-AU-Wavenet-D (Male); Language codes: en-AU
en-GB-Wavenet-A (Female); Language codes: en-GB
en-GB-Wavenet-B (Male); Language codes: en-GB
en-GB-Wavenet-C (Female); Language codes: en-GB
...
en-GB-Standard-A (Female); Language codes: en-GB
en-GB-Standard-B (Male); Language codes: en-GB
en-AU-Standard-D (Male); Language codes: en-AU
Riepilogo
In questo passaggio hai potuto elencare tutte le voci disponibili in inglese per la sintesi audio. Puoi anche trovare l'elenco completo delle voci disponibili nella pagina Voci supportate.
6. Sintetizza audio dal testo
Puoi utilizzare l'API Text-to-Speech per convertire una stringa in dati audio. Puoi configurare l'output della sintesi vocale in diversi modi, ad esempio selezionando una voce univoca o modulando l'output in termini di tonalità, volume, velocità del parlato e frequenza di campionamento.
Per sintetizzare un file audio dal testo, vai al file Program.cs
all'interno della cartella TextToSpeechApiDemo
e sostituisci il codice con quanto segue:
using Google.Cloud.TextToSpeech.V1;
using System;
using System.IO;
namespace TextToSpeechApiDemo
{
class Program
{
static void Main(string[] args)
{
var client = TextToSpeechClient.Create();
// The input to be synthesized, can be provided as text or SSML.
var input = new SynthesisInput
{
Text = "This is a demonstration of the Google Cloud Text-to-Speech API"
};
// Build the voice request.
var voiceSelection = new VoiceSelectionParams
{
LanguageCode = "en-US",
SsmlGender = SsmlVoiceGender.Female
};
// Specify the type of audio file.
var audioConfig = new AudioConfig
{
AudioEncoding = AudioEncoding.Mp3
};
// Perform the text-to-speech request.
var response = client.SynthesizeSpeech(input, voiceSelection, audioConfig);
// Write the response to the output file.
using (var output = File.Create("output.mp3"))
{
response.AudioContent.WriteTo(output);
}
Console.WriteLine("Audio content written to file \"output.mp3\"");
}
}
}
Prenditi un minuto o due per studiare il codice e vedere come viene utilizzato per creare un file audio a partire dal testo*.*
Torna in Cloud Shell ed esegui l'app:
dotnet run
Dovresti vedere l'output seguente:
Audio content written to file "output.mp3"
All'interno dell'editor di codice, puoi scaricare il file mp3 e riprodurlo localmente sul tuo computer.
Riepilogo
In questo passaggio, hai potuto utilizzare l'API Text-to-Speech per convertire una stringa in un file audio mp3. Scopri di più sulla creazione di file audio vocali.
7. Complimenti
Hai imparato a utilizzare l'API Text-to-Speech usando C# per eseguire diversi tipi di trascrizione sui file audio.
Esegui la pulizia
Per evitare che al tuo account Google Cloud Platform vengano addebitate le risorse utilizzate in questa guida rapida, procedi come segue.
- Vai alla console di Cloud Platform.
- Seleziona il progetto che vuoi chiudere e fai clic su "Elimina". in alto: in questo modo viene pianificata l'eliminazione del progetto.
Scopri di più
- API Google Cloud Text-to-Speech: https://cloud.google.com/text-to-speech/docs
- C#/.NET su Google Cloud: https://cloud.google.com/dotnet/
- Client Google Cloud .NET: https://googlecloudplatform.github.io/google-cloud-dotnet/
Licenza
Questo lavoro è concesso in licenza ai sensi di una licenza Creative Commons Attribution 2.0 Generic.