Informazioni su questo codelab
1. Panoramica
Introduzione
Gemini 2.5 Pro è il modello più efficace di Google per la programmazione e la conoscenza del mondo.
Con la serie 2.5, i modelli Gemini sono ora modelli di ragionamento ibridi. Gemini 2.5 Pro può applicare un'ampia quantità di pensiero alle attività e utilizzare strumenti per massimizzare l'accuratezza delle risposte.
Gemini 2.5 Pro è:
- Un miglioramento significativo rispetto ai modelli precedenti per quanto riguarda funzionalità quali programmazione, ragionamento e multimodalità.
- Leader del settore nel ragionamento con prestazioni all'avanguardia nei benchmark di matematica e STEM.
- Un modello straordinario per il codice, con uno sviluppo web particolarmente avanzato.
- Particolarmente adatto per prompt complessi, ma comunque completo, incluso il numero 1 su LMSys.
Obiettivi didattici
In questo tutorial imparerai a utilizzare l'API Gemini e l'SDK Google Gen AI per Python con il modello Gemini 2.5 Pro.
Dovrai completare le seguenti attività:
- Genera testo da prompt di testo
- Generare testo in streaming
- Avviare chat a più turni
- Utilizzare metodi asincroni
- Configura i parametri del modello
- Impostare le istruzioni di sistema
- Utilizzare i filtri di sicurezza
- Utilizzare la generazione controllata
- Contare i token
- Elaborare dati multimodali (audio, codice, documenti, immagini, video)
- Utilizza chiamate di funzione automatiche e manuali
- Esecuzione del codice
- Esempi di modalità di pensiero
2. Prima di iniziare
Prerequisiti
Prima di poter iniziare, devi disporre di un progetto Google Cloud con un account di fatturazione valido. Seleziona il progetto Google Cloud che vuoi utilizzare.
Per eseguire il codelab, utilizzeremo Colab Enterprise, un ambiente di notebook gestito e collaborativo con le funzionalità di sicurezza e conformità di Google Cloud.
Abilita le API richieste
Fai clic sul pulsante di seguito per abilitare le API necessarie per questo codelab nel tuo progetto Google Cloud: Vertex AI, Dataform e Compute Engine.
Copia il notebook di Colab in Google Cloud
Fai clic sul pulsante di seguito per aprire il notebook del tutorial in Colab Enterprise. Verrà creata una copia del blocco note di Colab nel tuo progetto Google Cloud attuale, che ti consentirà di eseguirlo.
Iniziamo.
3. Inizializza l'ambiente
Ora che abbiamo creato il notebook di Colab, possiamo eseguire il codice fornito al suo interno. I primi passaggi installano le dipendenze e importano le librerie necessarie.
Esegui i passaggi descritti nella sezione Inizia
Innanzitutto, esegui le celle della sezione Inizia a utilizzare una dopo l'altra.
Nota:puoi eseguire una cella tenendo premuto il puntatore del mouse sopra la cella di codice da eseguire e facendo clic sull'icona Esegui cella.
Alla fine di questa sezione avrai svolto le seguenti operazioni.
- Installa l'SDK Google Gen AI per Python
- Importa le librerie necessarie per il lab
- Configura un progetto Google Cloud per utilizzare Vertex AI
Ora utilizziamo Gemini 2.5 Pro per generare testo
4. Genera testo con Gemini
In questa sezione del notebook, utilizzerai Gemini 2.5 Pro per generare i completamenti di testo.
Vai avanti ed esegui l'insieme di celle successivo nel notebook, prenditi il tempo di leggere il codice e capire come utilizzare l'SDK Google GenAI.
Al termine di questa sezione, avrai appreso quanto segue.
- Come specificare il modello da utilizzare.
- Generazione di output non in streaming e in streaming.
- Utilizzo della funzionalità di chat a più turni dell'SDK.
- Chiamata dell'SDK in modo asincrono.
- Configurazione dei parametri del modello.
- Impostazione delle istruzioni di sistema per personalizzare il comportamento del modello.
- Configurazione dei filtri di sicurezza dei contenuti.
Vediamo ora come inviare prompt multimodali a Gemini
5. Prompt multimodali
In questa sezione del notebook, utilizzerai Gemini 2.5 Pro per elaborare immagini e video.
Esegui le seguenti celle nel notebook.
Al termine di questa sezione, avrai appreso quanto segue.
- Invia un prompt composto da un'immagine e del testo.
- Elaborare un video da un URL
A questo punto genereremo output ben definiti e strutturati
6. Output strutturati
Quando utilizzi la risposta dei modelli nel codice, è importante ottenere output coerenti e affidabili dal modello. La generazione controllata ti consente di definire uno schema di risposta per specificare la struttura dell'output di un modello, i nomi dei campi e il tipo di dati previsto per ogni campo.
Esegui le seguenti celle nel notebook.
Vediamo ora come basare le uscite dei modelli
7. Grounding
Se vuoi utilizzare knowledge base esistenti o fornire informazioni in tempo reale al modello, devi esaminare l'aggiornamento delle uscite del modello.
Con Gemini e Vertex AI, puoi basare l'output nella Ricerca Google, sull'output delle risposte delle funzioni e infine nel codice stesso. L'esecuzione di codice consente al modello di generare codice ed eseguirlo, imparando dai risultati e iterando per ottenere l'output finale.
Esegui le seguenti celle nel notebook.
Vediamo ora le capacità di pensiero di Gemini 2.5 Pro
8. Sto pensando…
La modalità di pensiero è particolarmente utile per attività complesse che richiedono più fasi di definizione di strategie e risoluzione iterativa. I modelli Gemini 2.5 sono modelli di ragionamento in grado di ragionare sui propri pensieri prima di rispondere, mostrando prestazioni migliorate e una maggiore accuratezza.
Esegui le seguenti celle nel notebook. Quando lo fai, noterai l'output del pensiero prima che il modello presenti l'output effettivo.
9. Conclusione
Complimenti! Hai imparato a sfruttare la potenza di Gemini 2.5 Pro utilizzando l'SDK Google Gen AI per Python, che copre la generazione di testo, la multimodalità, l'ancoraggio, le uscite strutturate e le sue funzionalità di pensiero avanzate. Ora hai le conoscenze di base per iniziare a creare le tue applicazioni innovative utilizzando l'SDK. Gemini 2.5 Pro, con la sua potente modalità di pensiero e ragionamento, apre nuove possibilità e si presta all'innovazione in vari casi d'uso.
Riferimenti aggiuntivi
- Consulta la documentazione di riferimento dell'SDK Google Gen AI.
- Esplora altri notebook nel repository GitHub dell'AI generativa di Google Cloud.
- Esplora i modelli di IA in Model Garden.