Introduzione a Gemini 2.5 Pro su Google Cloud

72 minuti rimanenti

Informazioni su questo codelab

Ultimo aggiornamento: apr 23, 2025

Scritto da: Prashanth Subrahmanyam

1. Panoramica

Introduzione

Gemini 2.5 Pro è il modello più efficace di Google per la programmazione e la conoscenza del mondo.

Con la serie 2.5, i modelli Gemini sono ora modelli di ragionamento ibridi. Gemini 2.5 Pro può applicare un'ampia quantità di pensiero alle attività e utilizzare strumenti per massimizzare l'accuratezza delle risposte.

Gemini 2.5 Pro è:

Un miglioramento significativo rispetto ai modelli precedenti per quanto riguarda funzionalità quali programmazione, ragionamento e multimodalità.
Leader del settore nel ragionamento con prestazioni all'avanguardia nei benchmark di matematica e STEM.
Un modello straordinario per il codice, con uno sviluppo web particolarmente avanzato.
Particolarmente adatto per prompt complessi, ma comunque completo, incluso il numero 1 su LMSys.

Obiettivi didattici

In questo tutorial imparerai a utilizzare l'API Gemini e l'SDK Google Gen AI per Python con il modello Gemini 2.5 Pro.

Dovrai completare le seguenti attività:

Genera testo da prompt di testo
- Generare testo in streaming
- Avviare chat a più turni
- Utilizzare metodi asincroni
Configura i parametri del modello
Impostare le istruzioni di sistema
Utilizzare i filtri di sicurezza
Utilizzare la generazione controllata
Contare i token
Elaborare dati multimodali (audio, codice, documenti, immagini, video)
Utilizza chiamate di funzione automatiche e manuali
Esecuzione del codice
Esempi di modalità di pensiero

2. Prima di iniziare

Prerequisiti

Prima di poter iniziare, devi disporre di un progetto Google Cloud con un account di fatturazione valido. Seleziona il progetto Google Cloud che vuoi utilizzare.

Per eseguire il codelab, utilizzeremo Colab Enterprise, un ambiente di notebook gestito e collaborativo con le funzionalità di sicurezza e conformità di Google Cloud.

Abilita le API richieste

Fai clic sul pulsante di seguito per abilitare le API necessarie per questo codelab nel tuo progetto Google Cloud: Vertex AI, Dataform e Compute Engine.

Copia il notebook di Colab in Google Cloud

Fai clic sul pulsante di seguito per aprire il notebook del tutorial in Colab Enterprise. Verrà creata una copia del blocco note di Colab nel tuo progetto Google Cloud attuale, che ti consentirà di eseguirlo.

Iniziamo.

3. Inizializza l'ambiente

Ora che abbiamo creato il notebook di Colab, possiamo eseguire il codice fornito al suo interno. I primi passaggi installano le dipendenze e importano le librerie necessarie.

Esegui i passaggi descritti nella sezione Inizia

Innanzitutto, esegui le celle della sezione Inizia a utilizzare una dopo l'altra.

Celle di codice nella sezione Inizia

Nota:puoi eseguire una cella tenendo premuto il puntatore del mouse sopra la cella di codice da eseguire e facendo clic sull'icona Esegui cella.

Esegui la cella

Alla fine di questa sezione avrai svolto le seguenti operazioni.

Installa l'SDK Google Gen AI per Python
Importa le librerie necessarie per il lab
Configura un progetto Google Cloud per utilizzare Vertex AI

Ora utilizziamo Gemini 2.5 Pro per generare testo

4. Genera testo con Gemini

In questa sezione del notebook, utilizzerai Gemini 2.5 Pro per generare i completamenti di testo.

Vai avanti ed esegui l'insieme di celle successivo nel notebook, prenditi il tempo di leggere il codice e capire come utilizzare l'SDK Google GenAI.

Genera testo da prompt di testo

Al termine di questa sezione, avrai appreso quanto segue.

Come specificare il modello da utilizzare.
Generazione di output non in streaming e in streaming.
Utilizzo della funzionalità di chat a più turni dell'SDK.
Chiamata dell'SDK in modo asincrono.
Configurazione dei parametri del modello.
Impostazione delle istruzioni di sistema per personalizzare il comportamento del modello.
Configurazione dei filtri di sicurezza dei contenuti.

Vediamo ora come inviare prompt multimodali a Gemini

5. Prompt multimodali

In questa sezione del notebook, utilizzerai Gemini 2.5 Pro per elaborare immagini e video.

Esegui le seguenti celle nel notebook. Codificare le celle per i prompt multimodali

Al termine di questa sezione, avrai appreso quanto segue.

Invia un prompt composto da un'immagine e del testo.
Elaborare un video da un URL

A questo punto genereremo output ben definiti e strutturati

6. Output strutturati

Quando utilizzi la risposta dei modelli nel codice, è importante ottenere output coerenti e affidabili dal modello. La generazione controllata ti consente di definire uno schema di risposta per specificare la struttura dell'output di un modello, i nomi dei campi e il tipo di dati previsto per ogni campo.

Esegui le seguenti celle nel notebook. Celle di codice per l'output controllato

Vediamo ora come basare le uscite dei modelli

7. Grounding

Se vuoi utilizzare knowledge base esistenti o fornire informazioni in tempo reale al modello, devi esaminare l'aggiornamento delle uscite del modello.

Con Gemini e Vertex AI, puoi basare l'output nella Ricerca Google, sull'output delle risposte delle funzioni e infine nel codice stesso. L'esecuzione di codice consente al modello di generare codice ed eseguirlo, imparando dai risultati e iterando per ottenere l'output finale.

Esegui le seguenti celle nel notebook. Celle di codice per testare la messa a terra

Vediamo ora le capacità di pensiero di Gemini 2.5 Pro

8. Sto pensando…

La modalità di pensiero è particolarmente utile per attività complesse che richiedono più fasi di definizione di strategie e risoluzione iterativa. I modelli Gemini 2.5 sono modelli di ragionamento in grado di ragionare sui propri pensieri prima di rispondere, mostrando prestazioni migliorate e una maggiore accuratezza.

Esegui le seguenti celle nel notebook. Quando lo fai, noterai l'output del pensiero prima che il modello presenti l'output effettivo. Celle di codice per mostrare l'output di Pensiero

9. Conclusione

Complimenti! Hai imparato a sfruttare la potenza di Gemini 2.5 Pro utilizzando l'SDK Google Gen AI per Python, che copre la generazione di testo, la multimodalità, l'ancoraggio, le uscite strutturate e le sue funzionalità di pensiero avanzate. Ora hai le conoscenze di base per iniziare a creare le tue applicazioni innovative utilizzando l'SDK. Gemini 2.5 Pro, con la sua potente modalità di pensiero e ragionamento, apre nuove possibilità e si presta all'innovazione in vari casi d'uso.

Riferimenti aggiuntivi

Consulta la documentazione di riferimento dell'SDK Google Gen AI.
Esplora altri notebook nel repository GitHub dell'AI generativa di Google Cloud.
Esplora i modelli di IA in Model Garden.

Ti è piaciuto questo codelab?

OttimaMediaPotrebbe essere migliore

Segnala un errore