Se usó la API de Cloud Translation para traducir esta página.

Actividad práctica con Gemini CLI

1. Introducción

En este codelab, aprenderás sobre Gemini CLI, un agente de IA de código abierto que lleva el poder de Gemini directamente a tu terminal.

Qué aprenderás

Instala y configura Gemini CLI
Explora herramientas, comandos integrados y configura servidores de MCP en Gemini CLI
Cómo personalizar Gemini CLI a través del archivo GEMINI.md
Explora algunos casos de uso con Gemini CLI

Requisitos

Este codelab se puede ejecutar por completo en Google Cloud Shell, que viene con la CLI de Gemini preinstalada.

Como alternativa, si prefieres trabajar en tu propia máquina, hay una sección para instalar Gemini CLI de forma local.

Necesitarás lo siguiente:

Navegador web Chrome
Una cuenta de Gmail

Este codelab está diseñado para usuarios y desarrolladores de todos los niveles (incluidos los principiantes). Los casos de uso del codelab se clasificaron en tareas para desarrolladores y tareas para no desarrolladores. Los casos de uso para desarrolladores demuestran cómo realizar vibe coding con Gemini CLI y trabajar con un repositorio de GitHub para llevar a cabo tareas de desarrollo comunes, como explicar o comprender el código, generar documentación, corregir problemas y mucho más. Te recomendamos que completes estos casos de uso en el codelab. Al final, hay una sección opcional que abarca varias tareas cotidianas que no se centran en los desarrolladores.

2. Antes de comenzar

Crea un proyecto

En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.
Asegúrate de que la facturación esté habilitada para tu proyecto de Cloud. Obtén información sobre cómo verificar si la facturación está habilitada en un proyecto.
Usarás Cloud Shell, un entorno de línea de comandos que se ejecuta en Google Cloud y que viene precargado con bq. Haz clic en Activar Cloud Shell en la parte superior de la consola de Google Cloud.

Imagen del botón Activar Cloud Shell

Una vez que te conectes a Cloud Shell, verifica que ya te autenticaste y que el proyecto se configuró con el ID de tu proyecto con el siguiente comando:

gcloud auth list

En Cloud Shell, ejecuta el siguiente comando para confirmar que el comando gcloud conoce tu proyecto.

gcloud config list project

Si tu proyecto no está configurado, usa el siguiente comando para hacerlo:

gcloud config set project <YOUR_PROJECT_ID>

3. Instalación

Antes de configurar y ejecutar Gemini CLI, creemos una carpeta que usaremos como carpeta principal para todos los proyectos que creemos dentro de ella. Este es un punto de partida para que la CLI de Gemini funcione, aunque también hará referencia a otras carpetas de tu sistema que verás más adelante, según sea necesario.

Crea una carpeta de muestra (gemini-cli-projects) y navega a ella con los comandos que se muestran a continuación. Si prefieres usar otro nombre de carpeta, hazlo.

mkdir gemini-cli-projects

Naveguemos a esa carpeta:

cd gemini-cli-projects

Puedes iniciar Gemini CLI directamente con el comando gemini.

Navega directamente a la próxima sección (configuración de Gemini CLI a través de settings.json).

Si quieres instalar Gemini CLI de forma local, sigue las instrucciones que se indican a continuación.

El primer paso es instalar Node 20 o una versión posterior en tu máquina. Una vez que se complete este proceso, puedes instalar y ejecutar Gemini CLI con cualquiera de los siguientes métodos:

Primero, puedes instalar Gemini CLI de forma global en tu sistema. Es posible que necesites acceso de administrador para realizar este paso.

# option 1: install Gemini CLI

npm install -g @google/gemini-cli

# .. and then run
gemini

Ejecútalo con el siguiente comando:

# option 2: run without installing Gemini CLI

npx https://github.com/google-gemini/gemini-cli

Para confirmar que la CLI está instalada, ejecuta el siguiente comando:

gemini --version

Si suponemos que iniciaste Gemini CLI con alguno de los métodos anteriores, deberías ver la siguiente pantalla que te pregunta sobre la elección de un tema. Selecciona uno que te guste:

Una vez que selecciones esa opción, se te pedirá el método de autenticación. En este lab, se recomienda que uses tu Cuenta de Google personal y no cuentas que no sean de Google o que no estén relacionadas con Google Workspace. Esa licencia gratuita te da acceso a Gemini 2.5 Pro y a su ventana de contexto de 1 millón de tokens. El nivel gratuito permite 60 solicitudes de modelos por minuto y 1,000 solicitudes por día sin cargo.

Si alcanzas los límites con la cuota gratuita actual que se otorga a las Cuentas de Google, puedes optar por usar la clave de la API de Gemini o incluso Vertex AI de Google Cloud, en la que deberás tener un ID del proyecto y el nombre de la ubicación de ese proyecto. Si planeas usar otros métodos de autenticación, consulta la sección Autenticación de la documentación.

Haz clic en Intro. Se abrirá una página de autenticación de Google en el navegador. Continúa con la autenticación con tu Cuenta de Google, acepta las condiciones y, una vez que te autentiques correctamente, verás que la CLI de Gemini está lista y espera tu comando. A continuación, se muestra una captura de pantalla de ejemplo:

4. Configuración de Gemini CLI con settings.json

Si eliges Cloud Shell para ejecutar Gemini, ya se selecciona y configura un tema predeterminado para Gemini CLI y el método de autenticación.

Si instalaste Gemini CLI en tu máquina y la ejecutaste por primera vez, seleccionaste un tema y, luego, un método de autenticación.

Ahora, en las ejecuciones posteriores de Gemini CLI, no se te pedirá que vuelvas a seleccionar un tema y un método de autenticación. Esto significa que se persiste en algún lugar y el archivo que usa se llama settings.json, y es la forma de personalizar Gemini CLI.

La configuración se aplica con la siguiente precedencia (Cloud Shell solo hace que la configuración del usuario esté disponible):

Sistema: /etc/gemini-cli/settings.json (se aplica a todos los usuarios y anula la configuración del usuario y del espacio de trabajo).
Espacio de trabajo: .gemini/settings.json (anula la configuración del usuario).
Usuario: ~/.gemini/settings.json.

Usuario de Windows: %USERPROFILE%.gemini\settings.json (que suele expandirse a C:\Users<TuNombreDeUsuario>.gemini\settings.json)

Sistema: %ProgramData%\gemini-cli\settings.json (que, por lo general, se expande a C:\ProgramData\gemini-cli\settings.json)

Usuario de Mac: ~/.gemini/settings.json (que se expande a /Users/<TuNombreDeUsuario>/.gemini/settings.json)

Sistema: /etc/gemini-cli/settings.json

Si recuerdas, cuando seleccionaste el tema, elegiste que la configuración se guardara en la Configuración del usuario. Así que visita ~/.gemini folder y verás el archivo settings.json.

A continuación, se muestra mi archivo settings.json. Si hubieras seleccionado otro tema, verías su nombre allí.

{
  "theme": "Default",
  "selectedAuthType": "oauth-personal" or "cloud-shell"
}

5. Nuestra primera interacción con Gemini CLI

Comencemos a usar Gemini CLI y escribe tu primera búsqueda como se muestra a continuación:

Give me a famous quote on Artificial Intelligence and who said that?

A continuación, se muestra la respuesta esperada:

GoogleSearch Searching the web for: "famous quote on Artificial Intelligence and who said it"                                                                                                                 ...
Search results for "famous quote on Artificial Intelligence and who said it" returned.                                                                                                                             

✦ "The development of full artificial intelligence could spell the end of the human race." - Stephen Hawking.

Notarás que nuestra búsqueda generó una herramienta GoogleSearch (una herramienta integrada en la CLI de Gemini) que se invocó. En otras palabras, ya usaste una de las potentes herramientas integradas de Gemini CLI, GoogleSearch, que fundamenta sus respuestas en la información que obtiene de la Web. Obtendrás más información sobre las Herramientas en la siguiente sección.

Una forma rápida de comprender la CLI de Gemini y los diversos comandos que admite es escribir /help (barra diagonal) para ver una variedad de comandos y combinaciones de teclas.

Por ahora, salgamos de Gemini CLI. Puedes hacerlo con el comando /quit o con Ctrl-C dos veces en la sesión de terminal interactiva de la Gemini CLI.

6. Gemini CLI: parámetros de comandos

Hay algunos parámetros de línea de comandos que se pueden proporcionar cuando inicias la CLI de Gemini. Para obtener una lista completa de las opciones, puedes usar --help, como se muestra a continuación.

gemini --help

Esto debería mostrar toda la variedad de opciones disponibles. Te recomendamos que consultes la documentación aquí.

Veamos algunas de ellas. La primera es configurar la CLI de Gemini para que use el modelo Pro o Flash. Actualmente, en el momento de escribir este lab, estos son los únicos dos modelos admitidos. De forma predeterminada, se usa el modelo Gemini 2.5 Pro, pero, si quieres usar el modelo Flash, puedes hacerlo cuando inicies Gemini CLI con el parámetro -m, como se muestra a continuación:

gemini -m "gemini-2.5-flash"

Notarás que, si comienzas de la manera anterior, puedes verificar el modelo en la parte inferior derecha de la terminal de Gemini CLI, como se muestra a continuación:

Una vez que estés en la aplicación de Gemini CLI, puedes usar el comando /model para abrir un diálogo que te permita elegir un modelo. A continuación, se muestra una ejecución de muestra. Según tus requisitos y la orientación proporcionada, puedes seguir cambiando el modelo para elegir el adecuado para la tarea según la complejidad y la necesidad de controlar los costos.

Modo no interactivo

Una opción interesante es ejecutar Gemini CLI en modo no interactivo. Esto significa que le proporcionas directamente la instrucción y responde a ella sin que se abra la terminal interactiva de Gemini CLI. Esto es muy útil si planeas usar la CLI de Gemini de forma automatizada como parte de la secuencia de comandos o de cualquier otro proceso de automatización. Puedes usar el parámetro -p para proporcionar la instrucción a Gemini CLI, como se muestra a continuación, o simplemente usar el argumento posicional para dar la instrucción.

gemini "What is the gcloud command to deploy to Cloud Run"

Ten en cuenta que no hay lugar para continuar la conversación con preguntas de seguimiento. Este modo tampoco te permite autorizar herramientas (incluida WriteFile) ni ejecutar comandos de shell.

7. Gemini CLI: Herramientas integradas

La CLI de Gemini incluye un conjunto de herramientas integradas, y la documentación de las herramientas indica que "el modelo de Gemini usa estas herramientas para interactuar con tu entorno local, acceder a la información y realizar acciones. Estas herramientas mejoran las capacidades de la CLI, lo que le permite ir más allá de la generación de texto y ayudar con una amplia variedad de tareas".

Para obtener una lista de las herramientas integradas actuales, invoca el comando /tools como se muestra a continuación:

Available Gemini CLI tools:

  - Codebase Investigator Agent (codebase_investigator)
  - Edit (replace)
  - FindFiles (glob)
  - GoogleSearch (google_web_search)
  - ReadFile (read_file)
  - ReadFolder (list_directory)
  - SaveMemory (save_memory)
  - SearchText (search_file_content)
  - Shell (run_shell_command)
  - WebFetch (web_fetch)
  - WriteFile (write_file)
  - WriteTodos (write_todos)

Una de las cosas que debería llamarte la atención de inmediato es preguntarte si Gemini CLI puede simplemente llamar a estas herramientas cuando lo desee. La respuesta predeterminada es no cuando se trata de operaciones sensibles que podrían implicar escribir en el sistema local, leer desde un sistema externo, ir a la red externa, etcétera.

Si bien hay un --yolo disponible cuando inicias la CLI (no se recomienda), verás que Gemini CLI te pedirá permiso para ejecutar la herramienta que eligió. Puedes rechazar el permiso, permitir que se ejecute una vez o darle permiso general para que se ejecute siempre. Tienes y deberías tener el control total de todo.

Usemos una instrucción que haga que Gemini CLI elija una de las herramientas integradas para ejecutar y que te permita comprender bien cómo funciona todo.

Imagina una situación en la que quieres obtener información sobre las últimas noticias financieras de todo el mundo y guardarla en un archivo en el directorio de trabajo local desde el que iniciaste Gemini CLI. Usa la siguiente instrucción:

Search for the latest headlines today in the world of finance and save them in a file named finance-news-today.txt

Imagina por un momento lo que debería hacer. Lo ideal sería que saliera a hacer una búsqueda en Google para obtener noticias de algunas fuentes de información relevantes que puedan proporcionarle noticias financieras. Luego, debe crear un archivo llamado finance-news-today.txt (una operación de escritura en tu sistema local que requerirá tu permiso) con su contenido.

Veamos qué sucede (deberías hacer lo mismo en tu máquina).

Lo primero que hace es invocar la herramienta GoogleSearch para buscar en la Web y recuperar los resultados, como se muestra a continuación:

GoogleSearch Searching the web for: "latest finance headlines today"                                                                                                                                            

Search results for "latest finance headlines today" returned.

Una vez que se hace eso, está listo para escribirlo en el archivo y usará la herramienta WriteFile, pero como esa es una operación sensible (escribir), solicitará tu permiso. Puedes decidir el tipo de permiso, es decir, permitir una vez, permitir siempre, etcétera. Por ahora, selecciona Permitir una vez.

Luego, se escribirá la información en el archivo y se mostrará el siguiente mensaje de éxito:

✦ I have successfully saved the latest finance headlines into the file finance-news-today.txt.

¿Cómo verificas si el archivo está escrito o no? Puedes usar @file para pedirle que lea el contenido. A medida que escribes @, se muestra una lista de archivos en la carpeta actual, incluido el archivo que acaba de crear. Selecciona esa opción y envía la instrucción. A continuación, se muestra mi instrucción:

read the contents of @finance-news-today.txt

Esto hace que se invoquen las herramientas necesarias (ReadManyFiles, ReadFile) y que el contenido se muestre como se indica a continuación:

8. Gemini CLI: modo Shell

Este es un buen momento para aprender a trabajar directamente con Shell desde la CLI de Gemini. Para ingresar al modo de shell, presiona ! en el cuadro de mensaje. Esto activará el modo Shell. Para volver, presiona ! de nuevo o la tecla ESC.

En el modo de Shell, verás ! al principio de la instrucción, como se muestra a continuación:

Puedes verificarlo directamente con comandos estándar como pwd y ls, como se muestra a continuación. Ten en cuenta que los comandos suponen un SO de tipo Linux. Si usas otro sistema operativo (Windows), usa comandos equivalentes, como (cd, dir y type). Ten en cuenta que el resultado de estas llamadas se incluye en la ventana de contexto del modelo.

Hoy puedes imprimir el contenido del archivo con el comando cat.

Ejercicio: Aquí tienes un ejercicio corto para probar. Elige el feed RSS que prefieras. Dale una instrucción a Gemini CLI para recuperar el contenido del feed RSS y darle formato a los resultados de una manera específica. Esta es una buena forma de automatizar algo al comienzo del día. Incluso puedes pedirle a la CLI de Gemini que averigüe si hay un feed RSS para un área específica, por ejemplo, las notas de la versión de Google Cloud Platform.

A continuación, se muestra un ejemplo de instrucción:

Get the latest release notes for Google Cloud from its RSS Feed and display the key points in a well-formatted list.

Idealmente, esta instrucción primero debería invocar la herramienta GoogleSearch para encontrar el feed RSS de Google Cloud Platform y, luego, usar la herramienta WebFetch para obtener el contenido del feed RSS y mostrarlo.

9. Extensiones de Gemini CLI

Como se indica en la documentación, las extensiones de Gemini CLI empaquetan instrucciones, servidores de MCP y comandos personalizados en un formato familiar y fácil de usar. Con las extensiones, puedes ampliar las capacidades de Gemini CLI y compartirlas con otras personas. Es el mecanismo principal para extender la funcionalidad de Gemini CLI más allá de sus herramientas integradas.

Una extensión es un paquete autónomo, con versiones y fácil de distribuir. Piensa en él como el "contenedor de envío" para tus personalizaciones de Gemini CLI, que agrupa todo lo necesario para un flujo de trabajo específico en un solo paquete ordenado.

Una extensión puede incluir cualquier combinación de los siguientes elementos:

Comandos de barra personalizados (tus archivos .toml)
Configuraciones del servidor de MCP (que antes se encontraban en settings.json)
Archivos de contexto (GEMINI.md) para proporcionar instrucciones y lineamientos específicos al modelo
Restricciones de herramientas (excludeTools) para crear un entorno más seguro y enfocado

Explora la Galería de extensiones

La Galería de extensiones es el mercado central para descubrir todas las extensiones oficiales creadas por Google y de terceros:

Abre la siguiente URL en tu navegador: https://geminicli.com/extensions/browse/.
Esta galería es el motor de descubrimiento del ecosistema. Puedes ver extensiones de empresas como GitHub, Redis y DynaTrace, que muestran la amplitud de las herramientas disponibles.
Desplázate hacia abajo y busca la tarjeta de extensión de Cloud Run.
Observa que la tarjeta proporciona una descripción, el autor (Google) y un botón de comando Copy con un solo clic. Esta es la forma más sencilla de obtener el comando de instalación de una extensión.

Extensiones de Gemini CLI: comandos de administración

El comando gemini extensions es tu punto de entrada para administrar tus extensiones locales.

Ejecútalo en la terminal para ver la lista de comandos disponibles.

gemini extensions <command>

Manage Gemini CLI extensions.

Commands:
  gemini extensions install <source> [--auto-update] [--pre-release]   
      Installs an extension from a git repository URL or a local path.
  gemini extensions uninstall <names..>                                  
      Uninstalls one or more extensions.
  gemini extensions list
      Lists installed extensions.
  gemini extensions update [<name>] [--all]                           
      Updates all extensions or a named extension to the latest version.
  gemini extensions disable [--scope] <name>                          
      Disables an extension.
  gemini extensions enable [--scope] <name>                           
      Enables an extension.
  gemini extensions link <path>                                       
     Links an extension from a local path. Updates made to the local path 
     will always be reflected.
  gemini extensions new <path> [template]                             
     Create a new extension from a boilerplate example.
  gemini extensions validate <path>                                   
     Validates an extension from a local path.

Los comandos son sencillos (instalar/desinstalar, listar, actualizar, habilitar/inhabilitar, etcétera) y usaremos algunos de ellos en este codelab.

Cómo consultar tu lista actual de extensiones

Antes de instalar cualquier cosa, verifiquemos nuestro "punto de partida".

Ejecuta el comando gemini extensions list:
Deberías ver el siguiente resultado, que confirma que aún no se instaló ninguna extensión.

No extensions installed.

Configura el servidor de MCP de GitHub

Uno de los tipos de extensiones de Gemini CLI es un servidor de MCP. Un servidor de MCP es una aplicación que expone herramientas y recursos a Gemini CLI a través del Protocolo de contexto del modelo, lo que le permite interactuar con sistemas externos y fuentes de datos. Los servidores de MCP actúan como un puente entre el modelo de Gemini y tu entorno local o servicios como las APIs.

Tenemos el servidor de MCP de GitHub disponible en la Galería de extensiones de Gemini. Haz clic en él y se abrirá la tarjeta de Extensiones, en la que también verás el comando para instalar la extensión:

Simplemente copia ese comando o usa el siguiente:

gemini extensions install https://github.com/github/github-mcp-server

Continúa con los permisos necesarios. Una vez instalada, deberías poder ver esta extensión disponible en la lista de extensiones cuando ejecutes el comando gemini extensions list.

✓ github (1.0.0)
 ID: faa318861b48de8d83c95eb8cd5e82c02393493978d198a0e7bf67fcb1bd22cb
 name: c0b0109d9439de57fe3cf03abeccbc52f4c98170c732d3b69af5e6395ace574e
 Path: /home/romin/.gemini/extensions/github
 Source: https://github.com/github/github-mcp-server (Type: git)
 Enabled (User): true
 Enabled (Workspace): true
 MCP servers:
  github

Puedes ver la ruta de acceso de la extensión y, en esa carpeta, tendrás un archivo llamado gemini-extension.json, cuyo contenido se muestra a continuación:

{
  "name": "github",
  "version": "1.0.0",
  "mcpServers": {
    "github": {
      "description": "--description–",
      "httpUrl": "https://api.githubcopilot.com/mcp/",
      "headers": {
            "Authorization": "Bearer $GITHUB_MCP_PAT"
      }
     }
  }
}

Observarás que el token de acceso personal (PAT) se lee a través de una variable de entorno. Primero, deberás tener un token de acceso personal (PAT) de GitHub. Una vez que lo tengas, asegúrate de haber creado un archivo .env completo y de haber colocado este valor allí o de haber creado una variable de entorno de la siguiente manera (reemplaza PAT_VALUE por el valor real):

export GITHUB_MCP_PAT=PAT_VALUE

Debes reiniciar Gemini CLI. Una vez que se inicie, puedes usar el comando /mcp list para ver la lista de servidores de MCP y sus respectivas herramientas disponibles. Deberías poder ver el servidor de MCP de GitHub en verde junto con sus herramientas (más de 30). A continuación, se muestra una lista parcial:

🟢 github (de github): Listo (40 herramientas)

Herramientas:

add_comment_to_pending_review
add_issue_comment
assign_copilot_to_issue
create_branch
create_or_update_file
create_pull_request
create_repository
delete_file
fork_repository
get_commit
get_file_contents
get_label
get_latest_release
get_me
get_release_by_tag
get_tag
get_team_members
get_teams
issue_read

Comencemos con una instrucción que invocará una de las herramientas del servidor de MCP de GitHub. Dale la siguiente instrucción (¿Quién soy en GitHub?). Esto hará que la CLI de Gemini seleccione la herramienta correcta y te pida permiso.

Una vez que des el visto bueno, recuperará el resultado como se muestra a continuación:

✦ You are rominirani, a Developer Advocate at Google Cloud, located in Mumbai. You have 125 public repositories and 256 followers.

Ahora deberías trabajar con uno de tus proyectos de GitHub. Haz tus preguntas en lenguaje natural, como las siguientes:

¿Puedes describir el <repo-name>?
Clona el <repo-name> en mi máquina local.
Describe @<file-name> o @<directory-name>/
¿Cuáles son los diferentes componentes de este repositorio?
Ya hice los cambios necesarios. ¿Puedes enviar los cambios a GitHub y usar las herramientas del servidor de MCP de GitHub para hacerlo?

Más adelante en el lab, encontrarás un ejercicio para trabajar con el servidor de MCP de GitHub en detalle.

Configura el servidor de MCP de Cloud Run

La extensión de Cloud Run disponible en la galería de extensiones de Gemini CLI es un servidor de MCP que nos permite implementar nuestras aplicaciones en Cloud Run.

A continuación, se muestra la tarjeta de la extensión de Cloud Run de la galería de extensiones:

Primero, haz clic en Copiar comando de instalación, como se muestra arriba, para instalar la extensión de Cloud Run. Luego, pega ese comando en la terminal de Cloud Shell (debería ser similar al siguiente):

gemini extensions install https://github.com/GoogleCloudPlatform/cloud-run-mcp

Cuando ejecutes el comando anterior, verás que se requiere tu confirmación. Aprobar la solicitud La extensión de Cloud Run debería instalarse correctamente.

Si ahora ejecutas el comando gemini extensions list, deberías ver la extensión de Cloud Run instalada, como se muestra a continuación:

✓ cloud-run (1.0.0)
 ID: 3c1a38909b6d7d90b6acc8ca1e80d97b4a867253a3cd12d841b2aab4e556a58f
 name: 0b1820c1f0c043bbb3b54f496d862c02172424c930eb965d61f468be52e6f127
 Path: /home/romin/.gemini/extensions/cloud-run
 Source: https://github.com/GoogleCloudPlatform/cloud-run-mcp (Type: git)
 Enabled (User): true
 Enabled (Workspace): true
 Context files:
  /home/romin/.gemini/extensions/cloud-run/gemini-extension/GEMINI.md
 MCP servers:
  cloud-run

Si inicias Gemini CLI ahora y ejecutas el comando /mcp list, verás lo siguiente:

🟢 cloud-run (from cloud-run) - Ready (8 tools, 2 prompts)
  Tools:
  - create_project
  - deploy_container_image
  - deploy_file_contents
  - deploy_local_folder
  - get_service
  - get_service_log
  - list_projects
  - list_services
  Prompts:
  - deploy
  - logs

Las anteriores son solo algunas de las extensiones de Gemini CLI que mostramos cómo configurar. Puedes consultar la Galería de extensiones para descubrir más o incluso hacer el codelab "Comienza a usar las extensiones de la CLI de Gemini".

10. Casos de uso para probar

La Gemini CLI se puede aplicar a una amplia variedad de casos de uso que se aplican tanto a desarrolladores como a no desarrolladores. Aquí se presentan algunas situaciones y, según tu área de interés, puedes probarlas todas o algunas de ellas.

En cada uno de estos casos, se proporciona la instrucción. Puedes probar esto en el modo interactivo o no interactivo de Gemini CLI a través del parámetro -p cuando inicies Gemini CLI.

Vibe coding con Gemini CLI

Usemos Gemini CLI para crear una aplicación con vibe coding. En esta tarea, le pedirás a Gemini CLI que genere una aplicación y, luego, enviarás la versión inicial a un repositorio de GitHub.

Requisitos previos

Para realizar las tareas de esta sección, debes cumplir con algunos requisitos previos:

Git
Gemini CLI con la extensión de Gemini CLI de GitHub (ya lo hicimos) o si configuraste gh ( herramienta de CLI de GitHub), también funcionará.
Conocimiento básico de Git y algo de programación

Supondremos que lanzaste la CLI de Gemini en una carpeta específica de tu elección.

Comienza con una instrucción inicial. Puedes modificarlo como quieras. Ten en cuenta que, a lo largo de la sesión con Gemini CLI, se te solicitarán permisos para crear los archivos, etc. Otorga los permisos necesarios.

En esta tarea, no buscamos que Gemini CLI ejecute la aplicación ni la pruebe por nosotros, ya que queremos tener un poco más de control. Sin embargo, depende completamente de ti si quieres hacerlo.

Generate a website for a 1-day event filled with technical talks. There are going to be 6 talks in a single track of 1 hour each. Each talk has the following information: title, 1 or maximum of 2 speakers, category (1 or maximum of 3 keywords), duration and a description. The website has a single page where users can see the schedule for the entire day with the timings. There will be one lunch break of an hour and the event starts at 10:00 AM. Keep a 10 minute transition between talks. I would like to use Node.js on the server side and standard HTML, JavaScript and CSS on the front-end. The users should be able to search the talks based on category.

I would like you to proceed in the following way: 
1. Plan out how you would design and code this application.
2. Ask me for any clarifications along the way.
3. Once I am fine with it, do generate the code and provide me instructions to run and test locally.

Las siguientes instrucciones y respuestas son un flujo de muestra que se observó. Gemini CLI elaborará un plan y te pedirá confirmaciones o aclaraciones, o bien continuará con el proceso. Sigue las instrucciones. Como ejemplo, este es mi hilo de conversación de muestra:

   1. Backend (Node.js/Express):
       * Set up an Express server to serve the static frontend files.
       * Create an /api/schedule endpoint that will:
           * Generate the event schedule dynamically, including talk timings and the lunch break, based on your requirements.
           * Store mock talk data (title, speakers, category, description).
           * Filter the schedule based on a category query parameter.

   2. Frontend (HTML, CSS, JavaScript):
       * Create an index.html file for the main structure.
       * Develop style.css for a clean and responsive design.
       * Write script.js to:
           * Fetch the schedule data from the backend.
           * Dynamically render the talks and lunch break on the page.
           * Implement a search input that filters talks by category, updating the displayed schedule without a full page reload.

   3. Schedule Logic:
       * The backend will handle calculating the precise start and end times for each 1-hour talk, factoring in the 10:00 AM start, 10-minute transitions, and the 1-hour lunch break.

  Before I proceed with the code, could you please clarify the following:

   * Example Talk Data: Could you provide some example talk titles, speakers, categories (keywords), and descriptions? This will help me create realistic dummy data for the schedule.
   * Lunch Break Placement: Where should the 1-hour lunch break be placed in the schedule? (e.g., after the 3rd talk, at 1 PM, etc.)
   * Styling Preferences: Do you have any specific styling preferences (e.g., color scheme, modern/minimalist, etc.)? If not, I will go with a clean, simple design.

✦ I will create a single-page website for your event. Here's my plan:

✓  WriteTodos Set 7 todo(s)                                                                                                                                                                                        

✦ I am waiting for your clarifications regarding the example talk data, lunch break placement, and styling preferences before I proceed with generating the code.

Por último, me proporcionó el siguiente resumen:

✦ Instructions to Run and Test Locally:

   1. Start the server:
      Open your terminal in the project directory (/home/romin/gemini-cli-projects/event-website/) and run:
   1     node server.js
      You should see a message in the terminal indicating: Server running on http://localhost:3000.

   2. Open in your browser:
      Open your web browser and navigate to:
      http://localhost:3000

   3. Test functionality:
       * You should see the event schedule displayed on the page, with talks and a lunch break.
       * Search by category: In the "Search by category..." input box, type a category keyword (e.g., "AI", "Web Development", "Python", "Security").
       * Click the "Search" button. The schedule displayed should filter to only show talks matching that category.
       * Click the "Reset" button to clear the search filter and view the full schedule again.

  Let me know if you encounter any issues or if you'd like to make any modifications or additions to the website!

Si sigues las instrucciones para iniciar el servidor y navegar a la página principal, obtendrás un sitio de muestra como el que se muestra a continuación (deberías ver una variante de un sitio similar si usaste la misma instrucción):

Puedes seguir haciendo más cambios con la ayuda de Gemini CLI. Cuando estés conforme con los cambios, puedes enviarlos a un repositorio de GitHub.

Primero, creemos un archivo .gitignore. Puedes usar la ayuda de Gemini CLI.

Create a .gitignore file for this project.

El siguiente paso es darle instrucciones a Gemini CLI para enviar este repositorio a nuestra cuenta de GitHub, lo que debería ejercitar las herramientas del servidor de MCP de GitHub en segundo plano.

Dale una instrucción similar a la siguiente:

Great! I would now like to push all of this to a new repository in my Github account. I would like to name this repository <Your-Name>-event-talks-app

Aquí se ejecutarán varios comandos:

Crea el repositorio.
Usará varios comandos de Git : init, add, commit para administrar el repositorio de Git local.
Luego, configurará el remoto de Git y hará un envío.

Nota: En algunos casos, es posible que Gemini CLI experimente un tiempo de espera o use un nombre de usuario incorrecto, etc. Interactúa con ella y sugiere las correcciones.

Si todo va bien, deberías tener un repositorio de GitHub. A continuación, se muestra una captura de pantalla de ejemplo:

Ten en cuenta que no generaste un README.md para este proyecto, lo que es un buen ejercicio para la siguiente sección, en la que trabajaremos con el repositorio que acabas de crear.

Usa Gemini CLI para trabajar en un repositorio de GitHub

En este caso de uso, usarás Gemini CLI para trabajar con un repositorio de GitHub. Realizarás varias tareas, entre las que se incluyen las siguientes:

Comprende la base de código
Generación de documentación
Implementar una función nueva
Confirma y envía los cambios al repositorio.
Trabaja en un problema de GitHub y aplica los cambios propuestos

Esto debería proporcionarte una buena base para trabajar con tus repositorios y usar la CLI de Gemini como asistente en relación con estas tareas específicas para desarrolladores.

Requisitos previos

Para realizar las tareas de esta sección, necesitarás lo siguiente:

Git
Gemini CLI con la extensión de Gemini CLI de GitHub MCP (ya lo hicimos) o si configuraste gh ( herramienta de la CLI de GitHub), también funcionaría.
Familiaridad con los conceptos básicos de Git y algunos conocimientos de programación (usaremos Node.js en este ejemplo, ya que es posible que ya tengas el entorno listo en tu máquina debido a que instalaste la CLI de Gemini). Sin embargo, más adelante, puedes elegir el repositorio que quieras con un lenguaje de programación y un framework diferentes.
Deberías haber completado la sección anterior y tener a mano el repositorio en el que creamos un sitio web de Event Talks.

Sigamos usando Gemini CLI desde la carpeta o el directorio que usaste para generar la aplicación Event Talks. Si es necesario, puedes clonar el repositorio en tu máquina local y, luego, iniciar Gemini CLI desde ese directorio. Prueba las siguientes situaciones, como se indica a continuación:

Comprende la base de código

Me gustaría comprender este proyecto en detalle. Ayúdame a comprender las funciones principales y, luego, desglosarlas en el servidor y el cliente. Toma un flujo de muestra y muéstrame cómo funcionan la solicitud y la respuesta.
Explain @server.js

Cómo generar un archivo README

Genera un archivo README para este proyecto.

Implementar una función nueva

Me gustaría implementar una nueva función en la que el usuario también pueda buscar por un orador específico. Primero, muéstrame un plan de cómo implementarías este cambio y, luego, podemos generar el código.

Debería proporcionarte un plan que puedes aprobar. Una vez que se aprueben, Gemini CLI realizará los cambios. Prueba los cambios y, si hay errores (lo más probable), pídele a Gemini CLI que los corrija.

Una vez que los cambios se vean bien, puedes seguir los mismos pasos para confirmarlos y enviarlos al repositorio remoto.

Genera problemas en función de las funciones sugeridas

Probemos algo interesante aquí. Le preguntarás a Gemini CLI cómo puede mejorar la experiencia del usuario de esta aplicación y, según su evaluación, podrá crear esas sugerencias como problemas en el mismo repositorio de GitHub. Usará la herramienta "create_issue" del servidor de MCP de GitHub.

Prueba la siguiente instrucción:

Me gustaría que evalúes la aplicación desde el punto de vista de la experiencia del usuario. Facilidad de uso, capacidad de respuesta, mensajes útiles y mucho más. Crea una lista de mejoras y, luego, crea problemas en el repositorio de GitHub.

Lo ideal sería que primero comparta las mejoras contigo y, luego, con tu permiso, cree los problemas en el repositorio de GitHub. A continuación, se muestra una captura de pantalla de ejemplo de nuestra ejecución:

Trabaja en un problema de GitHub y aplica los cambios propuestos

Ahora puedes tomar uno de los problemas que se generaron anteriormente y pedirle a Gemini CLI que lo implemente.

A continuación, se muestra un ejemplo del problema que generó:

Toma la URL del problema completa y proporciona una instrucción como esta:

Revisa el problema: <YOUR_ISSUE_URL> y comprende qué cambios se deben realizar. Primero, analiza el plan y, luego, muestra los cambios propuestos en el código.

Puedes aprobar los cambios y enviarlos al repositorio. Incluso puedes pedirle que cierre el problema.

(Opcional) Tareas diarias

Los casos de uso que se indican a continuación son tareas que podrías terminar realizando con frecuencia. Esto incluye organizar archivos en carpetas, recuperar y resumir contenido de la Web, procesar archivos de imágenes y extraer contenido de ellos, trabajar con bases de datos y mucho más.

Puedes explorar cualquiera de los casos de uso que desees.

Organización de archivos y carpetas

Puedes usar Gemini CLI para organizar los archivos según los tipos en varias carpetas según sea necesario. Ve a una carpeta de tu máquina que tenga varios archivos .txt, .png, .jpg, .pdf, .mp4 y otros. Es probable que sea tu escritorio o tu carpeta de descargas.

A continuación, se muestra una carpeta de ejemplo y su contenido (es posible que tengas otros archivos):

Navega a esa carpeta y, luego, inicia Gemini CLI. Primero, le pedirás a Gemini CLI que cree algunas carpetas: Images, Documents y Videos. Luego, le pedirás que organice los archivos en las carpetas.

La CLI de Gemini a menudo te pedirá permiso antes de ejecutar comandos, especialmente aquellos que modifican tu sistema de archivos (como escribir, mover o borrar archivos). Siempre revisa estas instrucciones con atención antes de otorgar permiso. Esta es tu red de seguridad.

Create the following folders "Images","Documents","Videos"

Luego, dale la siguiente instrucción:

Go through all the files in this folder and then organize them by moving all the files ending with .jpg, .jpeg, .gif into the "Images" folder. Move all ".txt" files into the "Documents" folder. Move all the ".mp4" files in the "Videos" folder.

A continuación, se muestra un ejemplo del estado final de la carpeta. Deberías ver las nuevas subcarpetas creadas y los archivos movidos a las subcarpetas correspondientes según su tipo.

A continuación, se muestran algunas otras situaciones de organización (las instrucciones se indican junto a cada situación):

Resumen: Para cada documento de la carpeta “Documents”, crea un archivo txt en la misma carpeta llamado “summary_ORIGINAL_FILENAME.txt” que contenga un resumen de 3 oraciones de los puntos principales del documento.
Categorización por tipo: Analiza todos los archivos PDF y DOCX de este directorio. Mueve todos los archivos que contengan la palabra "factura" en su nombre o contenido a la carpeta "Finanzas/Facturas". Mueve los archivos con "receipt" a "Financial/Receipts". Todos los demás archivos .docx se guardan en "Informes".
Extracción de información clave (y "etiquetado"): Para cada archivo PDF de la carpeta "Finanzas/Facturas", lee su contenido. Si encuentras una fecha, cambia el nombre del archivo para incluirla en formato AAAA-MM-DD, p.ej., ‘invoice_2025-07-26_original_name.pdf'.