Làm quen với các tiện ích của Gemini CLI

1. Giới thiệu

Gemini CLI là một tác nhân AI mã nguồn mở dành cho thiết bị đầu cuối của bạn, mang sức mạnh của các mô hình Gemini trực tiếp đến dòng lệnh. Mặc dù bản thân Gemini CLI đã rất mạnh mẽ, nhưng tiềm năng thực sự của công cụ này chỉ được khai thác khi kết hợp với Tiện ích Gemini CLI.

Tiện ích là cách chính thức và chuẩn hoá để tăng cường các chức năng của Gemini CLI. Trước khi có Extensions, việc tuỳ chỉnh CLI thường liên quan đến việc chỉnh sửa thủ công các tệp cấu hình như settings.json, một quy trình có thể "lộn xộn và dễ xảy ra lỗi".

Hãy xem tiện ích là một "vùng chứa" cho các chế độ tuỳ chỉnh Gemini CLI. Đây là một gói độc lập, có thể phân phiên bản và dễ dàng phân phối, gói này kết hợp tất cả các thành phần cần thiết để dạy Gemini một bộ kỹ năng mới. "Vùng chứa vận chuyển" này có thể bao gồm :

  • Cấu hình máy chủ MCP: Những cấu hình này kết nối Gemini với các công cụ và API bên ngoài, chẳng hạn như API Google Cloud hoặc các dịch vụ bên thứ ba.
  • Tệp bối cảnh (GEMINI.md): Đây là "sổ tay hướng dẫn" cung cấp cho mô hình các chỉ dẫn và nguyên tắc cụ thể về cách sử dụng hiệu quả các công cụ mới.
  • Lệnh gạch chéo tuỳ chỉnh (tệp .toml): Những lệnh này đóng gói các câu lệnh phức tạp, nhiều bước thành các lệnh đơn giản, dễ sử dụng, chẳng hạn như /deploy.
  • Hạn chế về công cụ (excludeTools): Những hạn chế này có thể tắt các công cụ tích hợp để tạo ra một môi trường an toàn hơn hoặc tập trung hơn.

Giá trị cốt lõi của Tiện ích là biến Gemini CLI từ một trợ lý cá nhân thành một nền tảng có khả năng mở rộng và sẵn sàng cho doanh nghiệp. Một nhóm có thể đóng gói toàn bộ ngăn xếp đám mây của mình vào một tiện ích duy nhất, cho phép các nhà phát triển mới làm việc hiệu quả chỉ bằng một lệnh.

Trong lớp học lập trình này, bạn sẽ tìm hiểu cách sử dụng hệ sinh thái mạnh mẽ này. Bạn sẽ không tạo một tiện ích, nhưng bạn sẽ cài đặt và sử dụng 4 tiện ích khác nhau để thêm các chức năng triển khai ứng dụng, phân tích bảo mật, phân tích dữ liệu và cơ sở hạ tầng dưới dạng mã vào thiết bị đầu cuối của mình.

Bạn sẽ thực hiện

  • Cài đặt và định cấu hình Gemini CLI cũng như các điều kiện tiên quyết của Google Cloud.
  • Duyệt xem Thư viện tiện ích chính thức của Gemini CLI để tìm các tiện ích.
  • Sử dụng giao diện dòng lệnh gemini extensions để cài đặt, liệt kê và quản lý Tiện ích.
  • Khám phá một số Tiện ích của Gemini CLI

Kiến thức bạn sẽ học được

  • Giới thiệu về các Tiện ích Gemini CLI và lý do đây là tiêu chuẩn để tuỳ chỉnh CLI.
  • Cách tìm và cài đặt Tiện ích từ Thư viện tiện ích hoặc một URL GitHub.
  • Chức năng của các lệnh quản lý khoá: gemini extensions install, gemini extensions listgemini extensions update.
  • Cài đặt và sử dụng một số Tiện ích Gemini CLI

Bạn cần có

  • Trình duyệt web Chrome
  • Tài khoản Gmail
  • Một Dự án trên đám mây đã bật tính năng thanh toán

Lớp học lập trình này dành cho người dùng và nhà phát triển ở mọi cấp độ (kể cả người mới bắt đầu). Bạn nên có hiểu biết cơ bản về Gemini CLI, mặc dù các bước sẽ được cung cấp để cài đặt Gemini CLI từ đầu. Nếu bạn muốn làm quen với Gemini CLI, hãy thử lớp học lập trình: Thực hành với Gemini CLI.

2. Trước khi bắt đầu

Tạo một dự án

  1. Trong Google Cloud Console, trên trang chọn dự án, hãy chọn hoặc tạo một dự án trên Google Cloud.
  2. Đảm bảo rằng bạn đã bật tính năng thanh toán cho dự án trên Cloud. Tìm hiểu cách kiểm tra xem tính năng thanh toán có được bật trên một dự án hay không.
  1. Bạn sẽ sử dụng Cloud Shell, một môi trường dòng lệnh chạy trong Google Cloud và được tải sẵn bằng bq. Nhấp vào Kích hoạt Cloud Shell ở đầu bảng điều khiển Google Cloud.

Hình ảnh nút Kích hoạt Cloud Shell

  1. Sau khi kết nối với Cloud Shell, bạn có thể kiểm tra để đảm bảo rằng bạn đã được xác thực và dự án được đặt thành mã dự án của bạn bằng lệnh sau:
gcloud auth list
  1. Chạy lệnh sau trong Cloud Shell để xác nhận rằng lệnh gcloud biết về dự án của bạn.
gcloud config list project
  1. Nếu bạn chưa đặt dự án, hãy dùng lệnh sau để đặt:
gcloud config set project <YOUR_PROJECT_ID>
  1. Bật các API bắt buộc thông qua lệnh bên dưới. Quá trình này có thể mất vài phút, vì vậy, vui lòng kiên nhẫn chờ đợi.
gcloud services enable cloudresourcemanager.googleapis.com \
                       servicenetworking.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \

Khi thực thi lệnh thành công, bạn sẽ thấy một thông báo tương tự như thông báo dưới đây:

Operation "operations/..." finished successfully.

Nếu bỏ lỡ API nào, bạn luôn có thể bật API đó trong quá trình triển khai.

Tham khảo tài liệu về các lệnh và cách sử dụng gcloud.Trước khi thiết lập và chạy Gemini CLI, hãy tạo một thư mục mà bạn sẽ sử dụng làm thư mục chính cho tất cả các dự án mà bạn có thể tạo bên trong thư mục đó. Đây là điểm bắt đầu để Gemini CLI hoạt động, mặc dù nó cũng sẽ tham chiếu một số thư mục khác trên hệ thống của bạn và bạn sẽ truy cập vào các thư mục đó sau, khi cần.

Tiếp tục tạo một thư mục mẫu (gemini-cli-projects) rồi chuyển đến thư mục đó thông qua các lệnh bên dưới. Nếu bạn muốn sử dụng tên thư mục khác, vui lòng thực hiện.

mkdir gemini-cli-projects

Hãy chuyển đến thư mục đó:

cd gemini-cli-projects

Bạn có thể khởi chạy Gemini CLI trực tiếp thông qua lệnh gemini trong một thiết bị đầu cuối Cloud Shell mới hoặc Gemini CLI đã được khởi chạy trong một thiết bị đầu cuối Cloud Shell riêng biệt.

Lần tương tác đầu tiên của chúng ta với Gemini CLI

Chúng ta cần đảm bảo rằng mọi thứ đều ổn với môi trường Gemini CLI, để có thể đưa ra câu lệnh đầu tiên như minh hoạ dưới đây:

Give me a famous quote on Artificial Intelligence and who said that?

Bạn sẽ nhận thấy rằng truy vấn của chúng ta đã tạo ra một công cụ GoogleSearch (một công cụ tích hợp trong Gemini CLI) được gọi. Nói cách khác, bạn đã sử dụng một trong những công cụ mạnh mẽ được tích hợp sẵn của Gemini CLI, cụ thể là GoogleSearch. Công cụ này sẽ đưa ra câu trả lời dựa trên thông tin mà nó lấy được từ web. Bạn sẽ nhận được phản hồi cho câu hỏi của mình.

Tiếp theo, hãy bắt đầu tìm hiểu về Tiện ích.

3. Tiện ích là gì?

Tiện ích là một gói độc lập, có thể phân phiên bản và dễ dàng phân phối. Hãy xem đây là "vùng chứa" cho các chế độ tuỳ chỉnh Gemini CLI, tập hợp mọi thứ cần thiết cho một quy trình làm việc cụ thể vào một gói duy nhất, gọn gàng.

816cd3c3d4057c11.png

Tiện ích có thể kết hợp bất kỳ tổ hợp nào sau đây:

  • Lệnh dấu gạch chéo tuỳ chỉnh (tệp .toml của bạn).
  • Cấu hình máy chủ MCP (trước đây nằm trong settings.json).
  • Tệp bối cảnh (GEMINI.md) để cung cấp hướng dẫn và nguyên tắc cụ thể cho mô hình.
  • Hạn chế công cụ (excludeTools) để tạo một môi trường an toàn và tập trung hơn.

Lý do bạn nên sử dụng tiện ích Các lợi ích cốt lõi

Việc áp dụng Tiện ích cho các hoạt động tuỳ chỉnh mang lại một số lợi thế mạnh mẽ:

  • Cài đặt bằng một lệnh: Đây là điểm mấu chốt. Thay vì thiết lập thủ công nhiều bước, người dùng có thể cài đặt một bộ công cụ hoàn chỉnh và phức tạp chỉ bằng một lệnh: gemini extensions install <URL> hoặc gemini extensions install --path=some/local/path. <URL> trong lệnh trên có thể là URL của Github nơi bạn lưu trữ tiện ích.
  • Đơn giản hoá quy trình phân phối: Việc chia sẻ công việc của bạn trở nên dễ dàng như chia sẻ một URL kho lưu trữ Git duy nhất. Không cần phải truyền các tệp và đoạn mã cấu hình riêng lẻ nữa.
  • Quản lý phiên bản và phần phụ thuộc: Vì các Tiện ích thường được lưu trữ trong kho lưu trữ Git, nên bạn có thể sử dụng tính năng kiểm soát phiên bản miễn phí. Có gemini extensions update command để cập nhật một tiện ích lên phiên bản mới nhất.
  • Khả năng khám phá và hệ sinh thái: Tiện ích là nền tảng cho một hệ sinh thái phong phú và mở, tương tự như các trang web thương mại cho VS Code hoặc Chrome. Cơ chế Tiện ích có thể tạo nền tảng cho một trang web thương mại trong tương lai, nơi những Tiện ích này có thể được xem xét, tải xuống và nhiều hoạt động khác theo đúng phong cách cộng đồng.

Việc ra mắt khung tiện ích là một tín hiệu rõ ràng cho thấy Gemini CLI đang phát triển từ một công cụ độc lập mạnh mẽ thành một nền tảng có khả năng mở rộng thực sự.

4. Tìm hiểu kiến thức cơ bản về tiện ích

Phần này đề cập đến những phần mà người dùng nhìn thấy trong hệ sinh thái tiện ích: tìm tiện íchquản lý tiện ích.

Thư viện tiện ích là thị trường trung tâm để khám phá tất cả các tiện ích chính thức do Google và bên thứ ba xây dựng:

  1. Mở URL sau trong trình duyệt: https://geminicli.com/extensions/browse/.
  2. Thư viện này là công cụ giúp tăng khả năng hiển thị cho hệ sinh thái. Bạn có thể xem các Tiện ích của những công ty như GitHub, Redis và DynaTrace, cho thấy phạm vi của các công cụ hiện có.
  3. Di chuyển xuống và tìm thẻ tiện ích cho Cloud Run.
  4. Xin lưu ý rằng thẻ này cung cấp nội dung mô tả, tác giả (Google) và nút lệnh Copy install chỉ bằng một lần nhấp. Đây là cách đơn giản nhất để nhận lệnh cài đặt cho một tiện ích.

Tiện ích Gemini CLI – Lệnh quản lý

Lệnh gemini extensions là điểm truy cập để quản lý các Tiện ích tại địa phương.

Chạy lệnh này trong thiết bị đầu cuối để xem danh sách các lệnh có sẵn.

5a774a9fab1be3ed.png

Các lệnh này rất đơn giản (cài đặt/gỡ cài đặt, liệt kê, cập nhật, bật/tắt, v.v.) và chúng ta sẽ sử dụng một số lệnh trong số này trong lớp học lập trình này.

Kiểm tra trạng thái hiện tại

Trước khi cài đặt bất cứ thứ gì, hãy kiểm tra "trạng thái ban đầu" của chúng ta.

  1. Chạy lệnh gemini extensions list:
  2. Bạn sẽ thấy kết quả sau đây, xác nhận rằng bạn chưa cài đặt Tiện ích nào.
No extensions installed.

5. Tiện ích Cloud Run (Triển khai ứng dụng)

Tiện ích Cloud Run có trong thư viện Tiện ích của Gemini CLI là một MCP Server cho phép chúng ta triển khai các ứng dụng của mình vào Cloud Run.

Thẻ Tiện ích Cloud Run trong Thư viện tiện ích được minh hoạ dưới đây:

648026b7668d0db.png

Trước tiên, hãy cài đặt Tiện ích Cloud Run bằng cách nhấp vào Sao chép lệnh cài đặt như minh hoạ ở trên. Sau đó, hãy dán lệnh đó vào thiết bị đầu cuối Cloud Shell (lệnh này sẽ tương tự như lệnh sau):

gemini extensions install https://github.com/GoogleCloudPlatform/cloud-run-mcp

Khi chạy lệnh trên, bạn sẽ thấy một thông báo yêu cầu xác nhận. Hãy phê duyệt yêu cầu đó. Sau đó, Tiện ích Cloud Run sẽ cài đặt thành công.

Installing extension "cloud-run".
**Extensions may introduce unexpected behavior. Ensure you have investigated the extension source and trust the author.**
This extension will run the following MCP servers:
  * cloud-run (local): npx -y @google-cloud/cloud-run-mcp
This extension will append info to your gemini.md context using gemini-extension/GEMINI.md
Do you want to continue? [Y/n]: Y
Extension "cloud-run" installed successfully and enabled.

Nếu thực thi lệnh gemini extensions list (liệt kê tiện ích Gemini), bạn sẽ thấy tiện ích Cloud Run đã được cài đặt như minh hoạ dưới đây:

✓ cloud-run (1.0.0)
 Path: <HOME_FOLDER>/.gemini/extensions/cloud-run
 Source: https://github.com/GoogleCloudPlatform/cloud-run-mcp (Type: github-release)
 Release tag: v1.5.0
 Enabled (User): true
 Enabled (Workspace): true
 Context files:
  <HOME_FOLDER>/.gemini/extensions/cloud-run/gemini-extension/GEMINI.md
 MCP servers:
  cloud-run

Nếu khởi chạy Gemini CLI ngay bây giờ và thực thi lệnh /mcp, bạn sẽ thấy như sau:

7ca93915c06e4ce2.png

Bây giờ, hãy quay lại Cloud Shell và thử triển khai một ứng dụng. Để làm được việc đó, trước tiên, chúng ta cần có một ứng dụng đơn giản để triển khai trên Cloud Run. Hãy làm theo các bước dưới đây:

Đảm bảo rằng bạn đang ở trong thư mục mà chúng ta đã tạo trước đó, tức là gemini-cli-projects. Tạo một thư mục khác bên trong thư mục này có tên là gemini-cloud-run rồi chuyển đến thư mục đó.

mkdir gemini-cloud-run

cd gemini-cloud-run

Bây giờ, hãy tạo 2 tệp trong thư mục này (tệp app.pyrequirements.txt), nội dung của các tệp này được cung cấp bên dưới:

app.py

from flask import Flask
app = Flask(__name__)
@app.route('/')
def hello_world():
  return 'Hello from Gemini and Cloud Run!'
if __name__ == "__main__":
  app.run(debug=True, host='0.0.0.0', port=8080)

requirements.txt

Flask
gunicorn

Bây giờ, hãy chạy Gemini CLI từ thư mục gemini-cloud-run. Khi thiết bị đầu cuối đã sẵn sàng, hãy đưa ra câu lệnh sau:

/deploy --project="PROJECT_ID" --location="PROJECT_LOCATION" --name="SERVICE_NAME"

Bạn sẽ cần chỉ định PROJECT_ID (mã dự án trên Google Cloud), PROJECT_LOCATIONSERVICE_NAME. Nếu bạn không cung cấp thông tin này, lệnh Cloud Run sẽ gọi các công cụ thích hợp để giúp bạn chọn.

Trong quá trình này, công cụ sẽ chọn đúng công cụ trong Tiện ích máy chủ MCP Cloud Run mà chúng tôi đã cài đặt. Ví dụ: bạn sẽ thấy một thông báo như sau:

9dcf78679bffd710.png

Hãy cho phép sử dụng công cụ này.

Vậy là xong! Giờ đây, Gemini CLI có tất cả thông tin cần thiết cùng với sự cho phép của bạn để thực thi các công cụ. Lệnh này sẽ thực thi toàn bộ quy trình triển khai: tạo hình ảnh Docker, đẩy hình ảnh đó vào Artifact Registry, định cấu hình và triển khai một dịch vụ Cloud Run mới.

Sau vài phút (thực tế là 2–3 phút), bạn sẽ thấy một thông báo thành công kèm theo URL dịch vụ. Sau đây là ví dụ về một lần chạy:

The Cloud Run service SERVICE_NAME has been deployed from the current folder in project PROJECT_ID.
  You can view the service in the Cloud Console: https://console.cloud.google.com/run/detail/PROJECT_LOCATION/SERVICE_NAME?project=PROJECT_ID
  The service is accessible at: https://SERVICE_NAME-SOME-ID.a.run.app

Hãy nhấp vào đường liên kết đó. Bạn sẽ thấy ứng dụng Flask phân phát trang chủ:

92414fd2270ccc46.png

Điều này cho thấy sức mạnh của một Tiện ích Gemini CLI (trong trường hợp này là Cloud Run), trong đó tiện ích này hoàn toàn bao hàm sự phức tạp của các lệnh gcloud CLI và chỉ cần xử lý mọi thông tin chi tiết cho bạn.

Bạn có thể khám phá các công cụ khác trong Máy chủ MCP Cloud Run.

6. Tiện ích BigQuery (Phân tích tập dữ liệu lớn)

Để theo dõi, bạn cần:

  • Dự án trên Google Cloud đã bật BigQuery API.
  • Quyền IAM:
  • Người dùng BigQuery (roles/bigquery.user)
  1. Chạy lệnh này để đặt biến môi trường BIGQUERY_PROJECT. Đây là dự án sẽ thực thi các công việc BigQuery, không nhất thiết phải là dự án nơi dữ liệu của bạn được lưu trữ (mặc dù chúng có thể giống nhau)
export BIGQUERY_PROJECT=<YOUR_GCP_PROJECT_ID>
  1. Cài đặt tiện ích BigQuery Data Analytics thông qua lệnh bên dưới. Hãy cấp cho ứng dụng này quyền cài đặt. Sau khi cài đặt thành công, bạn sẽ có 2 Tiện ích được cài đặt trong chế độ thiết lập : cloud-runbigquery-data-analytics.
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
  1. Hãy khởi chạy lại Gemini CLI bằng lệnh sau:
gemini

Gemini CLI sẽ khởi chạy trong thiết bị đầu cuối của bạn: 7a140fbd0d7f7d3c.png

Bạn nên nhập các lệnh sau vào thiết bị đầu cuối Gemini CLI.

  1. Xác nhận rằng tiện ích BigQuery đã được cài đặt và sẵn sàng hoạt động bằng cách nhập lệnh gạch chéo bên dưới:
/extensions list

Bạn cũng sẽ thấy tiện ích bigquery-data-analytics trong danh sách.

9461d5119d9dc693.png

  1. Chạy lệnh bên dưới để xem các công cụ có sẵn
/mcp list

fd23c246e2a6e4db.png

  1. Hãy đặt một câu hỏi phân tích cơ bản về tập dữ liệu công khai trên BigQuery: thương mại điện tử về thời trang. Tập dữ liệu này có dữ liệu về khách hàng, sản phẩm và đơn đặt hàng của một trang web thương mại điện tử bán quần áo giả định. Nhập câu lệnh sau vào Gemini CLI:
Look at BigQuery's the look ecommerce public dataset. Identify the top 5 products that had the most orders.
  • Gemini CLI sẽ hỏi xem bạn có muốn cho phép thực thi các công cụ BigQuery hay không. Để tiếp tục, hãy chọn lựa chọn thứ ba: Yes, always allow all tools from server "bigquery_data_analytics". 3d6e7372e5147216.png
  • Gemini sẽ tạo truy vấn SQL phù hợp, gọi công cụ execute_sql và trả về câu trả lời bằng ngôn ngữ tự nhiên cùng với dữ liệu của bạn:

ac5c0cd94bc3bb78.png

  1. Giờ đây, chúng ta sẽ yêu cầu Gemini dự đoán tỷ lệ trả lại sản phẩm dựa trên dữ liệu trong quá khứ. Đối với lệnh này, Gemini CLI không được cố gắng tạo một số câu lệnh SQL chi tiết để tạo dự báo này, mà phải gọi công cụ forecast từ máy chủ MCP. Công cụ này sẽ sử dụng AI.Forecast của BigQuery:
Forecast what the return rate will be next month.
  • Bạn sẽ thấy một phản hồi như sau:

8a763a03852984ff.png

7. Khám phá thêm

Vậy là chúng ta đã hoàn thành lớp học lập trình này. Trong lớp học này, chúng ta đã tìm hiểu về Tiện ích của Gemini CLI, các lệnh cơ bản để làm việc với tiện ích và khám phá một số tiện ích như tiện ích cloud-runbigquery-data-analytics.

Truy cập vào Thư viện tiện ích của Gemini tại https://geminicli.com/extensions/ để khám phá các tiện ích hiện có (hơn 100 tiện ích tại thời điểm viết bài) mà bạn có thể sử dụng ngay hôm nay. Mỗi thẻ Tiện ích chứa thông tin, loại Tiện ích (MCP, Context, v.v.) cùng với đường liên kết đến kho lưu trữ GitHub và một lệnh để cài đặt tiện ích trong môi trường của bạn.

1c26d4f029747914.png

8. Xin chúc mừng

Xin chúc mừng! Bạn đã hiểu rõ về Tiện ích Gemini CLI cũng như cách cài đặt và sử dụng nhiều Tiện ích Gemini CLI.

Tài liệu tham khảo