Giới thiệu về Bộ công cụ vận hành của Cloud

1. Giới thiệu

Lần cập nhật gần đây nhất: ngày 28 tháng 7 năm 2023

Google Cloud Operations Suite là gì?

Google Cloud Operations Suite là một nền tảng giúp bạn giám sát, khắc phục sự cố và cải thiện hiệu suất của ứng dụng trên môi trường Google Cloud. Các thành phần chính của Bộ công cụ vận hành đám mây bao gồm Giám sát trên đám mây, Ghi nhật ký trên đám mây và Theo dõi đám mây.

Xem video này để nắm được thông tin tổng quan về Google Cloud Operations.

Sản phẩm bạn sẽ tạo ra

Trong lớp học lập trình này, bạn sẽ triển khai một API mẫu trên Google Cloud. Sau đó, bạn sẽ khám phá và định cấu hình nhiều tính năng trong giải pháp Giám sát trên đám mây đối với API.

Kiến thức bạn sẽ học được

  • Sử dụng Cloud Shell của Google Cloud để triển khai ứng dụng mẫu cho Cloud Run.
  • Sử dụng các tính năng Giám sát của Google Cloud như Trang tổng quan, Cảnh báo, Kiểm tra thời gian hoạt động, Giám sát SLI/SLO và nhiều tính năng khác.

Bạn cần có

  • Phiên bản Chrome mới nhất (74 trở lên)
  • Một tài khoản Google Cloud và một dự án trên Google Cloud

2. Thiết lập và yêu cầu

Thiết lập môi trường theo tiến độ riêng

Nếu chưa có Tài khoản Google (Gmail hoặc Google Apps), bạn phải tạo một tài khoản. Đăng nhập vào bảng điều khiển Google Cloud Platform ( console.cloud.google.com) và tạo một dự án mới.

b35bf95b8bf3d5d8.png

a99b7ace416376c4.png

c20a9642aaa18d11.png

  • Tên dự án là tên hiển thị của những người tham gia dự án này. Đây là một chuỗi ký tự không được API của Google sử dụng. Bạn có thể cập nhật thông tin này bất cứ lúc nào.
  • Mã dự án phải là mã duy nhất trong tất cả các dự án trên Google Cloud và không thể thay đổi (bạn không thể thay đổi mã này sau khi đặt). Cloud Console sẽ tự động tạo một chuỗi duy nhất; thường bạn không quan tâm đến sản phẩm đó là gì. Trong hầu hết các lớp học lập trình, bạn sẽ cần tham chiếu đến Mã dự án (mã này thường được xác định là PROJECT_ID). Nếu không thích mã đã tạo, bạn có thể tạo một mã nhận dạng ngẫu nhiên khác. Ngoài ra, bạn có thể thử phương pháp của riêng mình và xem có được cung cấp hay không. Bạn không thể thay đổi thông tin này sau bước này và thông báo đó sẽ vẫn tồn tại trong thời gian của dự án.
  • Cho bạn biết, có giá trị thứ ba, Số dự án mà một số API sử dụng. Tìm hiểu thêm về cả ba giá trị này trong tài liệu này.

Thận trọng: Mã dự án phải là mã duy nhất trên toàn hệ thống và không ai khác có thể sử dụng mã này sau khi bạn chọn mã này. Bạn là người dùng duy nhất của mã nhận dạng đó. Ngay cả khi dự án bị xoá, bạn cũng không thể dùng lại mã này

  1. Tiếp theo, bạn sẽ phải bật tính năng thanh toán trong Cloud Console để sử dụng API/tài nguyên trên đám mây. Việc chạy qua lớp học lập trình này sẽ không tốn nhiều chi phí. Để tắt các tài nguyên nhằm tránh bị tính phí ngoài hướng dẫn này, bạn có thể xoá các tài nguyên bạn đã tạo hoặc xoá toàn bộ dự án. Người dùng mới của Google Cloud đủ điều kiện tham gia chương trình Dùng thử miễn phí 300 USD.

Thiết lập Google Cloud Shell

Mặc dù bạn có thể vận hành Google Cloud và Google Cloud Trace từ xa trên máy tính xách tay, nhưng trong lớp học lập trình này, chúng ta sẽ sử dụng Google Cloud Shell, một môi trường dòng lệnh chạy trong Đám mây.

Để kích hoạt Cloud Shell từ Bảng điều khiển Cloud, bạn chỉ cần nhấp vào Kích hoạt Cloud Shell (chỉ mất vài phút để cấp phép và kết nối với môi trường).

30c26f30d17b3d46.pngS

Nếu trước đây bạn chưa từng khởi động Cloud Shell, thì bạn sẽ thấy một màn hình trung gian (dưới màn hình đầu tiên) mô tả về ứng dụng này. Nếu trường hợp đó xảy ra, hãy nhấp vào Tiếp tục (và bạn sẽ không bao giờ thấy nút đó nữa). Màn hình một lần đó sẽ có dạng như sau:

9c92662c6a846a5c.pngS

Quá trình cấp phép và kết nối với Cloud Shell chỉ mất vài phút.

9f0e51b578fecce5.pngs

Máy ảo này chứa tất cả các công cụ phát triển mà bạn cần. Dịch vụ này cung cấp thư mục gốc có dung lượng ổn định 5 GB và chạy trong Google Cloud, giúp nâng cao đáng kể hiệu suất và khả năng xác thực của mạng. Trong lớp học lập trình này, đa số mọi người đều có thể thực hiện chỉ bằng một trình duyệt hoặc Chromebook.

Sau khi kết nối với Cloud Shell, bạn sẽ thấy mình đã được xác thực và dự án đã được đặt thành mã dự án.

Chạy lệnh sau trong Cloud Shell để xác nhận rằng bạn đã được xác thực:

Sau khi kết nối với Cloud Shell, bạn sẽ thấy mình đã được xác thực và dự án đã được đặt thành PROJECT_ID.

gcloud auth list

Kết quả lệnh

Credentialed accounts:
 - <myaccount>@<mydomain>.com (active)
gcloud config list project

Kết quả lệnh

[core]
project = <PROJECT_ID>

Nếu vì lý do nào đó mà dự án không được thiết lập, chỉ cần phát hành lệnh sau:

gcloud config set project <PROJECT_ID>

Cloud Shell cũng đặt một số biến môi trường theo mặc định. Điều này có thể hữu ích khi bạn chạy các lệnh sau này.

echo $GOOGLE_CLOUD_PROJECT

Kết quả lệnh

<PROJECT_ID>

Ứng dụng mẫu

Chúng tôi đã đặt mọi thứ bạn cần cho dự án này vào Git repo. Kho lưu trữ này chứa một số ứng dụng mẫu và bạn có thể chọn sử dụng bất kỳ ứng dụng nào trong số đó cho bài tập này.

Đường liên kết đến kho lưu trữ Git: https://github.com/rominirani/cloud-code-sample-repository

3. Triển khai ứng dụng API

Ứng dụng hoặc API mẫu nói về vấn đề gì?

Ứng dụng của chúng ta là một ứng dụng API Inventory (API Kho hàng) đơn giản hiển thị Điểm cuối API REST cùng một số thao tác để liệt kê các mặt hàng tồn kho và lấy số lượng mặt hàng cụ thể trong kho hàng.

Sau khi triển khai API và giả định rằng API đó được lưu trữ tại https://&lt;somehost&gt;, chúng ta có thể truy cập vào các điểm cuối của API như sau:

  • https://&lt;somehost&gt;/inventory

Thao tác này sẽ liệt kê tất cả các mặt hàng sản phẩm có cấp kho hàng sẵn có.

  • https://&lt;somehost&gt;/inventory/{productid}

Mã này sẽ cung cấp một bản ghi có cấp độ sản phẩm và cấp kho hàng trên tay cho sản phẩm đó.

Dữ liệu phản hồi được trả về có định dạng JSON.

Yêu cầu/Phản hồi mẫu và dữ liệu mẫu

Ứng dụng này không được cơ sở dữ liệu hỗ trợ ở phần phụ trợ để đảm bảo mọi thứ đơn giản. Nó chứa 3 mã sản phẩm mẫu và các cấp khoảng không quảng cáo sẵn có.

Mã sản phẩm

Số lượng sản phẩm có thể sử dụng

I-1

10

I-2

20

I-3

30

Dưới đây là mẫu Yêu cầu và phản hồi của API:

Yêu cầu API

Phản hồi của API

https://&lt;somehost&gt;/inventory

[ { &quot;I-1&quot;: 10, &quot;I-2&quot;: 20, &quot;I-3&quot;: 30 }]

https://&lt;somehost&gt;/inventory/I-1

{ &quot;productid&quot;: &quot;I-1&quot;, &quot;qty&quot;: 10}

https://&lt;somehost&gt;/inventory/I-2

{ &quot;productid&quot;: &quot;I-2&quot;, &quot;qty&quot;: 20}

https://&lt;somehost&gt;/inventory/I-200

{ &quot;productid&quot;: I-200, &quot;qty&quot;: -1}

Sao chép Kho lưu trữ

Mặc dù bạn có thể vận hành Google Cloud từ xa trên máy tính xách tay, nhưng trong lớp học lập trình này, bạn sẽ sử dụng Google Cloud Shell, một môi trường dòng lệnh chạy trong Đám mây.

Trong Bảng điều khiển GCP, hãy nhấp vào biểu tượng Cloud Shell ở thanh công cụ trên cùng bên phải:

bce75f34b2c53987.png

Sẽ chỉ mất một chút thời gian để cấp phép và kết nối với môi trường. Sau khi hoàn tất, bạn sẽ thấy như sau:

f6ef2b5f13479f3a.png

Máy ảo này chứa tất cả các công cụ phát triển mà bạn cần. Phiên bản này cung cấp thư mục gốc có dung lượng ổn định 5 GB và chạy trên Google Cloud, giúp nâng cao đáng kể hiệu suất và khả năng xác thực của mạng. Bạn có thể thực hiện tất cả công việc trong phòng thí nghiệm này chỉ bằng một trình duyệt.

Thiết lập gcloud

Trong Cloud Shell, hãy đặt mã dự án và lưu mã này dưới dạng biến PROJECT_ID.

PROJECT_ID=[YOUR-PROJECT-ID]
gcloud config set project $PROJECT_ID

Bây giờ, hãy thực thi lệnh sau:

$ git clone https://github.com/rominirani/cloud-code-sample-repository.git 

Thao tác này sẽ tạo một thư mục có tên cloud-code-sample-repository trong thư mục này.

(Không bắt buộc) Chạy ứng dụng trên Cloud Shell

Bạn có thể chạy ứng dụng cục bộ bằng cách làm theo các bước sau:

  1. Trên cửa sổ dòng lệnh, hãy chuyển đến phiên bản Python của API thông qua lệnh sau:
$ cd cloud-code-sample-repository
$ cd python-flask-api
  1. Trong thiết bị đầu cuối, hãy cung cấp lệnh sau (Tại thời điểm viết, Cloud Shell đi kèm với Python 3.9.x được cài đặt và chúng tôi sẽ sử dụng phiên bản mặc định. Nếu bạn dự định chạy nó trên máy tính xách tay của mình, bạn có thể sử dụng Python 3.8+) :
$ python app.py
  1. Bạn có thể chạy lệnh sau để khởi động Máy chủ Python cục bộ.

26570f586acaeacf.png.

  1. Thao tác này sẽ khởi động một máy chủ trên cổng 8080 và bạn có thể kiểm thử cục bộ thông qua tính năng Web Preview (Bản xem trước trên web) của Cloud Shell. Nhấp vào nút Bản xem trước trên web như minh hoạ dưới đây:

675d9b3097a6209c.png.

Nhấp vào Xem trước trên cổng 8080.

  1. Một cửa sổ trình duyệt sẽ mở ra. Bạn sẽ thấy Lỗi 404 và điều này không có vấn đề gì. Sửa đổi URL và thay đổi thành chỉ có /inventory sau tên máy chủ.

Ví dụ: trên máy của tôi sẽ có dạng như sau:

https://8080-cs-557561579860-default.cs-asia-southeast1-yelo.cloudshell.dev/inventory

Thao tác này sẽ hiển thị danh sách các mặt hàng tồn kho như được giải thích trước đó:

ef6afb0184c58870.png

  1. Bạn có thể dừng máy chủ ngay bây giờ bằng cách chuyển đến Terminal rồi nhấn phím Ctrl-C

Triển khai ứng dụng

Bây giờ, chúng tôi sẽ triển khai ứng dụng API này cho Cloud Run. Quy trình sử dụng ứng dụng dòng lệnh glcoud để chạy lệnh nhằm triển khai mã cho Cloud Run.

Trên cửa sổ dòng lệnh, hãy dùng lệnh gcloud sau:

$ gcloud run deploy --source .

Việc này sẽ hỏi bạn nhiều câu hỏi (nếu được yêu cầu cho phép, vui lòng tiếp tục) và một số điểm được đề cập bên dưới. Bạn có thể nhận được hoặc không nhận được tất cả câu hỏi, tuỳ thuộc vào cấu hình và việc bạn đã bật một số API trong dự án Google Cloud hay chưa.

  1. Tên dịch vụ (python-flask-api): Dùng giá trị mặc định này hoặc chọn tên như my-inventory-api
  2. API [run.googleapis.com] không được bật trên dự án [project-number]. Bạn có muốn bật rồi thử lại không (quá trình này sẽ mất vài phút)? (có) không? Có
  3. Vui lòng chỉ định một khu vực: Chọn một khu vực mà bạn muốn bằng cách cung cấp một số.
  4. API [artifactregistry.googleapis.com] không được bật trên dự án [project-number]. Bạn có muốn bật rồi thử lại không (quá trình này sẽ mất vài phút)? (có) không? Có
  5. Việc triển khai từ nguồn yêu cầu kho lưu trữ Artifact Registry Docker để lưu trữ các vùng chứa đã dựng. Một kho lưu trữ có tên [cloud-run-source-deploy] tại khu vực [us-west1] sẽ được tạo.

Bạn có muốn tiếp tục (Có/không)? Có

  1. Cho phép các lệnh gọi chưa được xác thực tới [my-inventory-api] (y/N)? Có

Cuối cùng, quá trình này sẽ khởi động quá trình lấy mã nguồn của bạn, lưu trữ mã, đẩy mã vào Sổ đăng ký cấu phần phần mềm rồi triển khai dịch vụ + bản sửa đổi Cloud Run. Bạn nên kiên nhẫn thông qua quá trình này (có thể mất 3-4 phút) và bạn sẽ thấy quá trình được hoàn tất với URL dịch vụ được hiển thị cho bạn.

Dưới đây là một lần chạy mẫu:

7516696ea5b3004b.png.

Kiểm thử ứng dụng

Hiện tại, chúng ta đã triển khai ứng dụng lên Cloud Run, bạn có thể truy cập vào ứng dụng API như sau:

  1. Ghi lại URL Dịch vụ từ bước trước. Ví dụ: trên chế độ thiết lập của tôi, trạng thái này sẽ hiển thị là https://my-inventory-api-bt2r5243dq-uw.a.run.app. Đặt tên là &lt;SERVICE_URL&gt;.
  2. Mở trình duyệt và truy cập vào 3 URL sau cho các điểm cuối API:
  3. &lt;SERVICE_URL&gt;/inventory
  4. <SERVICE_URL>/kho hàng/I-1
  5. <SERVICE_URL>/kho hàng/I-100

Yêu cầu và phản hồi đó phải theo các thông số kỹ thuật mà chúng tôi đã cung cấp trong phần trước với Yêu cầu và phản hồi API mẫu.

Nhận thông tin chi tiết về dịch vụ từ Cloud Run

Chúng tôi đã triển khai Dịch vụ API của mình lên Cloud Run, một môi trường điện toán không máy chủ. Chúng tôi có thể truy cập dịch vụ Cloud Run qua bảng điều khiển Google Cloud bất cứ lúc nào.

Trong trình đơn chính, hãy chuyển đến Cloud Run. Thao tác này sẽ hiển thị danh sách các dịch vụ mà bạn đang chạy trong Cloud Run. Bạn sẽ thấy dịch vụ mà bạn vừa triển khai. Tuỳ thuộc vào tên mà bạn đã chọn, bạn sẽ thấy như sau:

10d2c363241d789c.pngS

Nhấp vào tên Dịch vụ để xem thông tin chi tiết. Dưới đây là thông tin chi tiết về mẫu:

1ec2c9e45ff1a2db.png.

Hãy lưu ý URL. URL này không gì khác ngoài URL dịch vụ mà bạn có thể bấm vào trình duyệt và truy cập vào Inventory API (API Khoảng không quảng cáo) mà chúng ta vừa triển khai. Vui lòng xem Chỉ số và các thông tin chi tiết khác.

Hãy bắt đầu sử dụng Bộ công cụ hoạt động của Google Cloud ngay bây giờ.

4. Thiết lập Trang tổng quan

Một trong những tính năng tiện lợi mà giải pháp Giám sát trên đám mây cung cấp là trang tổng quan bên ngoài (OOTB) cho nhiều tài nguyên trong Google Cloud. Nhờ đó, bạn có thể thiết lập ban đầu cho Trang tổng quan với các chỉ số chuẩn. Quy trình nhanh chóng và thuận tiện.

Hãy cùng xem cách thực hiện việc đó cho Dịch vụ API mà chúng tôi vừa triển khai cho Cloud Run.

Trang tổng quan tuỳ chỉnh cho Dịch vụ của chúng tôi

Vì chúng tôi đã triển khai dịch vụ API trên Cloud Run, nên hãy cùng tìm hiểu cách thiết lập Trang tổng quan có thể giúp trình bày trực quan nhiều chỉ số, trong đó có một vài chỉ số trong đó có độ trễ của dịch vụ.

Trước tiên, trong bảng điều khiển, hãy chuyển đến phần Giám sát → Tổng quan như minh hoạ dưới đây:

c51a5dda4ab72bbf.png

Phần Tổng quan cho thấy nhiều mục mà bạn lẽ ra đã định cấu hình trong chức năng Giám sát, chẳng hạn như Trang tổng quan, Cảnh báo, Kiểm tra thời gian hoạt động, v.v.

2758f61f1e7f1dca.png.

Bây giờ, chúng ta hãy nhấp vào Trang tổng quan trong trình đơn chính bên. Chúng ta sẽ được chuyển đến màn hình sau:

c9110b6f065100da.png

Nhấp vào THƯ VIỆN MẪU . Thao tác này sẽ hiển thị danh sách Trang tổng quan độc quyền (OOTB) hiện có trong Google Cloud, trên nhiều tài nguyên. Cụ thể, hãy di chuyển xuống trong danh sách rồi chọn Google Cloud Run như hình bên dưới.

ddac4038d4fa91ae.png

Thao tác này sẽ hiển thị danh sách các trang tổng quan tiêu chuẩn có thể sử dụng trong Google Cloud Run. Chúng tôi quan tâm đến điều đó vì chúng tôi đã triển khai dịch vụ của mình trên Cloud Run.

Bạn sẽ thấy một Trang tổng quan dành cho giải pháp Giám sát trên Cloud Run. Nhấp vào đường liên kết XEM TRƯỚC để xem danh sách các biểu đồ (chỉ số) chuẩn có thể sử dụng cho giải pháp Giám sát trên Cloud Run. Chỉ cần nhấp vào NHẬP TRANG TỔNG QUAN MẪU để nhập tất cả các biểu đồ này vào một trang tổng quan tuỳ chỉnh. Thao tác này sẽ hiển thị màn hình Trang tổng quan cùng với tên được điền sẵn giống như hình dưới đây:

531cb8434b18193a.png.

Bạn có thể quay lại bằng cách nhấp vào Mũi tên trái nằm ở bên trái của tên Trang tổng quan, ngay trên cùng bên trái. Thao tác này sẽ dẫn đến danh sách Trang tổng quan, từ đó bạn sẽ có thể xem được Trang tổng quan mới mà bạn vừa tạo.

Hãy nhấp vào liên kết Trang tổng quan đó và bạn có thể theo dõi nhiều chỉ số có sẵn ngay từ đầu. Các chỉ số này bao gồm Độ trễ, Số yêu cầu, chỉ số Vùng chứa và nhiều chỉ số khác.

Bạn cũng có thể chọn đánh dấu bất kỳ Trang tổng quan nào là mục yêu thích, chỉ cần chọn biểu tượng dấu sao như sau:

fc993d1a17415550.png

Thao tác này sẽ thêm Trang tổng quan vào màn hình Tổng quan của chức năng Giám sát và giúp bạn dễ dàng di chuyển đến những trang tổng quan thường dùng.

2e8f66e2652c55c5.pngS

1e1dffb5239ab110.pngs

Quá tuyệt! Bạn vừa thêm một Trang tổng quan tuỳ chỉnh để giám sát các dịch vụ Cloud Run của mình. Chính xác!

5. Kiểm tra thời gian hoạt động

Trong phần này, chúng ta sẽ thiết lập tính năng kiểm tra thời gian hoạt động cho Dịch vụ API mà chúng ta đã triển khai. Quy trình kiểm tra thời gian hoạt động công khai có thể gửi yêu cầu từ nhiều vị trí trên khắp thế giới đến các URL hoặc tài nguyên công khai trên Google Cloud để xem tài nguyên có phản hồi hay không.

Tài nguyên trong trường hợp này sẽ là Dịch vụ API mà chúng tôi đã triển khai cho Cloud Run. URL sẽ là một điểm cuối cụ thể mà Dịch vụ API hiển thị để cho biết tình trạng của dịch vụ.

Trong mã dịch vụ API mẫu, chúng ta đã hiển thị một điểm cuối /healthy trả về giá trị chuỗi "All Izz Well". Vì vậy, tất cả những gì chúng ta cần làm là xác định quy trình kiểm tra thời gian hoạt động gặp một số kiểu như https://&lt;SERVICE_URL&gt;/healthy và kiểm tra xem chuỗi https://&lt;SERVICE_URL&gt;/healthy có được trả về hay không.

Tạo kênh thông báo

Trước khi chúng ta tạo quy trình kiểm tra thời gian hoạt động, điều quan trọng là bạn phải định cấu hình kênh thông báo. Kênh thông báo là phương tiện để bạn nhận được cảnh báo nếu có sự cố/sự cố với bất kỳ tài nguyên nào được giám sát của chúng tôi. Một ví dụ về kênh thông báo là Email và bạn sẽ nhận được email trong trường hợp có Cảnh báo, v.v.

Bây giờ, chúng ta sẽ định cấu hình Kênh Thông báo qua Email và định cấu hình Kênh đó bằng địa chỉ email của chúng ta sao cho chúng ta có thể nhận được thông báo trong trường hợp có bất kỳ cảnh báo nào mà hệ thống của chúng tôi sẽ gửi và chúng ta sẽ định cấu hình thông báo nào.

Để tạo Kênh thông báo, hãy làm theo các bước sau:

Chuyển đến phần Giám sát → Cảnh báo trên trình đơn chính trong Google Cloud Console, như minh hoạ dưới đây:

9f87859064c63b63.pngs

Thao tác này sẽ hiển thị một trang có Cảnh báo, Chính sách và nhiều nội dung khác. Hiện tại, bạn sẽ thấy một đường liên kết có tiêu đề CHỈNH SỬA KÊNH THÔNG BÁO ở trên cùng. Hãy nhấp vào đó.

5ab54f42e6f7b99.pngS

Thao tác này sẽ hiển thị danh sách các Kênh thông báo như minh hoạ dưới đây:

cd89b1ca9e1de87c.png

Tìm phần Email và nhấp vào THÊM MỚI cho hàng đó. Thao tác này sẽ hiển thị chi tiết Cấu hình email như được hiển thị bên dưới:

d6ed98ffd0427fa3.png

Nhập địa chỉ email và Tên hiển thị của bạn như được hiển thị bên dưới. Nhấp vào LƯU.

Thao tác này sẽ hoàn tất quá trình tạo Kênh thông báo qua email. Hãy tiếp tục và định cấu hình kiểm tra thời gian hoạt động ngay bây giờ.

Tạo quy trình kiểm tra thời gian hoạt động

Chuyển đến phần Giám sát → Kiểm tra thời gian hoạt động trên trình đơn chính trong Google Cloud Console. Ở trên cùng, bạn sẽ thấy đường liên kết TẠO KIỂM TRA VỀ THỜI GIAN CẬP NHẬT. Hãy nhấp vào đó.

484541aec65e605e.png.

Thao tác này sẽ mở ra một loạt các bước mà bạn cần phải hoàn tất để định cấu hình tính năng kiểm tra thời gian hoạt động.

Bước đầu tiên là thiết lập Thông tin chi tiết về mục tiêu, tức là thông tin về dịch vụ Cloud Run mà chúng tôi đã triển khai. Biểu mẫu đã điền được hiển thị dưới đây:

4e2bb9fe022320f7.pngS

Bạn có thể chọn các giá trị khác nhau như sau:

  • Giao thức : HTTPS
  • Resource Type (Loại tài nguyên): Chọn Cloud Run Service (Dịch vụ Cloud Run). Hãy lưu ý các tài nguyên khác mà công cụ này hỗ trợ và bạn cũng có thể thiết lập các chế độ kiểm tra Thời gian hoạt động trên các tài nguyên đó.
  • Dịch vụ Cloud Run : Chọn my-inventory-api hoặc tên cụ thể mà bạn đặt cho dịch vụ Cloud Run.
  • Đường dẫn là /healthy, vì chúng ta đang trả về một chuỗi "All Izz Well" (Tất cả đường dẫn) và chúng ta muốn kiểm tra điều đó.

Nhấp vào TIẾP TỤC để chuyển sang bước tiếp theo. Bước tiếp theo là bước Xác thực phản hồi như sau:

a6011ac2ab3e0f10.png

Bạn có thể thấy rằng chúng tôi đang bật chế độ kiểm tra cho tiêu chí "Khớp nội dung" rồi thiết lập để phản hồi mà điểm cuối /lanhmanh trả về sẽ là "All Izz Well". Nhấp vào TIẾP TỤC để chuyển sang bước tiếp theo. Chúng ta sẽ định cấu hình Cảnh báo và kênh thông báo mà chúng tôi sẽ nhận được cảnh báo nếu quá trình kiểm tra Thời gian hoạt động không thành công.

d9738670efcb999f.png

Trong bước này, hãy đặt tên cho Cảnh báo. Tôi đã chọn hành động này là Lỗi Kiểm tra thời gian hoạt động của API Kho hàng, nhưng bạn có thể chọn tên của mình. Điều quan trọng ở đây là chọn đúng kênh thông báo trong danh sách mà bạn đã thiết lập trước đó.

Nhấp vào XEM XÉT để thực hiện bước cuối cùng để xem lại quy trình kiểm tra Thời gian hoạt động mà chúng tôi đã thiết lập.

Trong bước cuối cùng này, hãy đặt tên cho bước kiểm tra Thời gian hoạt động (ví dụ: Kiểm tra thời gian hoạt động của API Kho hàng), sau đó bạn cũng có thể kiểm tra xem bước kiểm tra đó có được định cấu hình chính xác hay không. Nhấp vào nút TEST.

80375bfab97fc313.pngS

Hãy tiếp tục và hoàn tất quy trình này (nhấp vào nút TẠO ở bên trái). Google Cloud sẽ hướng dẫn các đầu dò kiểm tra thời gian hoạt động được định cấu hình ở nhiều khu vực để ping URL và các phản hồi này sẽ được thu thập. Hãy truy cập vào mục Giám sát → Kiểm tra thời gian hoạt động sau vài phút và lý tưởng nhất là bạn sẽ thấy tất cả tín hiệu màu xanh lục cho biết rằng URL có thể truy cập được từ các đầu dò khác nhau.

df17555ddbee1127.png

Nếu bất kỳ đầu dò nào bị lỗi trong một khoảng thời gian (có thể định cấu hình), bạn sẽ nhận được một Thông báo cảnh báo trên kênh email mà chúng ta đã định cấu hình.

Thao tác này sẽ hoàn tất phần chúng tôi trình bày về cách thiết lập tính năng Kiểm tra thời gian hoạt động. Chính xác!

6. Trình khám phá chỉ số

Giải pháp Giám sát trên đám mây cho thấy hàng nghìn chỉ số tiêu chuẩn từ nhiều sản phẩm của Google Cloud. Những chỉ số này có sẵn để bạn kiểm tra, truy vấn, chuyển đổi sang Biểu đồ, thêm vào Trang tổng quan, gửi Cảnh báo và làm nhiều việc khác.

Mục tiêu của chúng ta trong phần này là:

  1. Hãy hiểu cách bạn có thể xem xét nhiều chỉ số, sau đó chúng tôi sẽ điều tra một chỉ số cụ thể (độ trễ) cho dịch vụ API của mình.
  2. Hãy chuyển chỉ số đó thành Biểu đồ và Trang tổng quan tuỳ chỉnh mà sau đó chúng tôi có thể sử dụng để trình bày trực quan chỉ số bất cứ lúc nào.

Tìm hiểu chỉ số về độ trễ cho dịch vụ API khoảng không quảng cáo

Chuyển đến mục Giám sát → Trình khám phá chỉ số trên trình đơn chính trong Google Cloud Console. Thao tác này sẽ đưa bạn đến màn hình Trình khám phá chỉ số. Nhấp vào CHỌN CHỈ SỐ. Giờ đây, bạn có thể điều hướng một số tài nguyên đang hoạt động đã được tạo chỉ số.

Do chúng tôi đang xử lý các dịch vụ Cloud Run, hãy nhấp vào Bản sửa đổi Cloud Run , sau đó nhấp vào danh mục và chỉ số cụ thể có tiêu đề Độ trễ của yêu cầu như minh hoạ dưới đây:

7609d8156c8f1384.pngS

Nhấp vào Áp dụng. Thao tác này sẽ hiển thị Độ trễ yêu cầu trong biểu đồ. Bạn có thể thay đổi Loại tiện ích thành Biểu đồ dạng đường từ cài đặt Hiển thị ở bên phải như được hiển thị dưới đây:

46086ac0a8eaf3d7.pngs

Thao tác này sẽ hiển thị Biểu đồ độ trễ như minh hoạ dưới đây:

ad97f749eeacaa95.png

Tạo biểu đồ và Trang tổng quan tuỳ chỉnh

Hãy tiếp tục và lưu Biểu đồ này. Nhấp vào Lưu biểu đồ rồi sử dụng các thông tin chi tiết như dưới đây:

35d1788d5f0cb3c4.pngs

Xin lưu ý rằng chúng tôi đang tạo một trang tổng quan mới thay vì lưu vào trang tổng quan hiện có. Nhấp vào nút LƯU. Thao tác này sẽ thêm trang tổng quan mới tạo vào danh sách các trang tổng quan như sau:

c9cdcd63d5823abd.png

Hãy nhấp vào trang tổng quan mà chúng tôi đã tạo để xem thông tin chi tiết.

27354d8310d8a2d7.pngS

Đến đây, bạn sẽ hoàn thành phần tìm hiểu các chỉ số khác nhau thông qua Trình khám phá chỉ số và cách tạo trang tổng quan tuỳ chỉnh.

7. Cloud Logging

Trong phần này, chúng ta sẽ tìm hiểu về tính năng Ghi nhật ký trên đám mây. Cloud Logging đi kèm với giao diện Logs Explorer (Trình khám phá nhật ký) giúp bạn điều hướng và tìm hiểu sâu hơn về nhật ký do nhiều dịch vụ của Google và ứng dụng của riêng bạn tạo ra.

Trong phần này, chúng ta sẽ tìm hiểu về Trình khám phá nhật ký và mô phỏng một số thông điệp nhật ký mà sau đó chúng ta có thể tìm kiếm và chuyển đổi thành các chỉ số thông qua tính năng có tên là Chỉ số dựa trên nhật ký.

Trình khám phá nhật ký

Bạn có thể truy cập vào Trình khám phá nhật ký thông qua tính năng Logging →Logs Explorer (Trình khám phá nhật ký) trong bảng điều khiển chính của Google trên đám mây như minh hoạ dưới đây:

df05f5b33fd5695a.png

Thao tác này sẽ hiển thị giao diện nhật ký để bạn có thể chọn/bỏ chọn cụ thể nhiều Tài nguyên (Dự án, Tài nguyên trên Google Cloud, tên dịch vụ, v.v.) cùng với Cấp độ nhật ký để lọc thông điệp nhật ký khi cần.

e7fa15bcf73f3805.png

Ở trên là danh sách nhật ký cho Bản sửa đổi Cloud Run, tức là các dịch vụ Cloud Run mà chúng tôi đã triển khai. Bạn sẽ thấy một số yêu cầu là Kiểm tra thời gian hoạt động nhấn vào điểm cuối /healthy mà chúng ta đã định cấu hình.

Tìm cảnh báo

Mô phỏng một vài yêu cầu không hợp lệ đến Dịch vụ kho hàng bằng cách cung cấp các mã sản phẩm không phải là I-1, I-2 và I-3. Ví dụ: yêu cầu không chính xác là:

https://&lt;SERVICE_URL&gt;/inventory/I-999

Bây giờ, chúng ta sẽ tìm kiếm tất cả các CẢNH BÁO do API của chúng tôi tạo ra khi một Mã sản phẩm cung cấp không chính xác trong Truy vấn.

Trong Hộp truy vấn, hãy chèn các tham số truy vấn sau:

resource.type=&quot;cloud_run_revision&quot;

textPayload =~ "Đã nhận được yêu cầu kho hàng cho mã sản phẩm không chính xác"

Hàm này có dạng như sau:

b3ee512a0c9c5c7b.png

Nhấp vào Run Query (Chạy truy vấn). Sau đó, hệ thống sẽ hiển thị tất cả yêu cầu đã nhận được và những yêu cầu có vấn đề này.

5fdbd7c23bf4694f.png.

Chỉ số dựa trên nhật ký

Hãy tạo Chỉ số nhật ký tuỳ chỉnh để theo dõi các lỗi này. Chúng tôi muốn biết có phải có một số lượng lớn cuộc gọi xảy ra với Mã sản phẩm không chính xác hay không.

Để chuyển đổi ở trên thành chỉ số lỗi, hãy nhấp vào nút Tạo chỉ số mà bạn thấy trong Trình khám phá nhật ký.

fa9a5e04922aa412.png

Thao tác này sẽ mở biểu mẫu để tạo định nghĩa về chỉ số. Sử dụng Chỉ số bộ đếm và nhập thông tin chi tiết cho Tên chỉ số (inventory_lookup_errors) và Nội dung mô tả như bên dưới, rồi nhấp vào Tạo chỉ số.

70b5719b472d4d02.pngS

Thao tác này sẽ tạo chỉ số bộ đếm và bạn sẽ thấy thông báo như sau:

ab9058028185e4d5.png

Hãy truy cập mục Ghi nhật ký → Chỉ số dựa trên nhật ký từ trình đơn chính và bạn sẽ thấy chỉ số tuỳ chỉnh mà chúng ta đã xác định trong danh sách chỉ số do người dùng xác định như bên dưới:

7d186e90559cf8e1.png.

Ở cuối mục này, bạn sẽ thấy ba dấu chấm dọc, hãy nhấp vào đó để xem các thao tác mà bạn có thể thực hiện đối với chỉ số tuỳ chỉnh này. Danh sách này sẽ tương tự như danh sách mà bạn đang thấy bên dưới. Nhấp vào lựa chọn Xem trong Trình khám phá chỉ số.

7586f0789a0bdb41.pngS

Thao tác này sẽ đưa chúng ta đến Trình khám phá chỉ số mà chúng ta đã tìm hiểu trong phần trước, ngoại trừ việc công cụ này hiện đã được điền sẵn cho chúng ta.

7ee7403d0639ce25.pngS

Nhấp vào Lưu biểu đồ. Sử dụng các giá trị sau cho tuỳ chọn Lưu biểu đồ:

9009da45f76eb4c5.pngS

Bây giờ, thao tác này sẽ tạo một Trang tổng quan mới mà bạn có thể thấy lỗi Tìm kiếm khoảng không quảng cáo và trang này sẽ xuất hiện trong danh sách Trang tổng quan.

201ed66957cb64f9.pngS

Tuyệt vời! Bạn hiện đã tạo chỉ số tuỳ chỉnh từ các nhật ký của mình và chuyển đổi chỉ số đó thành biểu đồ có trong trang tổng quan tuỳ chỉnh. Việc này sẽ giúp chúng tôi theo dõi số cuộc gọi sử dụng mã sản phẩm không chính xác.

8. Chính sách về thông báo

Trong phần này, chúng tôi sẽ sử dụng chỉ số tùy chỉnh mà chúng tôi đã tạo và theo dõi dữ liệu của chỉ số đó cho một ngưỡng nhất định, tức là nếu số lượng lỗi vượt quá ngưỡng nhất định, chúng tôi sẽ đưa ra cảnh báo. Nói cách khác, chúng ta sẽ thiết lập một chính sách cảnh báo.

Tạo một chính sách thông báo

Chúng ta hãy đến Trang tổng quan về tìm kiếm khoảng không quảng cáo. Thao tác này sẽ hiển thị biểu đồ mà chúng ta đã tạo để ghi chú Lỗi tra cứu kho hàng như được hiển thị bên dưới:

3591a1dd91a8b9fd.png.

Thao tác này sẽ hiển thị dữ liệu chỉ số hiện tại. Trước tiên, hãy chỉnh sửa chỉ số như bên dưới (Nhấp vào nút Chỉnh sửa):

5e76fc20d8387984.pngS

Thao tác này sẽ hiển thị thông tin chi tiết về chỉ số. Chúng ta sẽ chuyển đổi biểu đồ từ thể hiện tỷ lệ lỗi thành tổng, tức là số lượng lỗi. Trường cần thay đổi được hiển thị bên dưới:

65ccd1eaca607831.pngS

Nhấp vào ÁP DỤNG ở góc trên cùng bên phải để trở lại màn hình Chỉ số. Lần này, chúng ta có thể xem tổng số lỗi trong khoảng thời gian căn chỉnh so với tỷ lệ lỗi.

Chúng tôi sẽ tạo một Chính sách cảnh báo có thể thông báo cho chúng tôi trong trường hợp số lỗi vượt quá ngưỡng. Nhấp vào 3 dấu chấm ở góc trên cùng bên phải của biểu đồ. Trong danh sách các lựa chọn như minh hoạ ở trên, hãy nhấp vào Chuyển đổi thành biểu đồ cảnh báo.

cc9eec48b9bfbc92.png

Bạn sẽ thấy một màn hình như sau:

6202ad1e88679a78.pngS

Nhấp vào Tiếp theo , thao tác này sẽ mở ra một giá trị Ngưỡng mà chúng ta có thể đặt. Ngưỡng mẫu mà chúng tôi đã tiếp nhận ở đây là 5 , nhưng bạn có thể chọn theo ý mình.

734f809cc802ab78.pngS

Nhấp vào TIẾP THEO để hiển thị biểu mẫu Thông báo

f2d84fb85c2520cb.png

Chúng ta đã chọn Kênh thông báo làm kênh Email mà chúng ta đã tạo trước đó. Bạn có thể điền các thông tin chi tiết khác như Tài liệu (thông tin này sẽ được cung cấp trong phần Cảnh báo được đưa ra). Nhấp vào TIẾP THEO để xem bản tóm tắt và hoàn tất quy trình.

c670b29da70c4655.png

Sau khi bạn tạo Chính sách thông báo này, chính sách sẽ hiển thị trong danh sách Chính sách thông báo như được hiển thị bên dưới. Bạn có thể xem danh sách các Chính sách cảnh báo bằng cách chuyển đến phần Giám sát → Cảnh báo. Quét mục Chính sách trên trang này để xem danh sách các chính sách mà chúng tôi đã thiết lập tính đến thời điểm hiện tại.

154da627959c54f3.pngS

Tuyệt vời! Hiện tại, bạn đã định cấu hình một Chính sách cảnh báo tuỳ chỉnh. Chính sách này sẽ thông báo cho bạn trong trường hợp tỷ lệ lỗi gia tăng khi tra cứu Inventory API.

9. Giám sát dịch vụ (Không bắt buộc)

Trong phần này, chúng ta sẽ thiết lập SLI/SLO cho các dịch vụ của mình theo các nguyên tắc của Kỹ thuật đảm bảo độ tin cậy cho trang web (SRE). Bạn sẽ nhận thấy rằng giải pháp Giám sát trên đám mây giúp bạn dễ dàng hơn bằng cách tự động khám phá những dịch vụ mà bạn đã triển khai trong Cloud Run và có thể tự động tính toán các SLI chính như Khả năng sử dụng, Độ trễ cùng với các phép tính Ngân sách lỗi.

Hãy tiếp tục và thiết lập Latency SLO (Độ trễ) cho Dịch vụ API của chúng ta.

Thiết lập SLO về độ trễ cho Dịch vụ kho hàng

Nhấp vào Giám sát → Dịch vụ trên trình đơn chính trong Cloud Console. Thao tác này sẽ hiển thị danh sách dịch vụ đã được định cấu hình để Giám sát dịch vụ.

Hiện tại, chúng tôi không có dịch vụ nào được thiết lập cho tính năng Giám sát SLI/SLO, nên danh sách này đang trống. Nhấp vào đường liên kết XÁC ĐỊNH DỊCH VỤ ở trên cùng để xác định / xác định một dịch vụ trước tiên.

42d14515a481213.pngS

Thao tác này sẽ tự động phát hiện những dịch vụ phù hợp với chức năng Giám sát SLO. Dịch vụ này có thể khám phá các dịch vụ Cloud Run, do đó, dịch vụ API Inventory được triển khai cho Cloud Run sẽ xuất hiện trong danh sách.

522aaba719f85c54.pngS

Tên hiển thị mà bạn thấy có thể khác và sẽ tuỳ thuộc vào lựa chọn của bạn tại thời điểm triển khai dịch vụ lên Cloud Run. Nhấp vào nút GỬI. Thao tác này sẽ mở màn hình dưới đây:

eca08010ab6858a9.png

Bạn có thể nhấp vào TẠO SLO. Thao tác này hiện sẽ cho phép bạn chọn trong số các SLI được tính toán tự động cho bạn.

556e49b10d22e5ac.png.

Chúng tôi chọn Độ trễ SLI làm điểm bắt đầu. Nhấp vào TIẾP TỤC. Tiếp theo, bạn sẽ thấy một màn hình cho thấy hiệu suất hiện tại của dịch vụ này và độ trễ thông thường.

a9cc6f6778c13b52.png

Chúng ta đưa vào một giá trị cho Ngưỡng, tức là 300 mili giây, đây là những gì chúng ta muốn đạt được. Bạn có thể chọn một giá trị khác nếu muốn, nhưng xin lưu ý rằng giá trị đó sẽ ảnh hưởng đến hạn mức lỗi mà bạn xác định tương ứng. Nhấp vào TIẾP TỤC.

Bây giờ, chúng ta sẽ đặt SLO (cửa sổ Mục tiêu và Đo lường) như sau:

e1fc336d4191c08e.png

Điều này có nghĩa là chúng ta sẽ chọn Cửa sổ đo lường làm cửa sổ loại Cuộn và đo lường trong 7 ngày. Tương tự, đối với mục tiêu này, chúng tôi đã chọn mục tiêu là 90%. Điều chúng tôi đang cố gắng nói ở đây là 90% yêu cầu đến dịch vụ API phải hoàn tất trong vòng 300 mili giây và điều này phải được đo lường trong 7 ngày.

Nhấp vào Tiếp tục. Thao tác này sẽ mở ra màn hình tóm tắt. Bạn có thể xác nhận màn hình này bằng cách nhấp vào nút UPDATE SLO (CẬP NHẬT SLO).

f2540173d9f4a4b7.png

Thao tác này sẽ lưu định nghĩa SLO và tự động tính hạn mức lỗi cho bạn.

76393df0e189104.pngS

Một số việc mà bạn có thể thử:

  1. Thực hiện API qua nhiều lệnh gọi và xem hiệu suất của dịch vụ cũng như mức độ ảnh hưởng của dịch vụ đến Hạn mức lỗi còn lại.
  2. Sửa đổi mã nguồn để tạo độ trễ bổ sung (ngủ) ngẫu nhiên trong một số lệnh gọi. Việc này sẽ làm tăng độ trễ cho một số lệnh gọi và ảnh hưởng xấu đến Hạn mức lỗi.

10. Xin chúc mừng

Xin chúc mừng! Bạn đã triển khai thành công một ứng dụng mẫu cho Google Cloud và tìm hiểu cách sử dụng Google Cloud Operations Suite để giám sát tình trạng của ứng dụng!

Nội dung đã đề cập

  • Triển khai một dịch vụ cho Google Cloud Run.
  • Thiết lập Trang tổng quan cho dịch vụ Google Cloud Run.
  • Kiểm tra thời gian hoạt động.
  • Thiết lập chỉ số nhật ký tuỳ chỉnh và Trang tổng quan/Biểu đồ dựa trên đó.
  • Khám phá Trình khám phá chỉ số và thiết lập Trang tổng quan/Biểu đồ.
  • Thiết lập chính sách thông báo.
  • Thiết lập SLI/SLO để giám sát dịch vụ trong Google Cloud.

Lưu ý: Nếu bạn đã thực hiện lớp học lập trình này bằng tài khoản của chính mình và bằng dự án Google Cloud, thì các tài nguyên đã phân bổ có thể sẽ tiếp tục bị tính phí. Vì vậy, hãy xoá Dự án và các tài nguyên sau khi bạn hoàn tất phòng thí nghiệm.

Tiếp theo là gì?

Hãy xem Nhiệm vụ nâng cao kỹ năng đám mây này để tìm hiểu thêm về Bộ công cụ vận hành của Google Cloud.

Tài liệu đọc thêm