Giới thiệu về Bộ công cụ vận hành của Cloud

1. Giới thiệu

Lần cập nhật gần đây nhất: 28/7/2023

Bộ công cụ vận hành của Google Cloud là gì?

Google Cloud Operations Suite là một nền tảng mà bạn có thể dùng để giám sát, khắc phục sự cố và cải thiện hiệu suất của ứng dụng trên môi trường Google Cloud. Các thành phần chính của Bộ công cụ vận hành đám mây bao gồm Giám sát trên đám mây, Ghi nhật ký trên đám mây và Theo dõi đám mây.

Hãy xem video này để biết thông tin tổng quan về Nhóm vận hành Google Cloud.

Sản phẩm bạn sẽ tạo ra

Trong lớp học lập trình này, bạn sẽ triển khai một API mẫu trên Google Cloud. Sau đó, bạn sẽ khám phá và định cấu hình nhiều tính năng trong Cloud Monitoring so với API.

Kiến thức bạn sẽ học được

  • Sử dụng Cloud Shell của Google Cloud để triển khai một ứng dụng mẫu cho Cloud Run.
  • Sử dụng các tính năng của Google Cloud Monitoring như Trang tổng quan, Cảnh báo, Kiểm tra thời gian hoạt động, Giám sát SLI/SLO, v.v.

Bạn cần có

  • Phiên bản Chrome mới nhất (74 trở lên)
  • Tài khoản Google Cloud và Dự án Google Cloud

2. Thiết lập và yêu cầu

Thiết lập môi trường theo tiến độ riêng

Nếu chưa có Tài khoản Google (Gmail hoặc Google Apps), bạn phải tạo một tài khoản. Đăng nhập vào bảng điều khiển Google Cloud Platform ( console.cloud.google.com) và tạo một dự án mới.

b35bf95b8bf3d5d8.png

a99b7ace416376c4.png

c20a9642aaa18d11.png

  • Tên dự án là tên hiển thị của những người tham gia dự án này. Đây là một chuỗi ký tự không được API của Google sử dụng. Bạn có thể cập nhật thông tin này bất cứ lúc nào.
  • Mã dự án phải là duy nhất trên tất cả các dự án Google Cloud và không thể thay đổi được (không thể thay đổi sau khi đặt). Cloud Console sẽ tự động tạo một chuỗi duy nhất; thường thì bạn không cần quan tâm đến chuỗi này. Trong hầu hết các lớp học lập trình, bạn sẽ cần tham chiếu đến Mã dự án (thường được xác định là PROJECT_ID). Nếu không thích mã đã tạo, bạn có thể tạo một mã nhận dạng ngẫu nhiên khác. Ngoài ra, bạn có thể thử phương pháp của riêng mình và xem có được cung cấp hay không. Bạn không thể thay đổi thông tin này sau bước này và thông tin này sẽ được giữ nguyên trong suốt thời gian thực hiện dự án.
  • Cho bạn biết, có giá trị thứ ba, Số dự án mà một số API sử dụng. Tìm hiểu thêm về cả ba giá trị này trong tài liệu.

Cảnh báo: Mã dự án phải là mã duy nhất trên toàn cầu và không ai khác có thể sử dụng mã này sau khi bạn chọn. Bạn là người dùng duy nhất của mã đó. Ngay cả khi dự án bị xoá, bạn cũng không thể dùng lại mã này

  1. Tiếp theo, bạn cần bật tính năng thanh toán trong Cloud Console để sử dụng các tài nguyên/API trên Cloud. Việc tham gia lớp học lập trình này sẽ không tốn kém nhiều chi phí, nếu có. Để tắt các tài nguyên nhằm tránh bị tính phí ngoài hướng dẫn này, bạn có thể xoá các tài nguyên bạn đã tạo hoặc xoá toàn bộ dự án. Người dùng mới của Google Cloud đủ điều kiện tham gia chương trình Dùng thử miễn phí 300 USD.

Thiết lập Google Cloud Shell

Mặc dù bạn có thể điều khiển Google Cloud và Google Cloud Trace từ xa trên máy tính xách tay, nhưng trong lớp học lập trình này, chúng ta sẽ sử dụng Google Cloud Shell, một môi trường dòng lệnh chạy trên đám mây.

Để kích hoạt Cloud Shell từ Cloud Console, bạn chỉ cần nhấp vào Kích hoạt Cloud Shell (chỉ mất vài phút để cấp phép và kết nối với môi trường).

30c26f30d17b3d46.pngS

Nếu chưa từng khởi động Cloud Shell, bạn sẽ thấy một màn hình trung gian (dưới màn hình đầu tiên) mô tả về Cloud Shell. Nếu vậy, hãy nhấp vào Tiếp tục (và bạn sẽ không bao giờ thấy màn hình này nữa). Dưới đây là giao diện một lần đó:

9c92662c6a846a5c.pngS

Quá trình cấp phép và kết nối với Cloud Shell chỉ mất vài phút.

9f0e51b578fecce5.png

Máy ảo này được tải sẵn tất cả các công cụ phát triển mà bạn cần. Ứng dụng này cung cấp một thư mục gốc 5 GB ổn định và chạy trong Google Cloud, giúp cải thiện đáng kể hiệu suất mạng và xác thực. Bạn có thể thực hiện hầu hết (nếu không phải tất cả) công việc trong lớp học lập trình này chỉ bằng một trình duyệt hoặc Chromebook.

Sau khi kết nối với Cloud Shell, bạn sẽ thấy mình đã được xác thực và dự án đã được đặt thành mã dự án của bạn.

Chạy lệnh sau trong Cloud Shell để xác nhận rằng bạn đã được xác thực:

Sau khi kết nối với Cloud Shell, bạn sẽ thấy mình đã được xác thực và dự án đã được đặt thành PROJECT_ID.

gcloud auth list

Kết quả của lệnh

Credentialed accounts:
 - <myaccount>@<mydomain>.com (active)
gcloud config list project

Kết quả của lệnh

[core]
project = <PROJECT_ID>

Nếu vì lý do nào đó mà dự án không được đặt, bạn chỉ cần đưa ra lệnh sau:

gcloud config set project <PROJECT_ID>

Theo mặc định, Cloud Shell cũng đặt một số biến môi trường. Các biến này có thể hữu ích khi bạn chạy các lệnh trong tương lai.

echo $GOOGLE_CLOUD_PROJECT

Kết quả của lệnh

<PROJECT_ID>

Ứng dụng mẫu

Chúng tôi đã đặt mọi thứ bạn cần cho dự án này vào Git repo. Kho lưu trữ này chứa một số ứng dụng mẫu và bạn có thể chọn sử dụng bất kỳ ứng dụng nào trong số đó cho bài tập này.

Đường liên kết đến kho lưu trữ Git: https://github.com/rominirani/cloud-code-sample-repository

3. Triển khai ứng dụng API

Ứng dụng hoặc API mẫu nói về gì?

Ứng dụng của chúng ta là một ứng dụng Inventory API (API kiểm kho) đơn giản, hiển thị một Điểm cuối API REST với một số thao tác để liệt kê các mặt hàng trong kho và lấy số lượng mặt hàng cụ thể trong kho.

Sau khi triển khai API và giả sử API được lưu trữ tại https://<somehost>, chúng ta có thể truy cập vào các điểm cuối API như sau:

  • https://&lt;somehost&gt;/inventory

Thao tác này sẽ liệt kê tất cả các mặt hàng sản phẩm cùng với mức tồn kho hiện có.

  • https://&lt;somehost&gt;/inventory/{productid}

Thao tác này sẽ cung cấp một bản ghi duy nhất có mã sản phẩm và mức tồn kho hiện có cho sản phẩm đó.

Dữ liệu phản hồi được trả về có định dạng JSON.

Yêu cầu/Phản hồi mẫu và dữ liệu mẫu

Ứng dụng không được cung cấp bởi cơ sở dữ liệu ở phần phụ trợ để đơn giản hoá mọi thứ. Tệp này chứa 3 mã sản phẩm mẫu và mức tồn kho hiện có của các sản phẩm đó.

Mã sản phẩm

Mức tồn kho

I-1

10

I-2

20

I-3

30

Yêu cầu và phản hồi API mẫu được hiển thị bên dưới:

Yêu cầu API

Phản hồi API

https://<somehost>/inventory

[ { "I-1": 10, "I-2": 20, "I-3": 30 }]

https://<somehost>/inventory/I-1

{ "productid": "I-1", "qty": 10}

https://<somehost>/inventory/I-2

{ &quot;productid&quot;: &quot;I-2&quot;, &quot;qty&quot;: 20}

https://<somehost>/inventory/I-200

{ "productid": I-200, "qty": -1}

Sao chép kho lưu trữ

Mặc dù có thể điều khiển Google Cloud từ xa trên máy tính xách tay, nhưng trong lớp học lập trình này, bạn sẽ sử dụng Google Cloud Shell, một môi trường dòng lệnh chạy trên đám mây.

Trên Bảng điều khiển GCP, hãy nhấp vào biểu tượng Cloud Shell trên thanh công cụ trên cùng bên phải:

bce75f34b2c53987.png

Quá trình cấp phép và kết nối với môi trường chỉ mất vài phút. Khi quá trình này hoàn tất, bạn sẽ thấy như sau:

f6ef2b5f13479f3a.png

Máy ảo này được tải sẵn tất cả các công cụ phát triển mà bạn cần. Ứng dụng này cung cấp một thư mục gốc 5 GB ổn định và chạy trên Google Cloud, giúp nâng cao đáng kể hiệu suất mạng và xác thực. Bạn có thể thực hiện tất cả công việc trong phòng thí nghiệm này chỉ bằng một trình duyệt.

Thiết lập gcloud

Trong Cloud Shell, hãy đặt mã dự án và lưu mã này dưới dạng biến PROJECT_ID.

PROJECT_ID=[YOUR-PROJECT-ID]
gcloud config set project $PROJECT_ID

Bây giờ, hãy thực thi lệnh sau:

$ git clone https://github.com/rominirani/cloud-code-sample-repository.git 

Thao tác này sẽ tạo một thư mục có tên cloud-code-sample-repository trong thư mục này.

(Không bắt buộc) Chạy ứng dụng trên Cloud Shell

Bạn có thể chạy ứng dụng cục bộ bằng cách làm theo các bước sau:

  1. Trên cửa sổ dòng lệnh, hãy chuyển đến phiên bản Python của API thông qua lệnh sau:
$ cd cloud-code-sample-repository
$ cd python-flask-api
  1. Trong cửa sổ dòng lệnh, hãy nhập lệnh sau (Tại thời điểm viết, Cloud Shell đã cài đặt Python 3.9.x và chúng ta sẽ sử dụng phiên bản mặc định. Nếu dự định chạy ứng dụng này trên máy tính xách tay, bạn có thể sử dụng Python 3.8 trở lên:
$ python app.py
  1. Bạn có thể chạy lệnh sau để khởi động Máy chủ Python cục bộ.

26570f586acaeacf.png

  1. Thao tác này sẽ khởi động một máy chủ trên cổng 8080 và bạn có thể kiểm thử cục bộ thông qua tính năng Web Preview (Bản xem trước trên web) của Cloud Shell. Nhấp vào nút Xem trước trên web như minh hoạ bên dưới:

675d9b3097a6209c.png.

Nhấp vào Xem trước trên cổng 8080.

  1. Thao tác này sẽ mở một cửa sổ trình duyệt. Bạn sẽ thấy Lỗi 404 và đó là điều bình thường. Sửa đổi URL và thay đổi thành chỉ có /inventory sau tên máy chủ.

Ví dụ: trên máy của tôi, nó có dạng như sau:

https://8080-cs-557561579860-default.cs-asia-southeast1-yelo.cloudshell.dev/inventory

Thao tác này sẽ hiển thị danh sách các mặt hàng tồn kho như đã giải thích trước đó:

ef6afb0184c58870.png

  1. Bạn có thể dừng máy chủ ngay bằng cách chuyển đến Dòng lệnh và nhấn tổ hợp phím Ctrl-C

Triển khai ứng dụng

Bây giờ, chúng ta sẽ triển khai ứng dụng API này lên Cloud Run. Quy trình này liên quan đến việc sử dụng ứng dụng dòng lệnh glcoud để chạy lệnh triển khai mã cho Cloud Run.

Trên cửa sổ dòng lệnh, hãy dùng lệnh gcloud sau:

$ gcloud run deploy --source .

Bạn sẽ được hỏi nhiều câu hỏi (nếu được yêu cầu uỷ quyền, vui lòng tiếp tục) và một số điểm được đề cập bên dưới. Bạn có thể nhận được hoặc không nhận được tất cả các câu hỏi, tuỳ thuộc vào cấu hình và việc bạn đã bật các API cụ thể trong dự án Google Cloud hay chưa.

  1. Tên dịch vụ (python-flask-api): Dùng giá trị mặc định này hoặc chọn tên như my-inventory-api
  2. API [run.googleapis.com] chưa được bật trên dự án [project-number]. Bạn có muốn bật rồi thử lại không (việc này sẽ mất vài phút)? (có/không)? Có
  3. Vui lòng chỉ định một khu vực: Chọn một khu vực mà bạn muốn bằng cách cung cấp số.
  4. API [artifactregistry.googleapis.com] chưa được bật trên dự án [project-number]. Bạn có muốn bật rồi thử lại không (việc này sẽ mất vài phút)? (có/không)? Có
  5. Để triển khai từ nguồn, bạn cần có kho lưu trữ Docker của Artifact Registry để lưu trữ các vùng chứa đã tạo. Một kho lưu trữ có tên [cloud-run-source-deploy] tại khu vực [us-west1] sẽ được tạo.

Bạn có muốn tiếp tục (Y/n)? Có

  1. Cho phép các lệnh gọi chưa được xác thực tới [my-inventory-api] (y/N)? Có

Cuối cùng, thao tác này sẽ bắt đầu quy trình lấy mã nguồn, đóng gói mã nguồn, đẩy mã nguồn đó vào Cấu phần lưu trữ cấu phần phần mềm, sau đó triển khai dịch vụ Cloud Run + bản sửa đổi. Bạn nên kiên nhẫn thông qua quá trình này (có thể mất 3-4 phút) và bạn sẽ thấy quá trình được hoàn tất với URL dịch vụ được hiển thị cho bạn.

Dưới đây là một lần chạy mẫu:

7516696ea5b3004b.png

Kiểm thử ứng dụng

Hiện tại, chúng ta đã triển khai ứng dụng lên Cloud Run, bạn có thể truy cập vào ứng dụng API như sau:

  1. Ghi lại URL dịch vụ từ bước trước. Ví dụ: trên thiết lập của tôi, giá trị này hiển thị dưới dạng https://my-inventory-api-bt2r5243dq-uw.a.run.app. Hãy gọi URL này là <SERVICE_URL>.
  2. Mở trình duyệt và truy cập vào 3 URL sau đây cho các điểm cuối API:
  3. <SERVICE_URL>/inventory
  4. <SERVICE_URL>/inventory/I-1
  5. <SERVICE_URL>/inventory/I-100

Yêu cầu này phải tuân theo thông số kỹ thuật mà chúng tôi đã cung cấp trong phần trước với Yêu cầu và Phản hồi API mẫu.

Lấy thông tin chi tiết về dịch vụ từ Cloud Run

Chúng tôi đã triển khai Dịch vụ API của mình trên Cloud Run, một môi trường điện toán không máy chủ. Chúng ta có thể truy cập vào dịch vụ Cloud Run thông qua Google Cloud Console bất cứ lúc nào.

Trên trình đơn chính, hãy chuyển đến Cloud Run. Thao tác này sẽ hiển thị danh sách các dịch vụ mà bạn đang chạy trong Cloud Run. Bạn sẽ thấy dịch vụ mà mình vừa triển khai. Tuỳ thuộc vào tên mà bạn chọn, bạn sẽ thấy nội dung như sau:

10d2c363241d789c.png.

Nhấp vào tên Dịch vụ để xem thông tin chi tiết. Thông tin chi tiết về mẫu được trình bày bên dưới:

1ec2c9e45ff1a2db.png

Hãy lưu ý đến URL, đó không gì khác ngoài URL dịch vụ mà bạn có thể nhập vào trình duyệt và truy cập vào API Inventory (Kiểm kho) mà chúng ta vừa triển khai. Bạn có thể xem Chỉ số và các thông tin chi tiết khác.

Hãy bắt đầu ngay với Google Cloud Operations Suite.

4. Thiết lập trang tổng quan

Một trong những tính năng tiện lợi mà giải pháp Giám sát trên đám mây cung cấp là trang tổng quan bên ngoài (OOTB) cho nhiều tài nguyên trong Google Cloud. Nhờ đó, bạn có thể thiết lập ban đầu cho Trang tổng quan với các chỉ số chuẩn. Quy trình nhanh chóng và thuận tiện.

Hãy cùng xem cách thực hiện việc đó cho Dịch vụ API mà chúng tôi vừa triển khai cho Cloud Run.

Trang tổng quan tuỳ chỉnh cho Dịch vụ của chúng tôi

Vì chúng ta đã triển khai dịch vụ API cho Cloud Run, hãy cùng tìm hiểu cách thiết lập Trang tổng quan có thể giúp trực quan hoá nhiều chỉ số, một số chỉ số trong đó có độ trễ của dịch vụ.

Trước tiên, trên bảng điều khiển, hãy chuyển đến phần Giám sát → Tổng quan như minh hoạ dưới đây:

c51a5dda4ab72bbf.png

Trang Tổng quan cho thấy nhiều thông tin mà bạn đã định cấu hình trong phần Theo dõi, chẳng hạn như Trang tổng quan, Cảnh báo, Kiểm tra thời gian hoạt động, v.v.

2758f61f1e7f1dca.png

Hiện tại, hãy nhấp vào Trang tổng quan trong trình đơn chính ở bên. Thao tác này sẽ đưa chúng ta đến màn hình sau:

c9110b6f065100da.png

Nhấp vào THƯ VIỆN MẪU . Thao tác này sẽ hiển thị danh sách các Bảng điều khiển sẵn có (OOTB) có trong Google Cloud, trên nhiều tài nguyên. Cụ thể, hãy di chuyển xuống danh sách rồi chọn Google Cloud Run như minh hoạ bên dưới.

ddac4038d4fa91ae.png

Thao tác này sẽ hiển thị danh sách các trang tổng quan tiêu chuẩn có sẵn cho Google Cloud Run. Chúng tôi quan tâm đến điều đó vì đã triển khai dịch vụ của mình trên Cloud Run.

Bạn sẽ thấy một Trang tổng quan dành cho giải pháp Giám sát chạy trên đám mây. Nhấp vào đường liên kết XEM TRƯỚC để xem danh sách các biểu đồ (chỉ số) chuẩn có sẵn cho tính năng Giám sát Cloud Run. Chỉ cần nhấp vào NHẬP TRANG TỔNG QUAN MẪU để nhập tất cả các biểu đồ này vào một trang tổng quan tuỳ chỉnh. Thao tác này sẽ hiển thị màn hình Trang tổng quan có tên được điền sẵn như bên dưới:

531cb8434b18193a.png

Bạn có thể quay lại bằng cách nhấp vào Mũi tên trái nằm ở bên trái của tên Trang tổng quan, ngay trên cùng bên trái. Thao tác này sẽ chuyển bạn đến danh sách Trang tổng quan, trong đó bạn có thể thấy Trang tổng quan mới mà bạn vừa tạo.

Nhấp vào đường liên kết Trang tổng quan đó để theo dõi nhiều chỉ số có sẵn. Các chỉ số này bao gồm Độ trễ, Số yêu cầu, Chỉ số vùng chứa và nhiều chỉ số khác.

Bạn cũng có thể chọn đánh dấu bất kỳ Trang tổng quan nào là mục yêu thích, đơn giản bằng cách chọn biểu tượng dấu sao như minh hoạ dưới đây:

fc993d1a17415550.png

Thao tác này sẽ thêm Trang tổng quan vào màn hình Tổng quan của tính năng Theo dõi. Đây là cách dễ dàng để chuyển đến các trang tổng quan thường dùng.

2e8f66e2652c55c5.png

1e1dffb5239ab110.png

Tuyệt vời! Bạn vừa thêm một Trang tổng quan tuỳ chỉnh để theo dõi các dịch vụ Cloud Run. Bạn đã làm rất tốt!

5. Kiểm tra thời gian hoạt động

Trong phần này, chúng ta sẽ thiết lập tính năng kiểm tra thời gian hoạt động cho Dịch vụ API mà chúng ta đã triển khai. Việc kiểm tra thời gian hoạt động công khai có thể đưa ra yêu cầu từ nhiều vị trí trên khắp thế giới đến các URL hoặc tài nguyên công khai trên Google Cloud để xem tài nguyên có phản hồi hay không.

Tài nguyên trong trường hợp này sẽ là Dịch vụ API mà chúng ta đã triển khai cho Cloud Run. URL sẽ là một điểm cuối cụ thể mà Dịch vụ API hiển thị để cho biết trạng thái của dịch vụ.

Trong mã dịch vụ API mẫu, chúng tôi đã hiển thị một điểm cuối /healthy trả về giá trị chuỗi "All Izz Well". Vì vậy, tất cả những gì chúng ta cần làm là xác định một quy trình kiểm tra thời gian hoạt động truy cập vào một URL như https://<SERVICE_URL>/healthy và kiểm tra xem chuỗi "All Izz Well" có được trả về hay không.

Tạo kênh thông báo

Trước khi chúng ta tạo quy trình kiểm tra thời gian hoạt động, điều quan trọng là bạn phải định cấu hình kênh thông báo. Kênh thông báo là phương tiện mà bạn sẽ nhận được thông báo nếu có sự cố/vấn đề với bất kỳ tài nguyên nào mà chúng tôi theo dõi. Ví dụ về kênh thông báo là Email và bạn sẽ nhận được email trong trường hợp có Cảnh báo, v.v.

Hiện tại, chúng ta sẽ định cấu hình một Kênh thông báo qua email và định cấu hình kênh đó bằng địa chỉ email của chúng ta để có thể nhận thông báo trong trường hợp có bất kỳ cảnh báo nào mà hệ thống của chúng ta sẽ đưa ra và chúng ta sẽ định cấu hình.

Để tạo Kênh thông báo, hãy làm theo các bước sau:

Chuyển đến phần Giám sát → Cảnh báo trên trình đơn chính trong Google Cloud Console, như minh hoạ dưới đây:

9f87859064c63b63.png

Thao tác này sẽ hiển thị một trang có các mục Cảnh báo, Chính sách và nhiều mục khác. Hiện tại, bạn sẽ thấy một đường liên kết có tiêu đề CHỈNH SỬA KÊNH THÔNG BÁO ở trên cùng. Hãy nhấp vào đó.

5ab54f42e6f7b99.png

Thao tác này sẽ hiển thị danh sách các Kênh thông báo như dưới đây:

cd89b1ca9e1de87c.png

Tìm mục Email rồi nhấp vào THÊM MỚI cho hàng đó. Thao tác này sẽ hiển thị chi tiết Cấu hình email như được hiển thị bên dưới:

d6ed98ffd0427fa3.png

Nhập địa chỉ email và Tên hiển thị của bạn như bên dưới. Nhấp vào LƯU.

Thao tác này sẽ hoàn tất quá trình tạo Kênh thông báo qua email. Hãy tiếp tục và định cấu hình kiểm tra thời gian hoạt động ngay bây giờ.

Tạo quy trình kiểm tra thời gian hoạt động

Chuyển đến mục Giám sát → Kiểm tra thời gian hoạt động trên trình đơn chính trong Google Cloud Console. Ở trên cùng, bạn sẽ thấy đường liên kết TẠO THỜI GIAN KIỂM TRA VỀ THỜI GIAN CẬP NHẬT. Nhấp vào đó.

484541aec65e605e.png

Thao tác này sẽ đưa ra một loạt các bước mà bạn cần hoàn tất để định cấu hình tính năng kiểm tra thời gian hoạt động.

Bước đầu tiên là thiết lập thông tin chi tiết về Mục tiêu, tức là thông tin về dịch vụ Cloud Run mà chúng ta đã triển khai. Dưới đây là biểu mẫu đã điền sẵn:

4e2bb9fe022320f7.png

Bạn có thể chọn các giá trị khác nhau như sau:

  • Giao thức : HTTPS
  • Resource Type (Loại tài nguyên): Chọn Cloud Run Service (Dịch vụ Cloud Run). Hãy lưu ý các tài nguyên khác mà tài nguyên này hỗ trợ và bạn cũng có thể thiết lập tính năng kiểm tra Thời gian hoạt động trên các tài nguyên đó.
  • Dịch vụ Cloud Run : Chọn my-inventory-api hoặc tên cụ thể mà bạn đặt cho dịch vụ Cloud Run.
  • Đường dẫn là /healthy, vì chúng ta đang trả về một chuỗi "All Izz Well" (Tất cả đường dẫn) và chúng ta muốn kiểm tra điều đó.

Nhấp vào TIẾP TỤC để chuyển sang bước tiếp theo. Bước tiếp theo là bước Xác thực phản hồi như minh hoạ dưới đây:

a6011ac2ab3e0f10.png

Bạn có thể thấy rằng chúng tôi đang bật tính năng kiểm tra "Content Matching" (So khớp nội dung) rồi thiết lập để phản hồi do điểm cuối /healthy trả về sẽ là "All Izz Well". Nhấp vào TIẾP TỤC để chuyển sang bước tiếp theo. Tại đây, chúng ta sẽ định cấu hình Cảnh báo và kênh thông báo mà chúng ta sẽ nhận được thông báo nếu không kiểm tra được Thời gian hoạt động.

d9738670efcb999f.png

Trong bước này, hãy đặt tên cho Cảnh báo. Tôi đã chọn tên là Inventory API Uptime Check failure (Không kiểm tra được thời gian hoạt động của API khoảng không quảng cáo), nhưng bạn có thể chọn tên của mình. Điều quan trọng ở đây là chọn đúng kênh thông báo trong danh sách mà bạn đã định cấu hình trước đó.

Nhấp vào XEM XÉT để thực hiện bước cuối cùng nhằm xem lại quy trình kiểm tra Thời gian hoạt động mà chúng ta đã định cấu hình.

Ở bước cuối cùng này, hãy đặt tên cho quy trình kiểm tra Thời gian hoạt động (ví dụ: Kiểm tra thời gian hoạt động của API khoảng không quảng cáo). Sau đó, bạn cũng có thể kiểm tra xem quy trình kiểm tra này có được định cấu hình chính xác hay không. Nhấp vào nút TEST để kiểm tra.

80375bfab97fc313.png

Hãy tiếp tục hoàn tất quy trình (nhấp vào nút CREATE (TẠO) ở bên trái). Google Cloud sẽ hướng dẫn các đầu dò kiểm tra thời gian hoạt động được định cấu hình trên nhiều khu vực để ping URL và các phản hồi này sẽ được thu thập. Sau vài phút, hãy truy cập vào mục Monitoring (Theo dõi) → Uptime checks (Kiểm tra thời gian hoạt động). Bạn sẽ thấy tất cả các tín hiệu màu xanh lục cho biết URL có thể truy cập được từ các đầu dò khác nhau.

df17555ddbee1127.png

Nếu bất kỳ đầu dò nào không thành công trong một khoảng thời gian (có thể định cấu hình), bạn sẽ nhận được Thông báo cảnh báo trên kênh email mà chúng tôi đã định cấu hình.

Việc này giúp hoàn tất phần hướng dẫn về cách thiết lập tính năng Kiểm tra thời gian hoạt động. Bạn làm tốt lắm!

6. Trình khám phá chỉ số

Giải pháp Giám sát trên đám mây cho thấy hàng nghìn chỉ số tiêu chuẩn từ nhiều sản phẩm của Google Cloud. Những chỉ số này có sẵn để bạn kiểm tra, truy vấn, chuyển đổi sang Biểu đồ, thêm vào Trang tổng quan, gửi Cảnh báo và làm nhiều việc khác.

Mục tiêu của chúng ta trong phần này là:

  1. Hãy hiểu cách bạn có thể xem xét nhiều chỉ số, sau đó chúng tôi sẽ điều tra một chỉ số cụ thể (độ trễ) cho dịch vụ API của mình.
  2. Hãy chuyển chỉ số đó thành Biểu đồ và Trang tổng quan tuỳ chỉnh mà sau đó chúng tôi có thể sử dụng để trình bày trực quan chỉ số bất cứ lúc nào.

Tìm hiểu chỉ số về độ trễ cho dịch vụ API khoảng không quảng cáo

Chuyển đến Giám sát → Trình khám phá chỉ số trong trình đơn chính của Google Cloud Console. Thao tác này sẽ đưa bạn đến màn hình Trình khám phá chỉ số. Nhấp vào CHỌN MỘT CHỈ SỐ. Giờ đây, bạn có thể điều hướng một số tài nguyên đang hoạt động đã tạo chỉ số.

Vì chúng ta đang xử lý các dịch vụ Cloud Run, hãy nhấp vào Bản sửa đổi Cloud Run , sau đó nhấp vào danh mục và chỉ số cụ thể có tiêu đề Độ trễ yêu cầu như minh hoạ bên dưới:

7609d8156c8f1384.png

Nhấp vào Áp dụng. Thao tác này sẽ hiển thị Độ trễ yêu cầu trong biểu đồ. Bạn có thể thay đổi Loại tiện ích thành Biểu đồ dạng đường trong phần Cài đặt hiển thị ở bên phải như minh hoạ dưới đây:

46086ac0a8eaf3d7.png

Thao tác này sẽ hiển thị Biểu đồ độ trễ như sau:

ad97f749eeacaa95.png

Tạo Biểu đồ và Trang tổng quan tuỳ chỉnh

Hãy tiếp tục và lưu Biểu đồ này. Nhấp vào Lưu biểu đồ rồi sử dụng thông tin chi tiết như bên dưới:

35d1788d5f0cb3c4.pngs

Xin lưu ý rằng chúng ta đang tạo một trang tổng quan mới thay vì lưu trang tổng quan đó vào một trang tổng quan hiện có. Nhấp vào nút LƯU. Thao tác này sẽ thêm trang tổng quan mới tạo vào danh sách các trang tổng quan như sau:

c9cdcd63d5823abd.png

Nhấp vào trang tổng quan cụ thể mà chúng ta đã tạo để xem thông tin chi tiết.

27354d8310d8a2d7.pngS

Đến đây, bạn sẽ hoàn thành phần tìm hiểu các chỉ số khác nhau thông qua Trình khám phá chỉ số và cách tạo trang tổng quan tuỳ chỉnh.

7. Cloud Logging

Trong phần này, chúng ta sẽ khám phá tính năng Ghi nhật ký trên đám mây. Tính năng Ghi nhật ký trên đám mây có giao diện Trình khám phá nhật ký giúp bạn điều hướng và tìm hiểu các nhật ký do nhiều Dịch vụ của Google và ứng dụng của riêng bạn tạo ra.

Trong phần này, chúng ta sẽ tìm hiểu về Trình khám phá nhật ký và mô phỏng một vài thông điệp nhật ký mà sau đó chúng ta có thể tìm kiếm và chuyển đổi thành chỉ số, thông qua một tính năng có tên là Chỉ số dựa trên nhật ký.

Trình khám phá nhật ký

Bạn có thể truy cập vào Trình khám phá nhật ký thông qua Nhật ký → Trình khám phá nhật ký trên bảng điều khiển Google Cloud chính như minh hoạ bên dưới:

df05f5b33fd5695a.png

Thao tác này sẽ hiển thị một giao diện nhật ký, trong đó bạn có thể chọn/bỏ chọn các Tài nguyên (Dự án, Tài nguyên Google Cloud, tên dịch vụ, v.v.) cùng với Cấp độ nhật ký để lọc thông điệp nhật ký nếu cần.

e7fa15bcf73f3805.png

Ở trên là danh sách nhật ký cho Bản sửa đổi Cloud Run, tức là các dịch vụ Cloud Run mà chúng tôi đã triển khai. Bạn sẽ thấy một số yêu cầu là các lượt kiểm tra Thời gian hoạt động truy cập vào điểm cuối /lanhmanh mà chúng tôi đã định cấu hình.

Tìm cảnh báo

Mô phỏng một vài yêu cầu không hợp lệ cho Dịch vụ kho hàng bằng cách cung cấp mã sản phẩm không phải là I-1, I-2 và I-3. Ví dụ: một yêu cầu không chính xác là:

https://<SERVICE_URL>/inventory/I-999

Bây giờ, chúng ta sẽ tìm kiếm tất cả CẢNH BÁO do API của chúng ta tạo ra, khi bạn cung cấp Mã sản phẩm không chính xác trong Truy vấn.

Trong Hộp truy vấn, hãy chèn các tham số truy vấn sau:

resource.type="cloud_run_revision"

textPayload =~ "Received inventory request for incorrect productid"

Hàm này có dạng như sau:

b3ee512a0c9c5c7b.png

Nhấp vào Run Query (Chạy truy vấn). Sau đó, danh sách này sẽ hiển thị tất cả yêu cầu đã nhận được và những yêu cầu có vấn đề này.

5fdbd7c23bf4694f.png

Chỉ số dựa trên nhật ký

Hãy tạo Chỉ số nhật ký tuỳ chỉnh để theo dõi các lỗi này. Chúng tôi muốn biết liệu có một số lượng đáng kể lệnh gọi xảy ra với Mã sản phẩm không chính xác hay không.

Để chuyển đổi ở trên thành chỉ số lỗi, hãy nhấp vào nút Tạo chỉ số mà bạn thấy trong Trình khám phá nhật ký.

fa9a5e04922aa412.png

Thao tác này sẽ mở biểu mẫu để tạo định nghĩa về chỉ số. Chọn Chỉ số bộ đếm và nhập thông tin chi tiết cho Tên chỉ số (inventory_lookup_errors) và Nội dung mô tả như minh hoạ bên dưới, sau đó nhấp vào Tạo chỉ số.

70b5719b472d4d02.png

Thao tác này sẽ tạo chỉ số bộ đếm và bạn sẽ thấy thông báo như sau:

ab9058028185e4d5.png

Truy cập vào Logging (Ghi nhật ký) → Metrics based on logs (Chỉ số dựa trên nhật ký) trên trình đơn chính và bạn sẽ thấy chỉ số tuỳ chỉnh mà chúng ta đã xác định trong danh sách Chỉ số do người dùng xác định như bên dưới:

7d186e90559cf8e1.png.

Ở cuối mục này, bạn sẽ thấy ba dấu chấm dọc. Hãy nhấp vào các dấu chấm này để xem các thao tác mà bạn có thể thực hiện trên chỉ số tuỳ chỉnh này. Danh sách này sẽ tương tự như danh sách mà bạn đang thấy bên dưới. Nhấp vào tuỳ chọn Xem trong Trình khám phá chỉ số.

7586f0789a0bdb41.png

Thao tác này sẽ đưa chúng ta đến Trình khám phá chỉ số mà chúng ta đã tìm hiểu trong phần trước, ngoại trừ việc công cụ này hiện đã được điền sẵn cho chúng ta.

7ee7403d0639ce25.pngS

Nhấp vào Lưu biểu đồ. Sử dụng các giá trị sau cho các tuỳ chọn Lưu biểu đồ:

9009da45f76eb4c5.pngS

Bây giờ, thao tác này sẽ tạo một Trang tổng quan mới mà bạn có thể thấy lỗi Tìm kiếm khoảng không quảng cáo và trang này sẽ xuất hiện trong danh sách Trang tổng quan.

201ed66957cb64f9.png

Tuyệt vời! Giờ đây, bạn đã tạo một chỉ số tuỳ chỉnh từ nhật ký, chuyển đổi chỉ số đó thành một biểu đồ trong trang tổng quan tuỳ chỉnh. Việc này sẽ giúp chúng tôi theo dõi số lượng lệnh gọi đang sử dụng mã sản phẩm không chính xác.

8. Chính sách cảnh báo

Trong phần này, chúng ta sẽ sử dụng chỉ số tuỳ chỉnh mà chúng ta đã tạo và theo dõi dữ liệu của chỉ số đó theo một ngưỡng, tức là nếu số lỗi vượt quá một ngưỡng nhất định, chúng ta sẽ đưa ra cảnh báo. Nói cách khác, chúng ta sẽ thiết lập một chính sách cảnh báo.

Tạo chính sách cảnh báo

Hãy chuyển đến Trang tổng quan về Tìm kiếm khoảng không quảng cáo. Thao tác này sẽ hiển thị biểu đồ mà chúng ta đã tạo để ghi nhận Lỗi tra cứu khoảng không quảng cáo như minh hoạ bên dưới:

3591a1dd91a8b9fd.png

Thao tác này sẽ hiển thị dữ liệu chỉ số hiện tại. Trước tiên, hãy chỉnh sửa chỉ số như bên dưới (Nhấp vào nút Chỉnh sửa):

5e76fc20d8387984.png

Thao tác này sẽ hiển thị thông tin chi tiết về chỉ số. Chúng ta sẽ chuyển đổi biểu đồ từ thể hiện tỷ lệ lỗi thành tổng, tức là số lượng lỗi. Trường cần thay đổi được hiển thị bên dưới:

65ccd1eaca607831.pngS

Nhấp vào ÁP DỤNG ở góc trên cùng bên phải để quay lại màn hình Chỉ số. Tuy nhiên, lần này, chúng ta sẽ thấy tổng số lỗi trong khoảng thời gian căn chỉnh so với tỷ lệ lỗi.

Chúng ta sẽ tạo một Chính sách cảnh báo có thể thông báo cho chúng ta trong trường hợp số lượng lỗi vượt quá ngưỡng. Nhấp vào biểu tượng 3 dấu chấm ở góc trên cùng bên phải của biểu đồ, rồi nhấp vào Chuyển đổi thành biểu đồ cảnh báo trong danh sách các lựa chọn như minh hoạ ở trên.

cc9eec48b9bfbc92.png

Bạn sẽ thấy một màn hình như sau:

6202ad1e88679a78.png

Nhấp vào Tiếp theo để hiện giá trị Ngưỡng mà chúng ta có thể đặt. Ngưỡng mẫu mà chúng ta đã lấy ở đây là 5 , nhưng bạn có thể chọn theo ý mình.

734f809cc802ab78.png

Nhấp vào TIẾP THEO để hiển thị biểu mẫu Thông báo

f2d84fb85c2520cb.png

Chúng ta đã chọn Kênh thông báo làm kênh Email mà chúng ta đã tạo trước đó. Bạn có thể điền các thông tin chi tiết khác như Tài liệu (thông tin này sẽ được cung cấp trong phần Cảnh báo được đưa ra). Nhấp vào TIẾP THEO để xem thông tin tóm tắt và hoàn tất quy trình.

c670b29da70c4655.png

Sau khi bạn tạo Chính sách cảnh báo này, chính sách đó sẽ xuất hiện trong danh sách Chính sách cảnh báo như minh hoạ bên dưới. Bạn có thể xem danh sách các Chính sách cảnh báo bằng cách chuyển đến phần Giám sát → Cảnh báo. Quét mục Chính sách trên trang này để xem danh sách các chính sách mà chúng tôi đã thiết lập tính đến thời điểm hiện tại.

154da627959c54f3.pngS

Tuyệt vời! Giờ đây, bạn đã định cấu hình một Chính sách cảnh báo tuỳ chỉnh sẽ thông báo cho bạn trong trường hợp tỷ lệ lỗi tăng lên trong khi tra cứu Inventory API.

9. Giám sát dịch vụ (Không bắt buộc)

Trong phần này, chúng ta sẽ thiết lập SLI/SLO cho các dịch vụ của mình theo các nguyên tắc của Kỹ thuật đảm bảo độ tin cậy cho trang web (SRE). Bạn sẽ nhận thấy rằng giải pháp Giám sát trên đám mây giúp bạn dễ dàng hơn bằng cách tự động phát hiện những dịch vụ mà bạn đã triển khai trong Cloud Run và có thể tự động tính toán các SLI chính như Khả năng sử dụng, Độ trễ cùng với các phép tính Ngân sách lỗi.

Hãy tiếp tục thiết lập SLO về độ trễ cho Dịch vụ API của chúng ta.

Thiết lập SLO về độ trễ cho Dịch vụ kho hàng

Nhấp vào Giám sát → Dịch vụ trong trình đơn chính của Cloud Console. Thao tác này sẽ hiển thị danh sách các dịch vụ đã được định cấu hình cho tính năng Giám sát dịch vụ.

Hiện tại, chúng tôi không có dịch vụ nào được thiết lập cho tính năng Giám sát SLI/SLO, nên danh sách này đang trống. Trước tiên, hãy nhấp vào đường liên kết XÁC ĐỊNH DỊCH VỤ ở trên cùng để xác định / nhận dạng một dịch vụ.

42d14515a481213.png

Thao tác này sẽ tự động khám phá các dịch vụ đủ điều kiện để theo dõi SLO. Công cụ này có thể khám phá các dịch vụ Cloud Run, do đó, dịch vụ API Inventory (Kiểm kho) được triển khai cho Cloud Run sẽ xuất hiện trong danh sách.

522aaba719f85c54.png

Tên hiển thị mà bạn thấy có thể khác và sẽ tuỳ thuộc vào lựa chọn của bạn tại thời điểm triển khai dịch vụ cho Cloud Run. Nhấp vào nút GỬI. Thao tác này sẽ mở màn hình dưới đây:

eca08010ab6858a9.png

Bạn có thể nhấp vào TẠO SLO. Giờ đây, bạn có thể chọn trong số các SLI được tự động tính toán cho bạn.

556e49b10d22e5ac.png.

Chúng ta sẽ bắt đầu bằng cách chọn Latency SLI (SLI độ trễ). Nhấp vào TIẾP TỤC. Tiếp theo, bạn sẽ thấy một màn hình hiển thị hiệu suất hiện tại của dịch vụ này và độ trễ thông thường.

a9cc6f6778c13b52.png

Chúng ta đặt một giá trị cho Ngưỡng, tức là 300 mili giây, đây là giá trị mà chúng ta muốn đạt được. Bạn có thể chọn một giá trị khác nếu muốn, nhưng hãy lưu ý rằng giá trị này sẽ ảnh hưởng đến ngân sách lỗi mà bạn xác định cho phù hợp. Nhấp vào TIẾP TỤC.

Bây giờ, chúng ta sẽ đặt SLO (Cửa sổ mục tiêu và đo lường) như sau:

e1fc336d4191c08e.png

Điều này có nghĩa là chúng ta đang chọn Khoảng thời gian đo lường là một khoảng thời gian Lăn và đo lường khoảng thời gian đó trong 7 ngày. Tương tự như vậy, chúng ta đã chọn mục tiêu là 90%. Điều chúng tôi muốn nói ở đây là 90% yêu cầu gửi đến dịch vụ API phải hoàn tất trong vòng 300 mili giây và điều này phải được đo lường trong 7 ngày.

Nhấp vào Tiếp tục. Thao tác này sẽ mở ra màn hình tóm tắt. Bạn có thể xác nhận màn hình này bằng cách nhấp vào nút UPDATE SLO (CẬP NHẬT SLO).

f2540173d9f4a4b7.png

Thao tác này sẽ lưu định nghĩa SLO và tự động tính toán Hạn mức lỗi cho bạn.

76393df0e189104.png

Bạn có thể thử một số cách sau:

  1. Thực thi API thông qua nhiều lệnh gọi và xem hiệu suất của dịch vụ cũng như mức độ ảnh hưởng của dịch vụ đó đến Ngân sách lỗi còn lại.
  2. Sửa đổi mã nguồn để tạo độ trễ bổ sung (ngủ) ngẫu nhiên trong một số lệnh gọi. Điều này sẽ làm tăng độ trễ cho một số lệnh gọi và sẽ ảnh hưởng tiêu cực đến Ngân sách lỗi.

10. Xin chúc mừng

Xin chúc mừng! Bạn đã triển khai thành công một ứng dụng mẫu lên Google Cloud và tìm hiểu cách sử dụng Google Cloud Operations Suite để theo dõi tình trạng của ứng dụng!

Nội dung đã đề cập

  • Triển khai một dịch vụ cho Google Cloud Run.
  • Thiết lập Trang tổng quan cho Dịch vụ Google Cloud Run.
  • Kiểm tra thời gian hoạt động.
  • Thiết lập Chỉ số nhật ký tuỳ chỉnh và Trang tổng quan/Biểu đồ dựa trên chỉ số đó.
  • Khám phá Trình khám phá chỉ số và thiết lập Trang tổng quan/Biểu đồ.
  • Thiết lập Chính sách cảnh báo.
  • Thiết lập SLI/SLO để giám sát dịch vụ trong Google Cloud.

Lưu ý: Nếu bạn đã thực hiện lớp học lập trình bằng tài khoản và dự án Google Cloud của riêng mình, thì các tài nguyên được phân bổ có thể tiếp tục bị tính phí. Vì vậy, hãy xoá Dự án và tài nguyên sau khi bạn hoàn tất lớp học này.

Tiếp theo là gì?

Hãy xem Nhiệm vụ nâng cao kỹ năng đám mây này để tìm hiểu thêm về Bộ công cụ vận hành của Google Cloud.

Tài liệu đọc thêm