Phân tích mô hình học máy tài chính được triển khai trên Cloud AI Platform bằng Công cụ What-if

1. Tổng quan

Trong phòng thí nghiệm này, bạn sẽ dùng Công cụ xử lý nếu để phân tích mô hình XGBoost được huấn luyện dựa trên dữ liệu tài chính và được triển khai trên Cloud AI Platform.

Kiến thức bạn sẽ học được

Bạn sẽ tìm hiểu cách:

  • Đào tạo mô hình XGTăng trên tập dữ liệu về thế chấp công khai trong AI Platform Notebooks
  • Triển khai mô hình XGTăng lên Nền tảng AI
  • Phân tích mô hình bằng Công cụ What-if

Tổng chi phí để chạy phòng thí nghiệm này trên Google Cloud là khoảng 1 đô la.

2. Giới thiệu nhanh về XGTăng

XGBoost là một khung máy học sử dụng cây quyết định và tính năng tăng độ dốc để tạo các mô hình dự đoán. Công cụ này hoạt động bằng cách tập hợp nhiều cây quyết định với nhau dựa trên điểm số liên quan đến các nút lá trong một cây.

Sơ đồ dưới đây là hình ảnh trực quan của mô hình cây quyết định đơn giản giúp đánh giá xem có nên chơi một trận đấu thể thao dựa trên thông tin dự báo thời tiết hay không:

308a0bfc70733abf.png.

Tại sao chúng tôi sử dụng XGboost cho mô hình này? Mặc dù mạng nơron truyền thống đã được chứng minh là hoạt động hiệu quả nhất đối với dữ liệu phi cấu trúc như hình ảnh và văn bản, nhưng cây quyết định thường hoạt động cực kỳ hiệu quả đối với dữ liệu có cấu trúc như tập dữ liệu về thế chấp mà chúng ta sẽ sử dụng trong lớp học lập trình này.

3. Thiết lập môi trường

Bạn cần một dự án Google Cloud Platform đã bật tính năng thanh toán để chạy lớp học lập trình này. Để tạo một dự án, hãy làm theo hướng dẫn tại đây.

Bước 1: Bật API mô hình Cloud AI Platform

Chuyển đến phần Mô hình nền tảng AI trên Cloud Console rồi nhấp vào Bật nếu bạn chưa bật.

d0d38662851c6af3.png

Bước 2: Bật Compute Engine API

Chuyển đến Compute Engine rồi chọn Enable (Bật) nếu bạn chưa bật tính năng này. Bạn sẽ cần có gói này để tạo thực thể sổ tay.

Bước 3: Tạo một thực thể Sổ tay trên nền tảng AI

Chuyển đến mục Sổ tay trên nền tảng AI trên Cloud Console rồi nhấp vào Phiên bản mới. Sau đó, hãy chọn loại phiên bản TF Enterprise 2.x mới nhất không có GPU:

7d16190440ab2e9c.png.

Sử dụng các tuỳ chọn mặc định rồi nhấp vào Tạo. Sau khi tạo phiên bản, hãy chọn Open JupyterLab:

772f8868d3841ba0.png.

Bước 4: Cài đặt XGTăng

Sau khi phiên bản JupyterLab của bạn mở ra, bạn cần thêm gói XGTăng.

Để thực hiện việc này, hãy chọn Cửa sổ dòng lệnh từ trình chạy:

28dcf2790ce77c96.png.

Sau đó, chạy lệnh sau để cài đặt phiên bản XGTăng lên mới nhất được Cloud AI Platform hỗ trợ:

pip3 install xgboost==0.90

Sau khi hoàn tất, hãy mở một phiên bản Sổ tay Python 3 từ trình chạy. Bạn đã sẵn sàng bắt đầu sử dụng sổ tay!

Bước 5: Nhập các gói Python

Trong ô đầu tiên của sổ tay, hãy thêm các lệnh nhập sau đây và chạy ô. Bạn có thể chạy trình đơn này bằng cách nhấn nút mũi tên phải trong trình đơn trên cùng hoặc nhấn Command-Enter:

import pandas as pd
import xgboost as xgb
import numpy as np
import collections
import witwidget

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.utils import shuffle
from witwidget.notebook.visualization import WitWidget, WitConfigBuilder

4. Tải xuống và xử lý dữ liệu

Chúng tôi sẽ sử dụng tập dữ liệu về thế chấp từ ffiec.gov để huấn luyện một mô hình XGTăng. Chúng tôi đã xử lý trước một số tập dữ liệu gốc và tạo một phiên bản nhỏ hơn để bạn sử dụng cho việc huấn luyện mô hình. Mô hình này sẽ dự đoán liệu một đơn đăng ký vay thế chấp cụ thể có được phê duyệt hay không.

Bước 1: Tải tập dữ liệu đã xử lý trước xuống

Chúng tôi đã tạo một phiên bản của tập dữ liệu cho bạn trong Google Cloud Storage. Bạn có thể tải Gemini xuống bằng cách chạy lệnh gsutil sau trong sổ tay Jupyter của mình:

!gsutil cp 'gs://mortgage_dataset_files/mortgage-small.csv' .

Bước 2: Đọc tập dữ liệu bằng Gấu trúc

Trước khi tạo Khung dữ liệu của Gấu trúc, chúng ta sẽ tạo một lệnh chính tả cho từng loại dữ liệu của cột để Gấu trúc đọc chính xác tập dữ liệu của mình:

COLUMN_NAMES = collections.OrderedDict({
 'as_of_year': np.int16,
 'agency_code': 'category',
 'loan_type': 'category',
 'property_type': 'category',
 'loan_purpose': 'category',
 'occupancy': np.int8,
 'loan_amt_thousands': np.float64,
 'preapproval': 'category',
 'county_code': np.float64,
 'applicant_income_thousands': np.float64,
 'purchaser_type': 'category',
 'hoepa_status': 'category',
 'lien_status': 'category',
 'population': np.float64,
 'ffiec_median_fam_income': np.float64,
 'tract_to_msa_income_pct': np.float64,
 'num_owner_occupied_units': np.float64,
 'num_1_to_4_family_units': np.float64,
 'approved': np.int8
})

Tiếp theo, chúng ta sẽ tạo một DataFrame, truyền vào đó các kiểu dữ liệu đã chỉ định ở trên. Bạn cần xáo trộn dữ liệu trong trường hợp tập dữ liệu ban đầu được sắp xếp theo cách cụ thể. Chúng ta sử dụng tiện ích sklearn có tên là shuffle để thực hiện việc này. Tiện ích này đã được nhập vào ô đầu tiên:

data = pd.read_csv(
 'mortgage-small.csv',
 index_col=False,
 dtype=COLUMN_NAMES
)
data = data.dropna()
data = shuffle(data, random_state=2)
data.head()

data.head() cho phép chúng ta xem trước 5 hàng đầu tiên của tập dữ liệu trong Gấu trúc. Bạn sẽ thấy như sau sau khi chạy ô ở trên:

29106b71103235a6.pngS

Đây là những tính năng mà chúng tôi sẽ sử dụng để huấn luyện mô hình của mình. Nếu di chuyển đến cuối trang, bạn sẽ thấy cột cuối cùng approved, đây là điều mà chúng ta đang dự đoán. Giá trị 1 cho biết một đơn đăng ký cụ thể đã được phê duyệt và 0 cho biết đơn đăng ký đó đã bị từ chối.

Để xem phân phối của các giá trị được phê duyệt / bị từ chối trong tập dữ liệu và tạo một mảng nhãn, hãy chạy lệnh sau:

# Class labels - 0: denied, 1: approved
print(data['approved'].value_counts())

labels = data['approved'].values
data = data.drop(columns=['approved'])

Khoảng 66% tập dữ liệu này chứa các ứng dụng đã được phê duyệt.

Bước 3: Tạo cột giả cho các giá trị phân loại

Tập dữ liệu này chứa sự kết hợp giữa giá trị phân loại và giá trị số, nhưng XGboost yêu cầu tất cả các đối tượng đều phải là số. Thay vì biểu thị các giá trị phân loại bằng phương thức mã hoá một nóng, đối với mô hình XGTăng, chúng ta sẽ tận dụng hàm get_dummies của Gấu trúc.

get_dummies lấy một cột có nhiều giá trị có thể có và chuyển đổi cột đó thành một chuỗi các cột, mỗi cột chỉ có 0 và 1. Ví dụ: nếu chúng tôi có cột "màu" bằng các giá trị có thể có là "xanh dương" và "đỏ" get_dummies sẽ chuyển đổi thành 2 cột có tên là "color_blue" và "color_red" với tất cả các giá trị boolean 0 và 1.

Để tạo cột giả cho các đối tượng phân loại của chúng tôi, hãy chạy mã sau:

dummy_columns = list(data.dtypes[data.dtypes == 'category'].index)
data = pd.get_dummies(data, columns=dummy_columns)

data.head()

Khi xem trước dữ liệu lần này, bạn sẽ thấy các tính năng đơn lẻ (như purchaser_type trong hình bên dưới) được chia thành nhiều cột:

83aacfaad626e538.pngs

Bước 4: Chia dữ liệu thành các nhóm huấn luyện và nhóm thử nghiệm

Một khái niệm quan trọng trong công nghệ học máy là phân tách thử nghiệm / thử nghiệm. Chúng tôi sẽ lấy và sử dụng phần lớn dữ liệu của mình để huấn luyện mô hình, đồng thời sẽ dành phần còn lại để thử nghiệm mô hình trên dữ liệu chưa từng thấy trước đây.

Thêm mã sau vào sổ tay của bạn. Mã này sử dụng hàm Scikit Learn train_test_split để phân chia dữ liệu:

x,y = data,labels
x_train,x_test,y_train,y_test = train_test_split(x,y)

Bây giờ, bạn đã sẵn sàng xây dựng và huấn luyện mô hình của mình!

5. Tạo, huấn luyện và đánh giá mô hình XGTăng

Bước 1: Xác định và huấn luyện mô hình XGTăng

Việc tạo mô hình trong XGTăng rất đơn giản. Chúng ta sẽ sử dụng lớp XGBClassifier để tạo mô hình và chỉ cần truyền tham số objective phù hợp cho nhiệm vụ phân loại cụ thể của mình. Trong trường hợp này, chúng ta sử dụng reg:logistic vì gặp vấn đề phân loại nhị phân và chúng ta muốn mô hình đưa ra một giá trị duy nhất trong phạm vi (0,1): 0 nếu không được phê duyệt và 1 nếu đã phê duyệt.

Đoạn mã sau đây sẽ tạo một mô hình XGTăng:

model = xgb.XGBClassifier(
    objective='reg:logistic'
)

Bạn có thể huấn luyện mô hình này bằng một dòng mã, gọi phương thức fit() rồi truyền vào đó dữ liệu và nhãn huấn luyện.

model.fit(x_train, y_train)

Bước 2: Đánh giá độ chính xác của mô hình

Giờ đây, chúng ta có thể sử dụng mô hình đã huấn luyện để tạo thông tin dự đoán về dữ liệu kiểm thử bằng hàm predict().

Sau đó, chúng ta sẽ sử dụng hàm accuracy_score của Scikit Learn để tính toán độ chính xác của mô hình dựa trên hiệu suất của mô hình dựa trên dữ liệu kiểm thử. Chúng ta sẽ truyền cho nó các giá trị thực tế cùng với các giá trị dự đoán của mô hình cho từng ví dụ trong tập kiểm thử:

y_pred = model.predict(x_test)
acc = accuracy_score(y_test, y_pred.round())
print(acc, '\n')

Bạn sẽ thấy độ chính xác khoảng 87%, nhưng độ chính xác của bạn sẽ thay đổi một chút vì luôn có yếu tố ngẫu nhiên trong công nghệ học máy.

Bước 3: Lưu mô hình

Để triển khai mô hình, hãy chạy mã sau để lưu vào tệp cục bộ:

model.save_model('model.bst')

6. Triển khai mô hình cho Cloud AI Platform

Chúng ta đã có mô hình hoạt động trên máy tính, nhưng sẽ thật tuyệt nếu chúng ta có thể đưa ra dự đoán về mô hình đó từ bất cứ đâu (không chỉ sổ tay này!). Ở bước này, chúng tôi sẽ triển khai ứng dụng lên đám mây.

Bước 1: Tạo một bộ chứa trên Cloud Storage cho mô hình của chúng tôi

Trước tiên, hãy xác định một số biến môi trường mà chúng ta sẽ sử dụng trong suốt phần còn lại của lớp học lập trình này. Điền tên dự án Google Cloud của bạn vào các giá trị bên dưới, tên bộ chứa bộ nhớ trên đám mây mà bạn muốn tạo (phải là duy nhất trên toàn hệ thống) và tên phiên bản của phiên bản đầu tiên của mô hình:

# Update these to your own GCP project, model, and version names
GCP_PROJECT = 'your-gcp-project'
MODEL_BUCKET = 'gs://storage_bucket_name'
VERSION_NAME = 'v1'
MODEL_NAME = 'xgb_mortgage'

Bây giờ, chúng ta đã sẵn sàng tạo một bộ chứa lưu trữ để lưu trữ tệp mô hình XGTăng. Chúng tôi sẽ trỏ Cloud AI Platform vào tệp này khi triển khai.

Chạy lệnh gsutil này từ trong sổ tay của bạn để tạo một bộ chứa:

!gsutil mb $MODEL_BUCKET

Bước 2: Sao chép tệp mô hình vào Cloud Storage

Tiếp theo, chúng ta sẽ sao chép tệp mô hình đã lưu XGboost vào Cloud Storage. Chạy lệnh PolicyBytes sau đây:

!gsutil cp ./model.bst $MODEL_BUCKET

Chuyển đến trình duyệt lưu trữ trong Cloud Console để xác nhận tệp đã được sao chép:

31e2567fa0117214.png.

Bước 3: Tạo và triển khai mô hình

Chúng tôi gần như đã sẵn sàng triển khai mô hình này! Lệnh ai-platform gcloud sau đây sẽ tạo một mô hình mới trong dự án của bạn. Chúng tôi sẽ đặt tên sự kiện này là xgb_mortgage:

!gcloud ai-platform models create $MODEL_NAME --region='global'

Giờ là lúc triển khai mô hình. Chúng ta có thể thực hiện việc đó bằng lệnh gcloud này:

!gcloud ai-platform versions create $VERSION_NAME \
--model=$MODEL_NAME \
--framework='XGBOOST' \
--runtime-version=2.1 \
--origin=$MODEL_BUCKET \
--python-version=3.7 \
--project=$GCP_PROJECT \
--region='global'

Trong khi tính năng này đang chạy, hãy xem mục mô hình trên bảng điều khiển Nền tảng AI. Bạn sẽ thấy phiên bản mới của mình đang được triển khai ở đó:

342875ba92becad1.png.

Khi quá trình triển khai hoàn tất thành công, bạn sẽ thấy dấu kiểm màu xanh lục ở vị trí của vòng quay đang tải. Quá trình triển khai sẽ mất 2-3 phút.

Bước 4: Kiểm thử mô hình đã triển khai

Để đảm bảo mô hình mà bạn triển khai đang hoạt động, hãy kiểm thử bằng gcloud để đưa ra thông tin dự đoán. Trước tiên, hãy lưu tệp JSON bằng ví dụ đầu tiên từ tập hợp kiểm thử của chúng ta:

%%writefile predictions.json
[2016.0, 1.0, 346.0, 27.0, 211.0, 4530.0, 86700.0, 132.13, 1289.0, 1408.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0]

Kiểm thử mô hình của bạn bằng cách chạy mã này:

prediction = !gcloud ai-platform predict --model=xgb_mortgage --region='global' --json-instances=predictions.json --version=$VERSION_NAME --verbosity=none

print(prediction)

Bạn sẽ thấy thông tin dự đoán cho mô hình trong dữ liệu đầu ra. Ví dụ cụ thể này đã được phê duyệt, vì vậy, bạn sẽ thấy một giá trị gần với 1.

7. Sử dụng Công cụ What-if để diễn giải mô hình

Bước 1: Tạo hình ảnh trực quan cho Công cụ What-if

Để kết nối Công cụ Giả định với các mô hình Nền tảng AI, bạn cần truyền cho công cụ đó một số ví dụ kiểm thử cùng với các giá trị thực tế của các ví dụ đó. Hãy tạo một mảng Numpy gồm 500 ví dụ kiểm thử cùng với nhãn thông tin thực tế của chúng:

num_wit_examples = 500
test_examples = np.hstack((x_test[:num_wit_examples].values,y_test[:num_wit_examples].reshape(-1,1)))

Việc tạo thực thể cho Công cụ What-if cũng đơn giản như việc tạo một đối tượng WitConfigBuilder và truyền đối tượng đó vào mô hình Nền tảng AI mà chúng ta muốn phân tích.

Chúng ta sử dụng tham số adjust_prediction không bắt buộc tại đây vì Công cụ What-if yêu cầu danh sách điểm cho từng lớp trong mô hình của chúng ta (trong trường hợp này là 2). Do mô hình chỉ trả về một giá trị duy nhất từ 0 đến 1, nên chúng ta sẽ biến đổi giá trị đó sang đúng định dạng trong hàm sau:

def adjust_prediction(pred):
  return [1 - pred, pred]

config_builder = (WitConfigBuilder(test_examples.tolist(), data.columns.tolist() + ['mortgage_status'])
  .set_ai_platform_model(GCP_PROJECT, MODEL_NAME, VERSION_NAME, adjust_prediction=adjust_prediction)
  .set_target_feature('mortgage_status')
  .set_label_vocab(['denied', 'approved']))
WitWidget(config_builder, height=800)

Xin lưu ý rằng quá trình tải hình ảnh sẽ mất một phút. Khi tải, bạn sẽ thấy như sau:

4c0b00e6AAPdbe01.png.

Trục y cho thấy dự đoán của mô hình, với 1 là dự đoán approved có độ tin cậy cao và 0 là dự đoán denied có độ tin cậy cao. Trục x chỉ là độ phân tán của tất cả các điểm dữ liệu đã tải.

Bước 2: Khám phá từng điểm dữ liệu

Chế độ xem mặc định trên Công cụ What-if là thẻ Datapoint Editor (Trình chỉnh sửa điểm dữ liệu). Tại đây, bạn có thể nhấp vào từng điểm dữ liệu riêng lẻ để xem các tính năng của điểm dữ liệu đó, thay đổi giá trị của tính năng và xem thay đổi đó ảnh hưởng như thế nào đến thông tin dự đoán của mô hình về từng điểm dữ liệu riêng lẻ.

Trong ví dụ bên dưới, chúng tôi đã chọn một điểm dữ liệu gần với ngưỡng 0,5. Đơn đăng ký thế chấp được liên kết với điểm dữ liệu cụ thể này bắt nguồn từ CFPB. Chúng ta đã thay đổi tính năng đó thành 0 cũng như thay đổi giá trị của agency_code_Department of Housing and Urban Development (HUD) thành 1 để xem điều gì sẽ xảy ra với dự đoán của mô hình nếu khoản vay này bắt nguồn từ HUD:

717620d6a1330479.pngS

Như chúng ta có thể thấy ở phần dưới cùng bên trái của Công cụ What-if, việc thay đổi tính năng này đã làm giảm đáng kể khả năng dự đoán approved của mô hình xuống 32%. Điều này có thể cho thấy rằng công ty quảng cáo cho vay có tác động mạnh mẽ đến kết quả của mô hình, nhưng chúng tôi cần phân tích thêm để chắc chắn.

Ở phần dưới cùng bên trái của giao diện người dùng, chúng ta cũng có thể xem giá trị thực tế của từng điểm dữ liệu và so sánh giá trị đó với thông tin dự đoán của mô hình:

60ff20ae80ed5e27.pngS

Bước 3: Phân tích phản thực tế

Tiếp theo, nhấp vào điểm dữ liệu bất kỳ và di chuyển thanh trượt Hiển thị điểm dữ liệu phản thực gần nhất sang bên phải:

ae64fd7abefe5449.png

Khi chọn giá trị này, bạn sẽ thấy điểm dữ liệu có giá trị tính năng gần giống nhất với giá trị ban đầu mà bạn đã chọn, nhưng kết quả dự đoán ngược lại. Sau đó, bạn có thể di chuyển qua các giá trị của tính năng để xem hai điểm dữ liệu khác nhau ở điểm nào (sự khác biệt được đánh dấu bằng màu xanh lục và in đậm).

Bước 4: Xem đồ thị phụ thuộc một phần

Để xem mức độ ảnh hưởng của mỗi tính năng đến các dự đoán tổng thể của mô hình, hãy chọn hộp Đồ thị phụ thuộc một phần và đảm bảo chọn Biểu đồ phụ thuộc một phần toàn cục:

72117b5ceb683841.pngS

Ở đây, chúng ta có thể thấy rằng các khoản vay bắt nguồn từ HUD có khả năng bị từ chối cao hơn một chút. Biểu đồ có hình dạng này vì mã đại lý là một tính năng boolean, do đó, các giá trị chỉ có thể chính xác là 0 hoặc 1.

applicant_income_thousands là một tính năng bằng số và trong biểu đồ sự phụ thuộc một phần, chúng ta có thể thấy rằng thu nhập cao hơn sẽ làm tăng một chút khả năng đơn đăng ký được chấp thuận, nhưng chỉ lên đến khoảng 200.000 đô la. Sau 200.000 đô la Mỹ, tính năng này không ảnh hưởng đến thông tin dự đoán của mô hình.

Bước 5: Tìm hiểu hiệu suất tổng thể và tính công bằng

Tiếp theo, hãy chuyển đến thẻ Hiệu suất và Thẻ Công bằng. Biểu đồ này hiển thị số liệu thống kê tổng thể về hiệu suất về kết quả của mô hình trên tập dữ liệu được cung cấp, bao gồm ma trận nhầm lẫn, đường cong PR và đường cong ROC.

Chọn mortgage_status làm Tính năng thực tế thực để xem ma trận nhầm lẫn:

fe1384ee47699498.png

Ma trận nhầm lẫn này hiển thị các dự đoán chính xác và không chính xác của mô hình của chúng tôi dưới dạng phần trăm tổng số. Nếu cộng các bình phương Có / Dự đoán có thựcKhông thực tế / Không được dự đoán, bạn sẽ cộng lại được độ chính xác như mô hình của bạn (khoảng 87%).

Bạn cũng có thể thử nghiệm với thanh trượt ngưỡng, tăng và giảm điểm phân loại dương mà mô hình cần trả về trước khi quyết định dự đoán approved cho khoản vay, đồng thời xem mức độ thay đổi của độ chính xác, cảnh báo dương tính giả (FN) và âm tính giả (FN). Trong trường hợp này, độ chính xác cao nhất ở ngưỡng 0,55.

Tiếp theo, trên trình đơn thả xuống Slice by (Lát theo) bên trái, hãy chọn loan_purpose_Home_purchase:

f3f1858d627d57ab.png

Bây giờ, bạn sẽ thấy hiệu suất trên hai tập hợp con của dữ liệu: "0" lát cắt hiển thị khi nào khoản vay không dùng để mua nhà và "1" lát cắt dùng để chỉ trường hợp khoản vay là để mua nhà. Kiểm tra mức độ chính xác, tỷ lệ sai lệch và tỷ lệ âm tính giả giữa hai phần này để tìm ra sự khác biệt về hiệu suất.

Nếu mở rộng các hàng để xem ma trận nhầm lẫn, bạn có thể thấy mô hình dự đoán "đã phê duyệt" đối với khoản vay gần 70% để mua nhà và chỉ 46% khoản vay không phải để mua nhà (tỷ lệ phần trăm chính xác sẽ khác nhau tuỳ theo mô hình của bạn):

318a8d5a8ffc6bea.png.

Nếu bạn chọn Điểm tương đồng về thông tin nhân khẩu học trong các nút chọn ở bên trái, thì 2 ngưỡng này sẽ được điều chỉnh để mô hình dự đoán approved cho tỷ lệ phần trăm người đăng ký tương tự ở cả hai nhóm. Việc này ảnh hưởng như thế nào đến tính chính xác, dương tính giả và âm tính giả cho từng lát cắt?

Bước 6: Tìm hiểu việc phân phối tính năng

Cuối cùng, điều hướng đến tab Tính năng trong Công cụ điều gì xảy ra. Biểu đồ này hiển thị cho bạn mức phân phối giá trị cho từng đối tượng trong tập dữ liệu của bạn:

48ab3c4879793324.pngs

Bạn có thể sử dụng thẻ này để đảm bảo tập dữ liệu được cân bằng. Ví dụ: có vẻ như có rất ít khoản vay trong tập dữ liệu này do Cơ quan dịch vụ nông trại cung cấp. Để cải thiện độ chính xác của mô hình, chúng tôi có thể xem xét thêm các khoản vay từ đại lý đó nếu có dữ liệu.

Chúng tôi chỉ trình bày một số ý tưởng khám phá Công cụ giả tạo tại đây. Bạn cứ thoải mái dùng công cụ này vì còn rất nhiều khu vực khác để khám phá!

8. Dọn dẹp

Nếu muốn tiếp tục sử dụng sổ tay này, bạn nên tắt sổ tay khi không sử dụng. Trên giao diện người dùng của Sổ tay trong Cloud Console, hãy chọn sổ tay đó rồi chọn Dừng:

879147427150b6c7.pngS

Nếu muốn xoá tất cả tài nguyên bạn đã tạo trong phòng thí nghiệm này, bạn chỉ cần xoá phiên bản của sổ tay thay vì dừng phiên bản đó.

Bằng cách sử dụng trình đơn Điều hướng trong Cloud Console, hãy duyệt đến Bộ nhớ và xoá cả hai bộ chứa bạn đã tạo để lưu trữ các thành phần mô hình.