Trang này được dịch bởi Cloud Translation API.

Các mô hình ngôn ngữ lớn trên thiết bị dùng Keras và TensorFlow Lite

1. Trước khi bắt đầu

Một trong những đột phá thú vị nhất về học máy gần đây là Mô hình ngôn ngữ lớn (LLM). Các mô hình này có thể được dùng để tạo văn bản, dịch ngôn ngữ và trả lời câu hỏi một cách toàn diện và giàu thông tin. Các LLM như LaMDA và PaLM của Google được huấn luyện trên một lượng lớn dữ liệu văn bản, cho phép chúng học được các mẫu thống kê và mối quan hệ giữa các từ và cụm từ. Điều này giúp họ tạo ra văn bản tương tự như văn bản do con người viết và dịch ngôn ngữ với độ chính xác cao.

LLM có dung lượng lưu trữ rất lớn và thường tiêu tốn nhiều sức mạnh tính toán để chạy. Điều này có nghĩa là LLM thường được triển khai trên đám mây và khá khó khăn đối với Học máy trên thiết bị (ODML) do sức mạnh tính toán hạn chế trên thiết bị di động. Tuy nhiên, bạn có thể chạy các LLM quy mô nhỏ hơn (ví dụ: GPT-2) trên một thiết bị Android hiện đại và vẫn đạt được kết quả ấn tượng.

Sau đây là bản minh hoạ về việc chạy một phiên bản mô hình PaLM của Google với 1,5 tỷ tham số trên Google Pixel 7 Pro mà không tăng tốc độ phát.

PaLM trên Pixel 7 Pro

Trong lớp học lập trình này, bạn sẽ tìm hiểu các kỹ thuật và công cụ để tạo một ứng dụng dựa trên LLM (sử dụng GPT-2 làm mô hình ví dụ) bằng:

KerasNLP để tải một LLM được huấn luyện trước
KerasNLP để tinh chỉnh một LLM
TensorFlow Lite để chuyển đổi, tối ưu hoá và triển khai LLM trên Android

Điều kiện tiên quyết

Kiến thức trung cấp về Keras và TensorFlow Lite
Kiến thức cơ bản về hoạt động phát triển Android

Kiến thức bạn sẽ học được

Cách sử dụng KerasNLP để tải một LLM được huấn luyện trước và tinh chỉnh LLM đó
Cách lượng tử hoá và chuyển đổi một LLM sang TensorFlow Lite
Cách chạy quy trình suy luận trên mô hình TensorFlow Lite đã chuyển đổi

Bạn cần có

Quyền truy cập vào Colab
Phiên bản mới nhất của Android Studio
Một thiết bị Android hiện đại có RAM lớn hơn 4G

2. Bắt đầu thiết lập

Cách tải mã xuống cho lớp học lập trình này:

Chuyển đến kho lưu trữ GitHub cho lớp học lập trình này.
Nhấp vào Code > Download zip (Mã > Tải xuống tệp ZIP) để tải tất cả mã cho lớp học lập trình này xuống.

hình ảnh kho lưu trữ

Giải nén tệp zip đã tải xuống để giải nén một thư mục gốc examples có tất cả tài nguyên bạn cần.

3. Chạy ứng dụng khởi đầu

Nhập thư mục examples/lite/examples/generative_ai/android vào Android Studio.
Khởi động Trình mô phỏng Android, rồi nhấp vào Chạy trong trình đơn điều hướng.

Chạy và khám phá ứng dụng

Ứng dụng sẽ khởi chạy trên thiết bị Android của bạn. Ứng dụng này có tên là "Tự động hoàn thành". Giao diện người dùng khá đơn giản: bạn có thể nhập một số từ ban đầu vào hộp văn bản rồi nhấn vào Tạo; sau đó, ứng dụng sẽ chạy quy trình suy luận trên một LLM và tạo thêm văn bản dựa trên nội dung bạn nhập.

Hiện tại, nếu bạn nhấn vào Tạo sau khi nhập một số từ, sẽ không có gì xảy ra. Điều này là do Gemini chưa chạy mô hình ngôn ngữ lớn (LLM).

ảnh chụp màn hình cho ứng dụng khởi đầu

4. Chuẩn bị LLM để triển khai trên thiết bị

Mở Colab và chạy qua sổ tay (được lưu trữ trong kho lưu trữ TensorFlow Codelabs trên GitHub).

5. Hoàn tất ứng dụng Android

Giờ đây, sau khi chuyển đổi mô hình GPT-2 thành TensorFlow Lite, bạn có thể triển khai mô hình này trong ứng dụng.

Chạy ứng dụng

Kéo tệp mô hình autocomplete.tflite đã tải xuống ở bước cuối cùng vào thư mục app/src/main/assets/ trong Android Studio.

thêm mô hình vào Android Studio

Nhấp vào Chạy trong trình đơn điều hướng, rồi đợi ứng dụng tải.
Nhập một số từ khoá ban đầu vào trường văn bản, rồi nhấn vào Tạo.

ảnh chụp màn hình của ứng dụng hoàn thiện

6. Lưu ý về AI có trách nhiệm

Như đã lưu ý trong thông báo ban đầu về OpenAI GPT-2, mô hình GPT-2 có những điểm hạn chế và lưu ý đáng kể. Trên thực tế, các LLM hiện nay thường gặp phải một số thách thức nổi tiếng như ảo tưởng, đầu ra phản cảm, tính công bằng và thiên kiến; điều này là do các mô hình này được huấn luyện dựa trên dữ liệu thực tế, khiến chúng phản ánh các vấn đề trong thế giới thực.

Lớp học lập trình này chỉ được tạo ra để minh hoạ cách tạo một ứng dụng dựa trên các LLM bằng công cụ TensorFlow. Mô hình được tạo trong lớp học lập trình này chỉ nhằm mục đích giáo dục và không dành cho mục đích sử dụng trong thực tế.

Việc sử dụng LLM trong sản xuất đòi hỏi phải lựa chọn cẩn thận các tập dữ liệu huấn luyện và các biện pháp giảm thiểu toàn diện về độ an toàn. Để tìm hiểu thêm về AI có trách nhiệm trong bối cảnh LLM, hãy nhớ xem phiên kỹ thuật Phát triển an toàn và có trách nhiệm bằng các mô hình ngôn ngữ tạo sinh tại Google I/O 2023 và xem Bộ công cụ AI có trách nhiệm.

7. Kết luận

Xin chúc mừng! Bạn đã tạo một ứng dụng để tạo văn bản mạch lạc dựa trên thông tin đầu vào của người dùng bằng cách chạy Mô hình ngôn ngữ lớn được huấn luyện trước hoàn toàn trên thiết bị!