Ảnh mỗi ngày: Phòng thí nghiệm 1 – Lưu trữ và phân tích hình ảnh (Java gốc)

1. Tổng quan

Trong lớp học lập trình đầu tiên, bạn sẽ lưu trữ các bức ảnh trong một bộ chứa. Thao tác này sẽ tạo một sự kiện tạo tệp do một dịch vụ được triển khai trong Cloud Run xử lý. Dịch vụ này sẽ thực hiện lệnh gọi đến Vision API để phân tích hình ảnh và lưu kết quả trong kho dữ liệu.

c0650ee4a76db35e.png

Kiến thức bạn sẽ học được

  • Cloud Storage
  • Cloud Run
  • Cloud Vision API
  • Cloud Firestore

2. Thiết lập và yêu cầu

Thiết lập môi trường theo tiến độ riêng

  1. Đăng nhập vào Google Cloud Console rồi tạo dự án mới hoặc sử dụng lại dự án hiện có. Nếu chưa có tài khoản Gmail hoặc Google Workspace, bạn phải tạo một tài khoản.

295004821bab6a87.pngS

37d264871000675d.png.

96d86d3d5655cdbe.png.

  • Tên dự án là tên hiển thị của những người tham gia dự án này. Đây là một chuỗi ký tự không được API của Google sử dụng. Bạn luôn có thể cập nhật ứng dụng.
  • Mã dự án là duy nhất trong tất cả các dự án Google Cloud và không thể thay đổi (không thể thay đổi sau khi đã đặt). Cloud Console sẽ tự động tạo một chuỗi duy nhất; thường bạn không quan tâm đến sản phẩm đó là gì. Trong hầu hết các lớp học lập trình, bạn sẽ cần tham khảo Mã dự án (thường được xác định là PROJECT_ID). Nếu không thích mã đã tạo, bạn có thể tạo một mã nhận dạng ngẫu nhiên khác. Ngoài ra, bạn có thể thử cách riêng của mình để xem có thể sử dụng hay không. Bạn không thể thay đổi mã này sau bước này và mã vẫn giữ nguyên trong thời gian của dự án.
  • Đối với thông tin của bạn, có giá trị thứ ba, Project Number (Số dự án), mà một số API sử dụng. Tìm hiểu thêm về cả ba giá trị này trong tài liệu này.
  1. Tiếp theo, bạn sẽ phải bật tính năng thanh toán trong Cloud Console để sử dụng API/tài nguyên trên đám mây. Việc chạy qua lớp học lập trình này sẽ không tốn nhiều chi phí. Để tắt các tài nguyên nhằm tránh phát sinh việc thanh toán ngoài hướng dẫn này, bạn có thể xoá các tài nguyên bạn đã tạo hoặc xoá dự án. Người dùng mới của Google Cloud đủ điều kiện tham gia chương trình Dùng thử miễn phí 300 USD.

Khởi động Cloud Shell

Mặc dù bạn có thể vận hành Google Cloud từ xa trên máy tính xách tay, nhưng trong lớp học lập trình này, bạn sẽ sử dụng Google Cloud Shell, một môi trường dòng lệnh chạy trong Đám mây.

Trong Google Cloud Console, hãy nhấp vào biểu tượng Cloud Shell ở thanh công cụ trên cùng bên phải:

84688aa223b1c3a2.pngS

Sẽ chỉ mất một chút thời gian để cấp phép và kết nối với môi trường. Sau khi hoàn tất, bạn sẽ thấy như sau:

320e18fb7fbe0.pngs

Máy ảo này chứa tất cả các công cụ phát triển mà bạn cần. Phiên bản này cung cấp thư mục gốc có dung lượng ổn định 5 GB và chạy trên Google Cloud, giúp nâng cao đáng kể hiệu suất và khả năng xác thực của mạng. Bạn có thể thực hiện tất cả các công việc trong lớp học lập trình này trong trình duyệt. Bạn không cần cài đặt gì cả.

3. Bật API

Đối với phòng thí nghiệm này, bạn sẽ sử dụng Cloud Functions and Vision API, nhưng trước tiên, bạn cần bật các API này trong Cloud Console hoặc bằng gcloud.

Để bật Vision API trong Cloud Console, hãy tìm Cloud Vision API trong thanh tìm kiếm:

8f3522d790bb026c.png.

Bạn sẽ được chuyển đến trang Cloud Vision API:

d785572fa14c87c2.png

Nhấp vào nút ENABLE.

Ngoài ra, bạn cũng có thể bật dịch vụ Cloud Shell bằng công cụ dòng lệnh gcloud.

Bên trong Cloud Shell, hãy chạy lệnh sau:

gcloud services enable vision.googleapis.com

Bạn sẽ thấy thao tác hoàn tất thành công:

Operation "operations/acf.12dba18b-106f-4fd2-942d-fea80ecc5c1c" finished successfully.

Bật cả Cloud Run và Cloud Build:

gcloud services enable cloudbuild.googleapis.com \
  run.googleapis.com

4. Tạo bộ chứa (bảng điều khiển)

Tạo bộ chứa lưu trữ cho ảnh. Bạn có thể thực hiện việc này từ bảng điều khiển Google Cloud Platform ( console.cloud.google.com) hoặc bằng công cụ dòng lệnh gsutil của Cloud Shell hoặc môi trường phát triển cục bộ của bạn.

Từ "hamburger" (Podcast) hãy chuyển đến trang Storage.

d08ecb0ae29330a1.png

Đặt tên cho bộ chứa

Nhấp vào nút CREATE BUCKET.

8951851554a430d2.pngS

Nhấp vào CONTINUE.

Chọn vị trí

24b24625157ab467.pngS

Tạo một bộ chứa nhiều khu vực trong khu vực mà bạn chọn (tại đây Europe).

Nhấp vào CONTINUE.

Chọn lớp bộ nhớ mặc định

9e7bd365fa94a2e0.pngs

Chọn lớp bộ nhớ Standard cho dữ liệu của bạn.

Nhấp vào CONTINUE.

Đặt chế độ kiểm soát quyền truy cập

1ff4a1f6e57045f5.pngS

Khi làm việc với các hình ảnh có thể truy cập công khai, bạn muốn tất cả ảnh của chúng tôi được lưu trữ trong bộ chứa này có cùng quyền kiểm soát truy cập đồng nhất.

Chọn tuỳ chọn kiểm soát quyền truy cập của Uniform.

Nhấp vào CONTINUE.

Thiết lập tính năng bảo vệ/mã hoá

2d469b076029d365.pngS

Giữ giá trị mặc định (Google-managed key), vì bạn sẽ không sử dụng khoá mã hoá của riêng mình.

Nhấp vào CREATE để hoàn tất việc tạo bộ chứa.

Thêm tất cả người dùng làm người xem bộ nhớ

Chuyển đến thẻ Permissions:

19564b3ad8688ae8.png.

Thêm một thành phần allUsers vào bộ chứa với vai trò là Storage > Storage Object Viewer như sau:

d655e760c76d62c1.png

Nhấp vào SAVE.

5. Tạo bộ chứa (myactivity)

Bạn cũng có thể dùng công cụ dòng lệnh gsutil trong Cloud Shell để tạo nhóm.

Trong Cloud Shell, hãy đặt một biến cho tên bộ chứa duy nhất. Cloud Shell đã đặt GOOGLE_CLOUD_PROJECT thành mã dự án duy nhất của bạn. Bạn có thể thêm tên đó vào tên bộ chứa.

Ví dụ:

export BUCKET_PICTURES=uploaded-pictures-${GOOGLE_CLOUD_PROJECT}

Tạo một vùng đa vùng tiêu chuẩn ở Châu Âu:

gsutil mb -l EU gs://${BUCKET_PICTURES}

Đảm bảo quyền truy cập đồng nhất ở cấp bộ chứa:

gsutil uniformbucketlevelaccess set on gs://${BUCKET_PICTURES}

Chuyển bộ chứa sang chế độ công khai:

gsutil iam ch allUsers:objectViewer gs://${BUCKET_PICTURES}

Nếu chuyển đến phần Cloud Storage của bảng điều khiển, bạn sẽ có một bộ chứa uploaded-pictures công khai:

65c63ef4a6eb30ad.pngS

Kiểm tra để đảm bảo rằng bạn có thể tải ảnh lên bộ chứa và ảnh đã tải lên sẽ xuất hiện công khai, như được giải thích trong bước trước.

6. Kiểm thử quyền truy cập công khai vào bộ chứa

Quay lại trình duyệt lưu trữ, bạn sẽ thấy bộ chứa của mình trong danh sách với "Công khai" quyền truy cập (bao gồm cả biển cảnh báo để nhắc bạn rằng bất kỳ ai cũng có quyền truy cập vào nội dung trong bộ chứa đó).

e639a9ba625b71a6.png

Bộ chứa của bạn hiện đã sẵn sàng để nhận ảnh.

Nếu nhấp vào tên bộ chứa, bạn sẽ thấy thông tin chi tiết về bộ chứa đó.

1f88a2290290aba8.pngs

Ở đó, bạn có thể thử nút Upload files để kiểm tra xem bạn có thể thêm ảnh vào bộ chứa hay không. Cửa sổ bật lên của trình chọn tệp sẽ yêu cầu bạn chọn một tệp. Sau khi chọn tệp này, tệp sẽ được tải lên bộ chứa của bạn và bạn sẽ thấy lại quyền truy cập public đã được tự động gán cho tệp mới này.

1209e7ebe1f63b10.pngS

Dọc theo nhãn truy cập Public, bạn cũng sẽ thấy một biểu tượng nhỏ về đường liên kết. Khi nhấp vào hình ảnh đó, trình duyệt của bạn sẽ chuyển đến URL công khai của hình ảnh đó, có dạng như sau:

https://storage.googleapis.com/BUCKET_NAME/PICTURE_FILE.png

Với BUCKET_NAME là tên duy nhất trên toàn cầu mà bạn đã chọn cho bộ chứa của mình, sau đó là tên tệp cho ảnh của bạn.

Khi nhấp vào hộp kiểm dọc theo tên ảnh, nút DELETE sẽ được bật và bạn có thể xoá hình ảnh đầu tiên này.

7. Chuẩn bị cơ sở dữ liệu

Bạn sẽ lưu trữ thông tin về hình ảnh do Vision API cung cấp vào cơ sở dữ liệu Cloud Firestore, một cơ sở dữ liệu tài liệu NoSQL nhanh, được quản lý hoàn toàn, không máy chủ và dựa trên đám mây. Chuẩn bị cơ sở dữ liệu bằng cách chuyển đến phần Firestore trong Cloud Console:

e57a673537b5deca.png

Có hai lựa chọn: Native mode hoặc Datastore mode. Hãy sử dụng chế độ gốc. Chế độ này cung cấp thêm các tính năng như hỗ trợ ngoại tuyến và đồng bộ hoá theo thời gian thực.

Nhấp vào SELECT NATIVE MODE.

1a2e363fae5c7e96.png.

Hãy chọn một khu vực (ở đây là Châu Âu, nhưng lý tưởng nhất là cùng một khu vực với chức năng và bộ chứa lưu trữ của bạn).

Nhấp vào nút CREATE DATABASE.

Sau khi tạo cơ sở dữ liệu, bạn sẽ thấy như sau:

7dcc82751ed483fb.pngs

Tạo một bộ sưu tập mới bằng cách nhấp vào nút + START COLLECTION.

Tập hợp tên pictures.

dce3d73884ac8c83.png

Bạn không cần tạo tài liệu. Bạn sẽ thêm ảnh theo chương trình khi ảnh mới được lưu trữ trong Cloud Storage và được Vision API phân tích.

Nhấp vào Save.

Firestore tạo tài liệu mặc định đầu tiên trong tập hợp mới tạo, bạn có thể yên tâm xoá tài liệu đó vì tài liệu đó không chứa thông tin hữu ích nào:

63e95c844b3f79d3.pngS

Các tài liệu được tạo theo chương trình trong bộ sưu tập của chúng tôi sẽ chứa 4 trường:

  • name (chuỗi): tên tệp của hình ảnh đã tải lên, cũng là khoá của tài liệu
  • nhãn (mảng chuỗi): nhãn của các mục được nhận dạng bằng Vision API
  • color (chuỗi): mã màu thập lục phân của màu chủ đạo (ví dụ: #ab12ef)
  • Đã tạo (ngày): dấu thời gian khi siêu dữ liệu của hình ảnh này được lưu trữ
  • hình thu nhỏ (boolean): một trường tùy chọn sẽ hiển thị và đúng nếu đã được tạo một hình thu nhỏ cho ảnh này

Vì chúng ta sẽ tìm kiếm trong Firestore để tìm những bức ảnh có hình thu nhỏ và sắp xếp theo ngày tạo, chúng ta sẽ cần tạo một chỉ mục tìm kiếm.

Bạn có thể tạo chỉ mục bằng lệnh sau trong Cloud Shell:

gcloud firestore indexes composite create \
  --collection-group=pictures \
  --field-config field-path=thumbnail,order=descending \
  --field-config field-path=created,order=descending

Hoặc bạn cũng có thể thiết lập từ Cloud Console bằng cách nhấp vào Indexes trong cột điều hướng bên trái, rồi tạo một chỉ mục tổng hợp như minh hoạ dưới đây:

2236d3a024a59232.pngS

Nhấp vào Create. Quá trình tạo chỉ mục có thể mất vài phút.

8. Sao chép mã

Sao chép mã nếu bạn chưa truy cập vào lớp học lập trình trước đó:

git clone https://github.com/GoogleCloudPlatform/serverless-photosharing-workshop

Sau đó, bạn có thể chuyển đến thư mục chứa dịch vụ để bắt đầu xây dựng phòng thí nghiệm:

cd serverless-photosharing-workshop/services/image-analysis/java

Bạn sẽ có bố cục tệp sau đây cho dịch vụ:

4c2a18a2c8b69dc5.png.

9. Tìm hiểu mã dịch vụ

Bạn bắt đầu bằng cách xem cách bật Thư viện ứng dụng Java trong pom.xml bằng BOM:

Trước tiên, hãy mở tệp pom.xml liệt kê các phần phụ thuộc của ứng dụng Java; trọng tâm là việc sử dụng API Vision, Cloud Storage và Firestore

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>3.2.0-M3</version>
        <relativePath/> <!-- lookup parent from repository -->
    </parent>
    <groupId>services</groupId>
        <artifactId>image-analysis</artifactId>
        <version>0.0.1</version>
        <name>image-analysis</name>
        <description>Spring App for Image Analysis</description>
    <properties>
        <java.version>17</java.version>
        <maven.compiler.target>17</maven.compiler.target>
        <maven.compiler.source>17</maven.compiler.source>        
        <spring-cloud.version>2023.0.0-M2</spring-cloud.version>
        <testcontainers.version>1.19.1</testcontainers.version>
    </properties>
...
  <dependencyManagement>
    <dependencies>
        <dependency>
            <groupId>com.google.cloud</groupId>
            <artifactId>libraries-bom</artifactId>
            <version>26.24.0</version>
            <type>pom</type>
            <scope>import</scope>
        </dependency>
    </dependencies>
  </dependencyManagement>
— 
    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
                <dependency>
                        <groupId>org.springframework.cloud</groupId>
                        <artifactId>spring-cloud-function-web</artifactId>
                </dependency>
        <dependency>
            <groupId>com.google.cloud.functions</groupId>
            <artifactId>functions-framework-api</artifactId>
            <version>1.1.0</version>
            <type>jar</type>
        </dependency>
        <dependency>
            <groupId>com.google.cloud</groupId>
            <artifactId>google-cloud-firestore</artifactId>
        </dependency>
        <dependency>
            <groupId>com.google.cloud</groupId>
            <artifactId>google-cloud-vision</artifactId>
        </dependency>
        <dependency>
            <groupId>com.google.cloud</groupId>
            <artifactId>google-cloud-storage</artifactId>
        </dependency>        

Chức năng này được triển khai trong lớp EventController. Mỗi lần một hình ảnh mới được tải lên bộ chứa, dịch vụ sẽ nhận được thông báo để xử lý:

@RestController
public class EventController {
  private static final Logger logger = Logger.getLogger(EventController.class.getName());
    
  private static final List<String> requiredFields = Arrays.asList("ce-id", "ce-source", "ce-type", "ce-specversion");

  @RequestMapping(value = "/", method = RequestMethod.POST)
  public ResponseEntity<String> receiveMessage(
    @RequestBody Map<String, Object> body, @RequestHeader Map<String, String> headers) throws IOException, InterruptedException, ExecutionException {
...
}

Mã này sẽ tiếp tục xác thực tiêu đề Cloud Events:

System.out.println("Header elements");
for (String field : requiredFields) {
    if (headers.get(field) == null) {
    String msg = String.format("Missing expected header: %s.", field);
    System.out.println(msg);
    return new ResponseEntity<String>(msg, HttpStatus.BAD_REQUEST);
    } else {
    System.out.println(field + " : " + headers.get(field));
    }
}

System.out.println("Body elements");
for (String bodyField : body.keySet()) {
    System.out.println(bodyField + " : " + body.get(bodyField));
}

if (headers.get("ce-subject") == null) {
    String msg = "Missing expected header: ce-subject.";
    System.out.println(msg);
    return new ResponseEntity<String>(msg, HttpStatus.BAD_REQUEST);
} 

Lúc này, bạn có thể tạo một yêu cầu và đoạn mã này sẽ chuẩn bị một yêu cầu như vậy để gửi đến Vision API:

try (ImageAnnotatorClient vision = ImageAnnotatorClient.create()) {
    List<AnnotateImageRequest> requests = new ArrayList<>();
    
    ImageSource imageSource = ImageSource.newBuilder()
        .setGcsImageUri("gs://" + bucketName + "/" + fileName)
        .build();

    Image image = Image.newBuilder()
        .setSource(imageSource)
        .build();

    Feature featureLabel = Feature.newBuilder()
        .setType(Type.LABEL_DETECTION)
        .build();
    Feature featureImageProps = Feature.newBuilder()
        .setType(Type.IMAGE_PROPERTIES)
        .build();
    Feature featureSafeSearch = Feature.newBuilder()
        .setType(Type.SAFE_SEARCH_DETECTION)
        .build();
        
    AnnotateImageRequest request = AnnotateImageRequest.newBuilder()
        .addFeatures(featureLabel)
        .addFeatures(featureImageProps)
        .addFeatures(featureSafeSearch)
        .setImage(image)
        .build();
    
    requests.add(request);

Chúng tôi yêu cầu cung cấp 3 chức năng chính của Vision API:

  • Phát hiện nhãn: để tìm hiểu nội dung của những hình ảnh đó
  • Thuộc tính hình ảnh: để cung cấp các thuộc tính thú vị của hình ảnh (chúng ta quan tâm đến màu chủ đạo của hình ảnh)
  • Tìm kiếm an toàn: biết liệu hình ảnh đó có an toàn để hiển thị hay không (hình ảnh không được chứa nội dung người lớn / nội dung y tế / nội dung không phù hợp cho người xem chưa đến tuổi trưởng thành / nội dung bạo lực)

Lúc này, chúng ta có thể thực hiện lệnh gọi đến Vision API:

...
logger.info("Calling the Vision API...");
BatchAnnotateImagesResponse result = vision.batchAnnotateImages(requests);
List<AnnotateImageResponse> responses = result.getResponsesList();
...

Để tham khảo, dưới đây là phản hồi từ Vision API:

{
  "faceAnnotations": [],
  "landmarkAnnotations": [],
  "logoAnnotations": [],
  "labelAnnotations": [
    {
      "locations": [],
      "properties": [],
      "mid": "/m/01yrx",
      "locale": "",
      "description": "Cat",
      "score": 0.9959855675697327,
      "confidence": 0,
      "topicality": 0.9959855675697327,
      "boundingPoly": null
    },
    ✄ - - - ✄
  ],
  "textAnnotations": [],
  "localizedObjectAnnotations": [],
  "safeSearchAnnotation": {
    "adult": "VERY_UNLIKELY",
    "spoof": "UNLIKELY",
    "medical": "VERY_UNLIKELY",
    "violence": "VERY_UNLIKELY",
    "racy": "VERY_UNLIKELY",
    "adultConfidence": 0,
    "spoofConfidence": 0,
    "medicalConfidence": 0,
    "violenceConfidence": 0,
    "racyConfidence": 0,
    "nsfwConfidence": 0
  },
  "imagePropertiesAnnotation": {
    "dominantColors": {
      "colors": [
        {
          "color": {
            "red": 203,
            "green": 201,
            "blue": 201,
            "alpha": null
          },
          "score": 0.4175916016101837,
          "pixelFraction": 0.44456374645233154
        },
        ✄ - - - ✄
      ]
    }
  },
  "error": null,
  "cropHintsAnnotation": {
    "cropHints": [
      {
        "boundingPoly": {
          "vertices": [
            { "x": 0, "y": 118 },
            { "x": 1177, "y": 118 },
            { "x": 1177, "y": 783 },
            { "x": 0, "y": 783 }
          ],
          "normalizedVertices": []
        },
        "confidence": 0.41695669293403625,
        "importanceFraction": 1
      }
    ]
  },
  "fullTextAnnotation": null,
  "webDetection": null,
  "productSearchResults": null,
  "context": null
}

Nếu không có lỗi được trả về, chúng ta có thể tiếp tục. Đó là lý do chúng ta có khối if:

if (responses.size() == 0) {
    logger.info("No response received from Vision API.");
    return new ResponseEntity<String>(msg, HttpStatus.BAD_REQUEST);
}

AnnotateImageResponse response = responses.get(0);
if (response.hasError()) {
    logger.info("Error: " + response.getError().getMessage());
    return new ResponseEntity<String>(msg, HttpStatus.BAD_REQUEST);
}

Chúng ta sẽ lấy nhãn của những sự vật, danh mục hoặc chủ đề được nhận dạng trong ảnh:

List<String> labels = response.getLabelAnnotationsList().stream()
    .map(annotation -> annotation.getDescription())
    .collect(Collectors.toList());
logger.info("Annotations found:");
for (String label: labels) {
    logger.info("- " + label);
}

Chúng tôi muốn biết màu chủ đạo của hình ảnh:

String mainColor = "#FFFFFF";
ImageProperties imgProps = response.getImagePropertiesAnnotation();
if (imgProps.hasDominantColors()) {
    DominantColorsAnnotation colorsAnn = imgProps.getDominantColors();
    ColorInfo colorInfo = colorsAnn.getColors(0);

    mainColor = rgbHex(
        colorInfo.getColor().getRed(), 
        colorInfo.getColor().getGreen(), 
        colorInfo.getColor().getBlue());

    logger.info("Color: " + mainColor);
}

Hãy kiểm tra xem hình ảnh có an toàn để hiển thị không:

boolean isSafe = false;
if (response.hasSafeSearchAnnotation()) {
    SafeSearchAnnotation safeSearch = response.getSafeSearchAnnotation();

    isSafe = Stream.of(
        safeSearch.getAdult(), safeSearch.getMedical(), safeSearch.getRacy(),
        safeSearch.getSpoof(), safeSearch.getViolence())
    .allMatch( likelihood -> 
        likelihood != Likelihood.LIKELY && likelihood != Likelihood.VERY_LIKELY
    );

    logger.info("Safe? " + isSafe);
}

Chúng tôi đang kiểm tra các đặc điểm liên quan đến người lớn / giả mạo / nội dung y tế / nội dung bạo lực / không phù hợp cho người xem chưa đến tuổi trưởng thành để xem liệu các đặc điểm đó có khả năng hay rất có thể không.

Nếu kết quả tìm kiếm an toàn là phù hợp, chúng ta có thể lưu trữ siêu dữ liệu trong Firestore:

// Saving result to Firestore
if (isSafe) {
          ApiFuture<WriteResult> writeResult = 
               eventService.storeImage(fileName, labels,
                                       mainColor);
          logger.info("Picture metadata saved in Firestore at " + 
               writeResult.get().getUpdateTime());
}
...
  public ApiFuture<WriteResult> storeImage(String fileName, 
                                           List<String> labels, 
                                           String mainColor) {
    FirestoreOptions firestoreOptions = FirestoreOptions.getDefaultInstance();
    Firestore pictureStore = firestoreOptions.getService();

    DocumentReference doc = pictureStore.collection("pictures").document(fileName);

    Map<String, Object> data = new HashMap<>();
    data.put("labels", labels);
    data.put("color", mainColor);
    data.put("created", new Date());

    return doc.set(data, SetOptions.merge());
  }

10. Tạo hình ảnh ứng dụng bằng GraalVM

Trong bước không bắt buộc này, bạn sẽ tạo một JIT based app image, sau đó là Native Java app image bằng cách sử dụng GraalVM.

Để chạy bản dựng, bạn cần đảm bảo đã cài đặt và định cấu hình trình tạo hình ảnh gốc cũng như JDK thích hợp. Có một số lựa chọn.

To start, hãy tải GraalVM 22.3.x Community Edition xuống và làm theo hướng dẫn trên trang Cài đặt GraalVM.

Bạn có thể đơn giản hoá đáng kể quy trình này với sự trợ giúp của SDKMAN!

Để cài đặt cách phân phối JDK thích hợp bằng SDKman, hãy bắt đầu bằng cách sử dụng lệnh cài đặt:

sdk install java 17.0.8-graal

Hướng dẫn SDKman sử dụng phiên bản này, cho cả bản dựng JIT và AOT:

sdk use java 17.0.8-graal

Trong Cloudshell, để thuận tiện, bạn có thể cài đặt GraalVM và tiện ích native-image bằng những lệnh đơn giản sau:

# download GraalVM
wget https://download.oracle.com/graalvm/17/latest/graalvm-jdk-17_linux-x64_bin.tar.gz 
tar -xzf graalvm-jdk-17_linux-x64_bin.tar.gz

ls -lart

# configure Java 17 and GraalVM for Java 17
# note the name of the latest GraalVM version, as unpacked by the tar command
echo Existing JVM: $JAVA_HOME
cd graalvm-jdk-17.0.8+9.1

export JAVA_HOME=$PWD
cd bin
export PATH=$PWD:$PATH

echo JAVA HOME: $JAVA_HOME
echo PATH: $PATH

cd ../..

# validate the version with
java -version 

# observe
Java(TM) SE Runtime Environment Oracle GraalVM 17.0.8+9.1 (build 17.0.8+9-LTS-jvmci-23.0-b14)
Java HotSpot(TM) 64-Bit Server VM Oracle GraalVM 17.0.8+9.1 (build 17.0.8+9-LTS-jvmci-23.0-b14, mixed mode, sharing)

Trước tiên, hãy đặt các biến môi trường của dự án GCP:

export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)

Sau đó, bạn có thể chuyển đến thư mục chứa dịch vụ để bắt đầu xây dựng phòng thí nghiệm:

cd serverless-photosharing-workshop/services/image-analysis/java

Xây dựng hình ảnh của ứng dụng JIT:

./mvnw package

Quan sát nhật ký bản dựng trong cửa sổ dòng lệnh:

...
[INFO] Results:
[INFO] 
[INFO] Tests run: 6, Failures: 0, Errors: 0, Skipped: 0
[INFO] 
[INFO] 
[INFO] --- maven-jar-plugin:3.3.0:jar (default-jar) @ image-analysis ---
[INFO] Building jar: /home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis-0.0.1.jar
[INFO] 
[INFO] --- spring-boot-maven-plugin:3.2.0-M3:repackage (repackage) @ image-analysis ---
[INFO] Replacing main artifact /home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis-0.0.1.jar with repackaged archive, adding nested dependencies in BOOT-INF/.
[INFO] The original artifact has been renamed to /home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis-0.0.1.jar.original
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  15.335 s
[INFO] Finished at: 2023-10-10T19:33:25Z
[INFO] ------------------------------------------------------------------------

Tạo hình ảnh Gốc(sử dụng AOT):

./mvnw native:compile -Pnative

Quan sát nhật ký bản dựng trong thiết bị đầu cuối, bao gồm cả nhật ký bản dựng hình ảnh gốc:

Lưu ý rằng quá trình tạo bản dựng sẽ mất nhiều thời gian hơn, tuỳ thuộc vào máy bạn đang kiểm thử.

...
[2/7] Performing analysis...  [*********]                                                              (124.5s @ 4.53GB)
  29,732 (93.19%) of 31,905 classes reachable
  60,161 (70.30%) of 85,577 fields reachable
 261,973 (67.29%) of 389,319 methods reachable
   2,940 classes, 2,297 fields, and 97,421 methods registered for reflection
      81 classes,    90 fields, and    62 methods registered for JNI access
       4 native libraries: dl, pthread, rt, z
[3/7] Building universe...                                                                              (11.7s @ 4.67GB)
[4/7] Parsing methods...      [***]                                                                      (6.1s @ 5.91GB)
[5/7] Inlining methods...     [****]                                                                     (4.5s @ 4.39GB)
[6/7] Compiling methods...    [******]                                                                  (35.3s @ 4.60GB)
[7/7] Creating image...                                                                                 (12.9s @ 4.61GB)
  80.08MB (47.43%) for code area:   190,483 compilation units
  73.81MB (43.72%) for image heap:  660,125 objects and 189 resources
  14.95MB ( 8.86%) for other data
 168.84MB in total
------------------------------------------------------------------------------------------------------------------------
Top 10 packages in code area:                               Top 10 object types in image heap:
   2.66MB com.google.cloud.vision.v1p4beta1                   18.51MB byte[] for code metadata
   2.60MB com.google.cloud.vision.v1                           9.27MB java.lang.Class
   2.49MB com.google.protobuf                                  7.34MB byte[] for reflection metadata
   2.40MB com.google.cloud.vision.v1p3beta1                    6.35MB byte[] for java.lang.String
   2.17MB com.google.storage.v2                                5.72MB java.lang.String
   2.12MB com.google.firestore.v1                              4.46MB byte[] for embedded resources
   1.64MB sun.security.ssl                                     4.30MB c.oracle.svm.core.reflect.SubstrateMethodAccessor
   1.51MB i.g.xds.shaded.io.envoyproxy.envoy.config.core.v3    4.27MB byte[] for general heap data
   1.47MB com.google.cloud.vision.v1p2beta1                    2.50MB com.oracle.svm.core.hub.DynamicHubCompanion
   1.34MB i.g.x.shaded.io.envoyproxy.envoy.config.route.v3     1.17MB java.lang.Object[]
  58.34MB for 977 more packages                                9.19MB for 4667 more object types
------------------------------------------------------------------------------------------------------------------------
                        13.5s (5.7% of total time) in 75 GCs | Peak RSS: 9.44GB | CPU load: 6.13
------------------------------------------------------------------------------------------------------------------------
Produced artifacts:
 /home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis (executable)
 /home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis.build_artifacts.txt (txt)
========================================================================================================================
Finished generating '/home/user/serverless-photosharing-workshop/services/image-analysis/java/target/image-analysis' in 3m 57s.
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  04:28 min
[INFO] Finished at: 2023-10-10T19:53:30Z
[INFO] ------------------------------------------------------------------------

11. Tạo và xuất bản hình ảnh vùng chứa

Hãy tạo hình ảnh vùng chứa trong hai phiên bản khác nhau: một phiên bản là JIT image và một là Native Java image.

Trước tiên, hãy đặt các biến môi trường của dự án GCP:

export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)

Tạo hình ảnh JIT:

./mvnw spring-boot:build-image -Pji

Quan sát nhật ký bản dựng trong cửa sổ dòng lệnh:

[INFO]     [creator]     Timer: Saving docker.io/library/image-analysis-maven-jit:latest... started at 2023-10-10T20:00:31Z
[INFO]     [creator]     *** Images (4c84122a1826):
[INFO]     [creator]           docker.io/library/image-analysis-maven-jit:latest
[INFO]     [creator]     Timer: Saving docker.io/library/image-analysis-maven-jit:latest... ran for 6.975913605s and ended at 2023-10-10T20:00:38Z
[INFO]     [creator]     Timer: Exporter ran for 8.068588001s and ended at 2023-10-10T20:00:38Z
[INFO]     [creator]     Timer: Cache started at 2023-10-10T20:00:38Z
[INFO]     [creator]     Reusing cache layer 'paketo-buildpacks/syft:syft'
[INFO]     [creator]     Adding cache layer 'buildpacksio/lifecycle:cache.sbom'
[INFO]     [creator]     Timer: Cache ran for 200.449002ms and ended at 2023-10-10T20:00:38Z
[INFO] 
[INFO] Successfully built image 'docker.io/library/image-analysis-maven-jit:latest'
[INFO] 
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  43.887 s
[INFO] Finished at: 2023-10-10T20:00:39Z
[INFO] ------------------------------------------------------------------------

Tạo hình ảnh AOT(Gốc):

./mvnw spring-boot:build-image -Pnative

Quan sát nhật ký bản dựng trong thiết bị đầu cuối, bao gồm cả nhật ký bản dựng hình ảnh gốc.

Lưu ý:

  • quá trình tạo bản dựng sẽ mất nhiều thời gian hơn, tuỳ thuộc vào máy bạn đang kiểm thử
  • hình ảnh có thể được nén thêm bằng UPX, tuy nhiên có tác động tiêu cực nhỏ đến hiệu suất khởi động, do đó bản dựng này không sử dụng UPX – đây luôn là một sự đánh đổi nhỏ
...
[INFO]     [creator]     Saving docker.io/library/image-analysis-maven-native:latest...
[INFO]     [creator]     *** Images (13167702674e):
[INFO]     [creator]           docker.io/library/image-analysis-maven-native:latest
[INFO]     [creator]     Adding cache layer 'paketo-buildpacks/bellsoft-liberica:native-image-svm'
[INFO]     [creator]     Adding cache layer 'paketo-buildpacks/syft:syft'
[INFO]     [creator]     Adding cache layer 'paketo-buildpacks/native-image:native-image'
[INFO]     [creator]     Adding cache layer 'buildpacksio/lifecycle:cache.sbom'
[INFO] 
[INFO] Successfully built image 'docker.io/library/image-analysis-maven-native:latest'
[INFO] 
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  03:37 min
[INFO] Finished at: 2023-10-10T20:05:16Z
[INFO] ------------------------------------------------------------------------

Kiểm tra để đảm bảo hình ảnh đã được tạo:

docker images | grep image-analysis

Gắn thẻ và đẩy hai hình ảnh vào GCR:

# JIT image
docker tag image-analysis-maven-jit gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-jit
docker push gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-jit

# Native(AOT) image
docker tag image-analysis-maven-native gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-native
docker push  gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-native

12. Triển khai lên Cloud Run

Thời gian triển khai dịch vụ.

Bạn sẽ triển khai dịch vụ hai lần, một lần sử dụng hình ảnh JIT và lần thứ hai sử dụng hình ảnh AOT(Gốc). Cả hai lần triển khai dịch vụ sẽ xử lý song song cùng một hình ảnh từ bộ chứa để so sánh.

Trước tiên, hãy đặt các biến môi trường của dự án GCP:

export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)
gcloud config set project ${GOOGLE_CLOUD_PROJECT}
gcloud config set run/region 
gcloud config set run/platform managed
gcloud config set eventarc/location europe-west1

Triển khai hình ảnh JIT và quan sát nhật ký triển khai trong bảng điều khiển:

gcloud run deploy image-analysis-jit \
     --image gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-jit \
     --region europe-west1 \
     --memory 2Gi --allow-unauthenticated

...
Deploying container to Cloud Run service [image-analysis-jit] in project [...] region [europe-west1]
✓ Deploying... Done.                                                                                                                                                               
  ✓ Creating Revision...                                                                                                                                                           
  ✓ Routing traffic...                                                                                                                                                             
  ✓ Setting IAM Policy...                                                                                                                                                          
Done.                                                                                                                                                                              
Service [image-analysis-jit] revision [image-analysis-jvm-00009-huc] has been deployed and is serving 100 percent of traffic.
Service URL: https://image-analysis-jit-...-ew.a.run.app

Triển khai hình ảnh gốc và quan sát nhật ký triển khai trong bảng điều khiển:

gcloud run deploy image-analysis-native \
     --image gcr.io/${GOOGLE_CLOUD_PROJECT}/image-analysis-maven-native \
     --region europe-west1 \
     --memory 2Gi --allow-unauthenticated 
...
Deploying container to Cloud Run service [image-analysis-native] in project [...] region [europe-west1]
✓ Deploying... Done.                                                                                                                                                               
  ✓ Creating Revision...                                                                                                                                                           
  ✓ Routing traffic...                                                                                                                                                             
  ✓ Setting IAM Policy...                                                                                                                                                          
Done.                                                                                                                                                                              
Service [image-analysis-native] revision [image-analysis-native-00005-ben] has been deployed and is serving 100 percent of traffic.
Service URL: https://image-analysis-native-...-ew.a.run.app

13. Thiết lập trình kích hoạt Eventarc

Eventarc cung cấp một giải pháp chuẩn hoá để quản lý luồng thay đổi trạng thái, được gọi là sự kiện, giữa các dịch vụ vi mô được tách riêng. Khi được kích hoạt, Eventarc sẽ chuyển những sự kiện này thông qua gói thuê bao Pub/Sub đến nhiều điểm đến khác nhau (trong tài liệu này hãy xem Đích đến của sự kiện) đồng thời quản lý hoạt động phân phối, bảo mật, uỷ quyền, khả năng quan sát và xử lý lỗi cho bạn.

Bạn có thể tạo trình kích hoạt Eventarc để dịch vụ Cloud Run của bạn nhận thông báo về một sự kiện hoặc một tập hợp các sự kiện được chỉ định. Bằng cách chỉ định bộ lọc cho trình kích hoạt, bạn có thể định cấu hình định tuyến của sự kiện, bao gồm nguồn sự kiện và dịch vụ Cloud Run mục tiêu.

Trước tiên, hãy đặt các biến môi trường của dự án GCP:

export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)
gcloud config set project ${GOOGLE_CLOUD_PROJECT}
gcloud config set run/region 
gcloud config set run/platform managed
gcloud config set eventarc/location europe-west1

Cấp pubsub.publisher cho tài khoản dịch vụ Cloud Storage:

SERVICE_ACCOUNT="$(gsutil kms serviceaccount -p ${GOOGLE_CLOUD_PROJECT})"

gcloud projects add-iam-policy-binding ${GOOGLE_CLOUD_PROJECT} \
    --member="serviceAccount:${SERVICE_ACCOUNT}" \
    --role='roles/pubsub.publisher'

Thiết lập điều kiện kích hoạt Eventarc cho cả hình ảnh dịch vụ JIT và Native để xử lý hình ảnh:

gcloud eventarc triggers list --location=eu

gcloud eventarc triggers create image-analysis-jit-trigger \
     --destination-run-service=image-analysis-jit \
     --destination-run-region=europe-west1 \
     --location=eu \
     --event-filters="type=google.cloud.storage.object.v1.finalized" \
     --event-filters="bucket=uploaded-pictures-${GOOGLE_CLOUD_PROJECT}" \
     --service-account=${PROJECT_NUMBER}-compute@developer.gserviceaccount.com

gcloud eventarc triggers create image-analysis-native-trigger \
     --destination-run-service=image-analysis-native \
     --destination-run-region=europe-west1 \
     --location=eu \
     --event-filters="type=google.cloud.storage.object.v1.finalized" \
     --event-filters="bucket=uploaded-pictures-${GOOGLE_CLOUD_PROJECT}" \
     --service-account=${PROJECT_NUMBER}-compute@developer.gserviceaccount.com    

Lưu ý rằng 2 điều kiện kích hoạt đã được tạo:

gcloud eventarc triggers list --location=eu

14. Kiểm thử các phiên bản dịch vụ

Sau khi triển khai dịch vụ thành công, bạn sẽ đăng hình ảnh lên Cloud Storage, xem các dịch vụ của chúng tôi có được gọi hay không, Vision API trả về những nội dung gì và siêu dữ liệu có được lưu trữ trong Firestore hay không.

Quay lại Cloud Storage và nhấp vào bộ chứa chúng ta đã tạo ở đầu phòng thí nghiệm:

33442485a1d76921.pngS

Khi ở trong trang chi tiết về bộ chứa, hãy nhấp vào nút Upload files để tải ảnh lên.

Ví dụ: hình ảnh GeekHour.jpeg được cung cấp cùng với cơ sở mã trong /services/image-analysis/java. Chọn một hình ảnh rồi nhấn phím Open button:

d57529452f62bd32.png

Bây giờ, bạn có thể kiểm tra quá trình thực thi dịch vụ, bắt đầu bằng image-analysis-jit, sau đó là image-analysis-native.

Từ "hamburger" (Podcast), hãy chuyển đến dịch vụ Cloud Run > image-analysis-jit.

Nhấp vào Logs (Nhật ký) rồi quan sát kết quả:

ae1a4a94c7c7a166.png

Và quả thực, trong danh sách nhật ký, tôi có thể thấy dịch vụ JIT image-analysis-jit đã được gọi.

Nhật ký cho biết thời điểm bắt đầu và kết thúc thực thi dịch vụ. Và ở giữa, chúng ta có thể thấy các nhật ký mà chúng ta đã đặt vào hàm cùng với câu lệnh nhật ký ở cấp INFO. Chúng ta thấy:

  • Thông tin chi tiết về sự kiện kích hoạt chức năng của chúng tôi,
  • Kết quả thô từ lệnh gọi Vision API,
  • Nhãn được tìm thấy trong hình ảnh do chúng tôi tải lên,
  • Thông tin về màu chủ đạo,
  • Liệu hình ảnh có an toàn để hiển thị hay không,
  • Cuối cùng, những siêu dữ liệu về bức ảnh này đã được lưu trữ trong Firestore.

Bạn sẽ lặp lại quy trình cho dịch vụ image-analysis-native.

Từ "hamburger" (Podcast), hãy chuyển đến dịch vụ Cloud Run > image-analysis-native.

Nhấp vào Logs (Nhật ký) rồi quan sát kết quả:

4afe22833c1fd14c.pngS

Lúc này, bạn nên tìm hiểu xem liệu siêu dữ liệu của hình ảnh đã được lưu trữ trong Fiorestore hay chưa.

Lại từ "hamburger" nữa (Podcast), hãy chuyển đến phần Firestore. Trong tiểu mục Data (hiển thị theo mặc định), bạn sẽ thấy bộ sưu tập pictures có tài liệu mới được thêm vào, tương ứng với ảnh bạn vừa tải lên:

82d6c468956e7cfc.png.

15. Dọn dẹp (Không bắt buộc)

Nếu không có ý định tiếp tục sử dụng các phòng thí nghiệm khác trong chuỗi chương trình này, bạn có thể dọn dẹp các tài nguyên để tiết kiệm chi phí và trở thành một công dân tốt về công nghệ đám mây. Bạn có thể dọn dẹp từng tài nguyên như sau.

Xoá bộ chứa:

gsutil rb gs://${BUCKET_PICTURES}

Xoá hàm:

gcloud functions delete picture-uploaded --region europe-west1 -q

Xoá bộ sưu tập trên Firestore bằng cách chọn Xoá bộ sưu tập khỏi bộ sưu tập:

6cc86a7b88fdb4d3.pngS

Ngoài ra, bạn có thể xoá toàn bộ dự án theo cách sau:

gcloud projects delete ${GOOGLE_CLOUD_PROJECT} 

16. Xin chúc mừng!

Xin chúc mừng! Bạn đã triển khai thành công dịch vụ mã khoá đầu tiên của dự án!

Nội dung đã đề cập

  • Cloud Storage
  • Cloud Run
  • Cloud Vision API
  • Cloud Firestore
  • Hình ảnh Java gốc

Các bước tiếp theo