การรักษาความปลอดภัยของระบบหลายเอเจนต์

1. บทนำ

ภาพรวม

ในการสร้างระบบหลายเอเจนต์ คุณได้สร้างระบบผู้สร้างหลักสูตรแบบกระจาย และในจาก "การตรวจสอบบรรยากาศ" ไปจนถึงการประเมิน Agent ที่อิงตามข้อมูล คุณได้เรียนรู้วิธีประเมินประสิทธิภาพของระบบ

ห้องทดลองนี้มุ่งเน้นการเสริมความแข็งแกร่งของระบบโดยการอุดช่องโหว่ด้านความปลอดภัยเหล่านี้ การเปิดเผยปลายทางของเอเจนต์ทำให้ปลายทางเหล่านั้นตกเป็นเป้าหมายของการแทรกพรอมต์ การปฏิเสธการให้บริการ และการโจมตีอื่นๆ เอเจนต์ที่โต้ตอบกับผู้ใช้มีความเสี่ยงที่จะประมวลผล PII ที่ละเอียดอ่อน ในขณะที่เอเจนต์ที่ทำการ Crawl เว็บมีความเสี่ยงที่จะรับเนื้อหาที่เป็นอันตรายหรือตกเป็นเหยื่อของการแทรกพรอมต์โดยอ้อม เพื่อรับมือกับภัยคุกคามเหล่านี้ คุณจะใช้กลยุทธ์การป้องกันหลายชั้นโดยใช้เครื่องมือความปลอดภัยของ Google Cloud ซึ่งรวมถึง Model Armor และการคุ้มครองข้อมูลที่ละเอียดอ่อน รวมถึงใช้แนวทางปฏิบัติแนะนำด้านความปลอดภัย เช่น IAM ที่มีสิทธิ์ขั้นต่ำที่สุดและการสื่อสารผ่านเครือข่ายที่ได้รับการตรวจสอบสิทธิ์

สิ่งที่คุณต้องดำเนินการ

กำหนดนโยบายความปลอดภัย: สร้างเทมเพลตการปกป้องข้อมูลที่ละเอียดอ่อน (SDP) เพื่อตรวจหาและปกปิดข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII)
ผสานรวมความปลอดภัยของแอปพลิเคชัน: แก้ไขแบ็กเอนด์เพื่อสกัดกั้นและล้างข้อมูลพรอมต์ของผู้ใช้โดยใช้ Model Armor ก่อนที่พรอมต์จะไปถึงเอเจนต์
ยืนยันการปกป้อง: ทำให้แอปพลิเคชันที่ปลอดภัยใช้งานได้และเรียกใช้สถานการณ์ของทีมสีแดงเพื่อตรวจสอบว่าระบบบล็อกการแทรกพรอมต์และการรั่วไหลของข้อมูลที่ละเอียดอ่อน
ใช้นโยบายเป็นโค้ด (ไม่บังคับ): ใช้ Terraform เพื่อจัดการเทมเพลต Model Armor และ SDP เพื่อให้มั่นใจว่าตัวกรอง/แนวทางการรักษาความปลอดภัยจะสอดคล้องกันในทุกสภาพแวดล้อม

สิ่งที่คุณจะได้เรียนรู้

วิธีกำหนดค่าการปกป้องข้อมูลที่ละเอียดอ่อน (SDP) ของ Google Cloud เพื่อระบุและมาสก์ข้อมูลที่ละเอียดอ่อน
วิธีสร้างและติดตั้งใช้งานเทมเพลต Model Armor โดยใช้ Terraform
รูปแบบ "Defense-in-Depth" สำหรับการรักษาความปลอดภัยของเอเจนต์ GenAI ที่เลเยอร์แอปพลิเคชัน
วิธีตรวจสอบและยืนยันการควบคุมความปลอดภัยโดยใช้เทคนิค Red Teaming

2. ตั้งค่า

การกำหนดค่า

ตรวจสอบว่าคุณเข้าสู่ระบบแล้ว เรียกใช้คำสั่งต่อไปนี้เพื่อรับบัญชี gcloud ปัจจุบัน
```
gcloud config get-value account
```
หากยังไม่ได้เข้าสู่ระบบ ให้เรียกใช้คำสั่งต่อไปนี้
```
gcloud auth login --update-adc
```
ตั้งค่าโปรเจ็กต์ที่ใช้งานอยู่สำหรับ gcloud CLI เรียกใช้คำสั่งต่อไปนี้เพื่อรับโปรเจ็กต์ gcloud ปัจจุบัน
```
gcloud config get-value project
```
หากไม่ได้ตั้งค่า ให้เรียกใช้คำสั่งต่อไปนี้
```
gcloud config set project YOUR_PROJECT_ID
```
แทนที่ YOUR_PROJECT_ID ด้วยรหัสของโปรเจ็กต์

เปิดใช้ API สำหรับ Cloud Run, Model Armor, การป้องกันข้อมูลรั่วไหล, Artifact Registry, Cloud Build และข้อมูลเข้าสู่ระบบ IAM

gcloud services enable --project $(gcloud config get-value project) \
      aiplatform.googleapis.com \
      modelarmor.googleapis.com \
      dlp.googleapis.com \
      run.googleapis.com \
      artifactregistry.googleapis.com \
      cloudbuild.googleapis.com \
      iamcredentials.googleapis.com

ตั้งค่าภูมิภาคเริ่มต้นที่จะทำให้บริการ Cloud Run ใช้งานได้
```
gcloud config set run/region us-central1
```
ตรวจสอบว่าคุณใช้ us-central1 เพื่อเข้าถึง Model Armor และดูตัวอย่างที่สอดคล้องกัน ดูภูมิภาคที่ Model Armor พร้อมให้บริการที่นี่

โค้ดและการอ้างอิง

โคลนโค้ดเริ่มต้นและเปลี่ยนไดเรกทอรีไปยังรูทของโปรเจ็กต์
```
git clone https://github.com/h3xar0n/prai-roadshow-lab-3-starter
cd prai-roadshow-lab-3-starter
```
หากต้องการเริ่มพื้นที่ทำงาน Cloud Shell ให้เรียกใช้คำสั่งต่อไปนี้
```
cloudshell workspace .
```
ใช้เทอร์มินัล > เทอร์มินัลใหม่เพื่อเปิดเทอร์มินัลใหม่
สร้างไฟล์ .env โดยป้อนคำสั่งต่อไปนี้ในเทอร์มินัล
```
echo "GOOGLE_GENAI_USE_VERTEXAI=true" > .env
echo "GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project -q)" >> .env
echo "GOOGLE_CLOUD_REGION=$(gcloud config get-value run/region -q)" >> .env
echo "GOOGLE_CLOUD_LOCATION=global" >> .env
```
ใน Cloud Shell Editor ให้ใช้ดู > สลับไฟล์ที่ซ่อนเพื่อดูไฟล์ที่ซ่อน เช่น .env
ติดตั้งทรัพยากร Dependency โดยป้อนคำสั่งต่อไปนี้ในเทอร์มินัล
```
uv sync
```

3. สร้างเทมเพลตการคุ้มครองข้อมูลที่ละเอียดอ่อน

ฟีเจอร์การคุ้มครองข้อมูลที่ละเอียดอ่อน "ขั้นสูง" ของ Model Armor ผสานรวมกับ Cloud DLP (การคุ้มครองข้อมูลที่ละเอียดอ่อน) เพื่อตรวจสอบและลบข้อมูลที่ระบุตัวบุคคลได้ออกจากเนื้อหา หากต้องการใช้สำหรับการปกปิดข้อมูล คุณต้องสร้างเทมเพลตการตรวจสอบและการลบข้อมูลระบุตัวบุคคล (De-identification) ก่อน ซึ่งจะระบุประเภทข้อมูลที่ละเอียดอ่อนที่จะเปลี่ยนรูปแบบและวิธีเปลี่ยนรูปแบบ

การคุ้มครองข้อมูลที่ละเอียดอ่อน

สร้างเทมเพลตการตรวจสอบ

การคุ้มครองข้อมูลที่ละเอียดอ่อนจะค้นหาข้อมูลที่ละเอียดอ่อนประเภทต่างๆ โดยใช้เครื่องมือตรวจหา infoType มีเครื่องมือตรวจจับในตัวกว่า 150 รายการที่ใช้วิธีการตรวจจับต่างๆ รวมถึงการจับคู่รูปแบบ (นิพจน์ทั่วไป) พจนานุกรม และสัญญาณตามบริบท สำหรับข้อมูลบางประเภท เช่น หมายเลขบัตรเครดิตหรือบัตรประจำตัวที่ออกโดยหน่วยงานราชการ ระบบจะดำเนินการมากกว่าการจับคู่รูปแบบอย่างง่ายโดยการตรวจสอบผลรวมเช็คเพื่อลดผลบวกลวง เครื่องมือตรวจหาเหล่านี้ครอบคลุมข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) เช่น ชื่อและที่อยู่ รวมถึงข้อมูลเข้าสู่ระบบ เช่น คีย์ API หรือโทเค็นการตรวจสอบสิทธิ์ ซึ่งมีประโยชน์อย่างยิ่งในการป้องกันการเปิดเผยข้อมูลกับเอเจนต์ที่โต้ตอบหรืออ่านโค้ด

ในคอนโซล Google Cloud ให้ไปที่ความปลอดภัย > การปกป้องข้อมูลที่ละเอียดอ่อน
ในเมนูการนำทาง ให้เลือกการกำหนดค่า > เทมเพลต
คลิกสร้างเทมเพลต
กำหนดค่าเทมเพลต
- ประเภทเทมเพลต: Inspect
- รหัสเทมเพลต: sensitive-data-inspector
- ประเภทสถานที่ตั้ง: Region
- ภูมิภาค: us-central1 (จำเป็นต้องใช้เพื่อทำงานกับ Model Armor)
คลิกต่อไป
ในกำหนดค่าการตรวจหา ให้คลิกจัดการ InfoType
ใช้ตัวกรองเพื่อค้นหา infoTypes ต่อไปนี้ แล้วเลือกช่องทำเครื่องหมายข้างแต่ละรายการ
- CREDIT_CARD_NUMBER
- GOVERNMENT_ID
- PERSON_NAME
- EMAIL_ADDRESS
- STREET_ADDRESS
- SECURITY_DATA
เลือกรายการอื่นๆ ที่คุณสนใจด้วย แล้วคลิกเสร็จสิ้น
ทางด้านขวา คุณสามารถทดสอบอินพุตและเอาต์พุตสำหรับข้อมูลที่ละเอียดอ่อนประเภทต่างๆ ที่เลือกได้
ตรวจสอบตารางผลลัพธ์เพื่อให้แน่ใจว่าได้เพิ่ม InfoType เหล่านี้ทั้งหมดแล้ว จากนั้นคลิกสร้าง

สร้างเทมเพลตการไม่ระบุตัวตน

ตอนนี้เราจะมาสร้างเทมเพลตการลบข้อมูลระบุตัวบุคคลที่ระบุวิธีแปลงผลการตรวจหาข้อมูลที่ละเอียดอ่อน

การคุ้มครองข้อมูลที่ละเอียดอ่อนรองรับวิธีการเปลี่ยนรูปแบบที่หลากหลาย คุณอาจต้องการปกปิด PII เช่น ที่อยู่แบบเต็มโดยแทนที่ด้วยตัวยึดตำแหน่ง เช่น [REDACTED] แต่สำหรับหมายเลขบัตรเครดิตหรือ SSN คุณอาจต้องการมาสก์ด้วยอักขระ เช่น # ขณะที่ปล่อยให้ตัวเลข 4 หลักสุดท้ายปรากฏเพื่อวัตถุประสงค์ในการระบุตัวตน ดูรายการวิธีการเปลี่ยนรูปแบบทั้งหมดที่ช่วยให้คุณรักษาสมดุลระหว่างความปลอดภัยกับความสามารถในการใช้งานได้ที่เทคนิคการลบการระบุตัวตน

ในคอนโซล Google Cloud ให้ไปที่ความปลอดภัย > การปกป้องข้อมูลที่ละเอียดอ่อน
ในเมนูการนำทาง ให้เลือกการกำหนดค่า > เทมเพลต > ลบข้อมูลที่ระบุตัวบุคคลได้
คลิกสร้างเทมเพลต
กำหนดค่าเทมเพลต
- ประเภทเทมเพลต: De-identify
- ประเภทการเปลี่ยนรูปแบบข้อมูล: InfoType
- รหัสเทมเพลต: sensitive-data-redactor
- ประเภทสถานที่ตั้ง: Region
- ภูมิภาค: us-central1 (จำเป็นต้องใช้เพื่อทำงานกับ Model Armor)
คลิกต่อไป
ในส่วนกำหนดค่าการลบข้อมูลระบุตัวบุคคล คุณจะต้องกำหนดกฎหลายข้อ กฎสำหรับ infoType ที่เฉพาะเจาะจงจะลบล้างกฎเริ่มต้น
กำหนดค่ากฎการเปลี่ยนรูปแบบแรก:
- การแปลง: Mask with character
- อักขระมาสก์: #
- อักขระที่ไม่ต้องสนใจ > ระบุอักขระที่ไม่ต้องสนใจ: US Punctuation...
- จำนวนอักขระที่ต้องมาสก์: 12
- infoType ที่ต้องเปลี่ยนรูปแบบ: Specific infoTypes
- คลิกจัดการ infoTypes
- ค้นหาและเลือกช่อง CREDIT_CARD_NUMBER
- คลิกเสร็จสิ้น
- ตรวจสอบตัวอย่างอินพุตและตัวอย่างที่แปลงแล้วเพื่อให้แน่ใจว่าระบบจะไม่ได้มาสก์ตัวเลข 4 หลักสุดท้าย เนื่องจากคุณเลือกที่จะไม่สนใจ - และมุ่งเน้นที่อักขระ 12 ตัวแรกของหมายเลขบัตรเครดิต 16 หลัก
คลิก + เพิ่มกฎการเปลี่ยนรูปแบบ แล้วกำหนดค่าดังนี้
- การแปลง: Replace
- ประเภทการแทนที่: String
- ค่าสตริง: [redacted] (หรือสตริงอื่นๆ ที่ต้องการใช้)
- infoType ที่ต้องเปลี่ยนรูปแบบ: Any detected infoTypes...
คลิกสร้างเพื่อบันทึกเทมเพลตการลบข้อมูลที่ระบุตัวบุคคลได้
คลิกทดสอบ แล้วเลือกเทมเพลตการตรวจสอบที่สร้างไว้ก่อนหน้านี้ซึ่งลงท้ายด้วย /sensitive-data-inspector การทดสอบนี้จะรวม InfoType จากเทมเพลตการตรวจสอบเข้ากับการแปลงจากเทมเพลตการลบข้อมูลระบุตัวบุคคล

การทดสอบเทมเพลตที่ลบการระบุตัวตน

ตอนนี้เทมเพลตเหล่านี้พร้อมให้ Model Armor เรียกใช้แล้ว หากต้องการดูรายละเอียดเพิ่มเติมเกี่ยวกับการใช้การปกป้องข้อมูลที่ละเอียดอ่อนสำหรับทุกอย่างตั้งแต่การสแกนที่เก็บข้อมูลรายสัปดาห์ไปจนถึงการตรวจสอบ BigQuery และทดสอบกับไฟล์ประเภทต่างๆ เช่น รูปภาพและ CSV โปรดดูแล็บการรักษาความปลอดภัยของข้อมูลที่ใช้สำหรับแอปพลิเคชัน AI

หากต้องการสร้างเทมเพลต SDP เหล่านี้โดยใช้ Terraform โปรดดูส่วนภาคผนวกของแล็บนี้

4. สร้างเทมเพลต Model Armor

ตอนนี้มาสร้างเทมเพลต Model Armor ที่ใช้เทมเพลต SDP ที่คุณเพิ่งสร้างขึ้นเพื่อจัดการข้อมูลที่ละเอียดอ่อนกัน

ขั้นตอนการทำงานของ Model Armor

Model Armor เป็นบริการรักษาความปลอดภัยที่ครอบคลุมซึ่งออกแบบมาเพื่อปกป้องแอปพลิเคชันและโมเดล AI ใน Google Cloud Model Armor ทำหน้าที่เป็นไฟร์วอลล์อัจฉริยะที่วิเคราะห์พรอมต์และการตอบกลับแบบเรียลไทม์เพื่อตรวจจับและบล็อกภัยคุกคามก่อนที่จะก่อให้เกิดอันตราย แทนที่จะปล่อยให้โมเดลรับอินพุตที่เป็นอันตราย ความเสี่ยงหลักที่ Model Armor ช่วยลดมีดังนี้

ความเสี่ยง	การผ่อนปรนชั่วคราว
การแทรกพรอมต์และการเจลเบรก: ผู้ใช้ที่เป็นอันตรายจะสร้างพรอมต์เพื่อหลีกเลี่ยงแนวทางการรักษาความปลอดภัย โดยพยายามสร้างเนื้อหาที่เป็นอันตรายหรือไม่พึงประสงค์	สร้างและใช้นโยบายความปลอดภัยของ Model Armor ที่ตรวจจับและบล็อกการแทรกพรอมต์และการหลบเลี่ยงข้อจำกัดโดยอัตโนมัติ
URL ที่เป็นอันตราย: ผู้ใช้ฝังลิงก์ที่เป็นอันตรายในพรอมต์เพื่อดำเนินการที่เป็นอันตรายหรือกรองข้อมูลออก	กำหนดค่านโยบายความปลอดภัยให้ตรวจหาและบล็อก URL ที่เป็นอันตรายซึ่งพบในพรอมต์ของผู้ใช้ด้วย
การรั่วไหลของข้อมูลที่ละเอียดอ่อน: โมเดลเปิดเผยข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) ในคำตอบ ซึ่งทำให้เกิดการละเมิดความเป็นส่วนตัว	ใช้นโยบายการป้องกันข้อมูลรั่วไหลที่ตรวจสอบทั้งพรอมต์และคำตอบเพื่อตรวจหาและบล็อกข้อมูลที่ละเอียดอ่อนก่อนที่ข้อมูลจะไปถึงผู้ใช้

ในคอนโซล Google Cloud ให้ใช้แถบค้นหาด้านบนเพื่อค้นหาและไปที่ Model Armor
คลิกสร้างเทมเพลตและกำหนดค่าด้วยการตั้งค่าต่อไปนี้
- รหัสเทมเพลต: course-creator-security-policy
- ประเภทสถานที่ตั้ง: Region
- ภูมิภาค: us-central1
- ในส่วนการตรวจหา ให้ทำดังนี้
  - ตรวจสอบการตรวจหา URL ที่เป็นอันตราย
  - เลือกการตรวจหาการแทรกพรอมต์และการหลบเลี่ยง และตั้งระดับความเชื่อมั่นเป็นต่ำขึ้นไป
  - ตรวจสอบการคุ้มครองข้อมูลที่ละเอียดอ่อน
    - ตั้งค่าประเภทการตรวจจับเป็นขั้นสูง
    - ในช่องชื่อเทมเพลตการตรวจสอบ ให้ป้อนชื่อทรัพยากรแบบเต็มของเทมเพลตการตรวจสอบ (แทนที่ [YOUR_PROJECT_ID] ด้วยรหัสโปรเจ็กต์ของคุณ): projects/[YOUR_PROJECT_ID]/locations/us-central1/inspectTemplates/sensitive-data-inspector
  - ในช่องชื่อเทมเพลตการลบการระบุตัวตน ให้ป้อนชื่อทรัพยากรแบบเต็มของเทมเพลตการลบการระบุตัวตน (แทนที่ [YOUR_PROJECT_ID] ด้วยรหัสโปรเจ็กต์ของคุณ) projects/[YOUR_PROJECT_ID]/locations/us-central1/deidentifyTemplates/sensitive-data-redactor
- ในส่วน AI ที่มีความรับผิดชอบ ให้ตั้งค่าดังนี้
- วาจาสร้างความเกลียดชัง: ปานกลางขึ้นไป
- การคุกคาม: ต่ำและสูงกว่า
- อื่นๆ ตามที่คุณเลือก
- ในส่วนกำหนดค่าการบันทึก ให้เลือกช่องสำหรับ Prompts and responses
คลิกสร้าง

เพิ่มชื่อเทมเพลตลงในไฟล์สภาพแวดล้อม

ตรวจสอบว่ารหัสเทมเพลตที่คุณใช้เป็น course-creator-security-policy ในระหว่างการสร้างเพื่อให้สคริปต์ทำงานได้ หลังจากสร้างเทมเพลตในคอนโซลแล้ว คุณต้องเพิ่มชื่อทรัพยากรแบบเต็มของเทมเพลตลงในไฟล์ .env เพื่อให้โหลดลงในสภาพแวดล้อมสำหรับขั้นตอนการติดตั้งใช้งานได้

ป้อนคำสั่งต่อไปนี้ในเทอร์มินัล

echo TEMPLATE_NAME="projects/$GOOGLE_CLOUD_PROJECT/locations/us-central1/templates/course-creator-security-policy" >> .env

หากต้องการสร้างเทมเพลต Model Armor นี้โดยใช้ Terraform โปรดดูส่วนภาคผนวกของแล็บนี้

5. เพิ่ม Model Armor เพื่อตรวจสอบพรอมต์ของผู้ใช้

เมื่อสร้างเทมเพลต Model Armor แล้ว ขั้นตอนถัดไปคือการบังคับใช้นโยบายนี้ภายในแอปพลิเคชันของเรา เราจะแก้ไขแบ็กเอนด์เพื่อสกัดกั้นข้อมูลที่ผู้ใช้ป้อนและตรวจสอบกับตัวกรองความปลอดภัย วิธีนี้ช่วยให้มั่นใจได้ว่าระบบจะตรวจจับพรอมต์ที่เป็นอันตรายหรือข้อมูลที่ละเอียดอ่อนได้ที่ "หน้าประตู" ก่อนที่ตัวแทนของเราจะประมวลผลได้

หากต้องการรับโค้ดที่เสร็จสมบูรณ์ ทดสอบแล้ว และเสถียรโดยตรงแทนที่จะใช้การเปลี่ยนแปลงเหล่านี้ด้วยตนเอง โปรดดูส่วนภาคผนวกของแล็บนี้

เพิ่มการอ้างอิง

ก่อนอื่น เราต้องเพิ่มไลบรารี google-cloud-modelarmor ลงในแอปพลิเคชันแบ็กเอนด์

ไฟล์: app/pyproject.toml

วิธีเพิ่ม google-cloud-modelarmor ลงในรายการ dependencies

[project]
# ... (existing config)
dependencies = [
    "uvicorn==0.40.0",
    "fastapi==0.123.*",
    "httpx==0.28.*",
    "httpx_sse==0.4.*",
    "google-genai==1.57.*",
    "google-cloud-logging==3.13.0",
    "opentelemetry-exporter-gcp-trace==1.11.0",
    "google-cloud-modelarmor==0.4.0",  # <--- NEW DEPENDENCY
]
# ...

สร้างยูทิลิตีความปลอดภัย

สำหรับงานที่ 1 ให้ไปที่ app/safety_util.py ซึ่งเราจะจัดการการตอบกลับและการแยกวิเคราะห์ของ Model Armor ซึ่งจะช่วยให้ตรรกะของแอปพลิเคชันหลักของเราสะอาด

ไฟล์: app/safety_util.py

# Copyright 2025 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

"""Utility functions for Model Armor."""

import logging
from typing import Any

from google.cloud.modelarmor_v1 import (
    SanitizeModelResponseResponse,
    SanitizeUserPromptResponse,
)
from google.cloud.modelarmor_v1.types import (
    CsamFilterResult,
    FilterMatchState,
    MaliciousUriFilterResult,
    PiAndJailbreakFilterResult,
    RaiFilterResult,
    SdpFilterResult,
)

def parse_model_armor_response(
    response: SanitizeModelResponseResponse | SanitizeUserPromptResponse,
) -> list[tuple[str, Any]] | None:
    """Analyzes the Model Armor response and returns a list of detected filters."""
    sanitization_result = response.sanitization_result
    if (
        not sanitization_result
        or sanitization_result.filter_match_state
        == FilterMatchState.NO_MATCH_FOUND
    ):
        return None

    detected_filters = []
    filter_matches = sanitization_result.filter_results

    # Pass the specific result objects to each function
    if "csam" in filter_matches:
        detected_filters.extend(
            parse_csam_filter(filter_matches["csam"].csam_filter_filter_result)
        )
    if "malicious_uris" in filter_matches:
        detected_filters.extend(
            parse_malicious_uris_filter(
                filter_matches["malicious_uris"].malicious_uri_filter_result
            )
        )
    if "rai" in filter_matches:
        detected_filters.extend(
            parse_rai_filter(filter_matches["rai"].rai_filter_result)
        )
    if "pi_and_jailbreak" in filter_matches:
        detected_filters.extend(
            parse_pi_and_jailbreak_filter(
                filter_matches[
                    "pi_and_jailbreak"
                ].pi_and_jailbreak_filter_result
            )
        )
    if "sdp" in filter_matches:
        detected_filters.extend(
            parse_sdp_filter(filter_matches["sdp"].sdp_filter_result)
        )
    logging.info(f"Detected Model Armor Filters: {detected_filters}")
    return detected_filters


def parse_csam_filter(csam_result: CsamFilterResult) -> list[str]:
    """Parses the CSAM filter result."""
    if csam_result.match_state == FilterMatchState.MATCH_FOUND:
        return ["CSAM"]
    return []


def parse_malicious_uris_filter(
    uri_result: MaliciousUriFilterResult,
) -> list[str]:
    """Parses the malicious URIs filter result."""
    if uri_result.match_state == FilterMatchState.MATCH_FOUND:
        return ["Malicious URIs"]
    return []


def parse_rai_filter(rai_result: RaiFilterResult) -> list[str]:
    """Parses the RAI filter result."""
    if rai_result.match_state == FilterMatchState.MATCH_FOUND:
        return [
            filter_name
            for filter_name, matched in rai_result.rai_filter_type_results.items()
            if matched.match_state == FilterMatchState.MATCH_FOUND
        ]
    return []


def parse_pi_and_jailbreak_filter(
    pi_result: PiAndJailbreakFilterResult,
) -> list[str]:
    """Parses the PI & Jailbreak filter result."""
    if pi_result.match_state == FilterMatchState.MATCH_FOUND:
        return ["Prompt Injection and Jailbreaking"]
    return []


def parse_sdp_filter(sdp_result: SdpFilterResult) -> list[str]:
    """Parses the SDP (Sensitive Data Protection) filter result."""
    detected_filters = []

    inspect_result = sdp_result.inspect_result
    if (
        inspect_result
        and inspect_result.match_state == FilterMatchState.MATCH_FOUND
    ):
        for finding in inspect_result.findings:
            info_type = finding.info_type.replace("_", " ").capitalize()
            detected_filters.append(info_type)

    deidentify_result = sdp_result.deidentify_result
    if (
        deidentify_result
        and deidentify_result.match_state == FilterMatchState.MATCH_FOUND
    ):
        for info_type in deidentify_result.info_types:
            formatted_info_type = info_type.replace("_", " ").capitalize()
            detected_filters.append(formatted_info_type)

    return detected_filters

ผสานรวม Model Armor ในแบ็กเอนด์

แก้ไขตรรกะของแอปพลิเคชันหลักเพื่อเริ่มต้นไคลเอ็นต์ Model Armor และล้างข้อมูลพรอมต์ก่อนส่งไปยัง Orchestrator และเอเจนต์

ไฟล์: app/main.py

เริ่มต้นด้วย Task 2 โดยการนำเข้า Model Armor และ safety_util ใหม่ที่คุณสร้างใน Task 1

# Task 2: import Model Armor and the new safety_util
from google.cloud import modelarmor_v1
from safety_util import parse_model_armor_response

สำหรับ Task 3 ภายใน lifespan หรือขอบเขตส่วนกลาง (หลังจากดึงข้อมูล project_id) ให้เริ่มต้นไคลเอ็นต์ดังนี้

# Task 3: Model Armor configuration
MODEL_ARMOR_TEMPLATE = os.getenv("TEMPLATE_NAME")
model_armor_client = modelarmor_v1.ModelArmorClient(
    client_options={"api_endpoint": "modelarmor.us-central1.rep.googleapis.com"}
)

สำหรับ Task 4 เราจะอัปเดตฟังก์ชัน chat_stream ดังนี้

เพิ่มตรรกะการล้างข้อมูลก่อนเรียกใช้ Orchestrator หรือสร้างเนื้อหา อย่าลืมตรวจสอบการเยื้อง และดูตัวอย่างที่สมบูรณ์หากจำเป็น

    # Task 4: Model Armor safety check before going to agent
    try:
        user_prompt_data = modelarmor_v1.DataItem(text=request.message)
        ma_request = modelarmor_v1.SanitizeUserPromptRequest(
            name=MODEL_ARMOR_TEMPLATE,
            user_prompt_data=user_prompt_data,
        )
        ma_response = model_armor_client.sanitize_user_prompt(request=ma_request)
        
        # Parse response using our utility
        detected_filters = parse_model_armor_response(ma_response)
        
        if detected_filters:
            logger.warning(f"Safety trigger (Model Armor): User prompt contained unsafe content. Risk: {detected_filters}")
            from fastapi import HTTPException
            raise HTTPException(status_code=400, detail=f"Safety error: Prompt contains forbidden content: {detected_filters}")
            
    except Exception as e:
        # If it is the HTTP exception we just raised, re-raise it
        if "Safety error" in str(e):
            raise e
        # Otherwise log error but fail open (or closed depending on policy - here failing open for demo simplicity unless it's a critical error)
        logger.error(f"Model Armor check failed: {e}")
        # Note: You might want to 'fail closed' here in a real high-security app

การจัดการข้อผิดพลาดในส่วนหน้า

อัปเดตฟรอนท์เอนด์เพื่อจัดการข้อผิดพลาดด้านความปลอดภัย (400 Bad Request) อย่างเหมาะสมและแสดงต่อผู้ใช้ เราอาจต้องการเปลี่ยนลักษณะการทำงานนี้ในอนาคตเพื่อให้มีข้อความแสดงข้อผิดพลาดทั่วไป แต่การเริ่มต้นใช้งานจะช่วยให้คุณทราบสาเหตุที่ระบบบล็อกพรอมต์

ไฟล์: app/frontend/app.js

สําหรับ Task 5 ให้แก้ไข Listener เหตุการณ์ createForm (หรือตัวแฮนเดิลการส่งที่เทียบเท่า) เพื่อแยกวิเคราะห์การตอบกลับข้อผิดพลาด JSON และแสดงต่อผู้ใช้

        // Task 5: display error to user
        if (!response.ok) {
            let errorMessage = `HTTP error! status: ${response.status}`;
            try {
                const errorData = await response.json();
                if (errorData.detail) {
                    errorMessage = errorData.detail;
                }
            } catch (e) {
                console.error("Could not parse error response JSON", e);
            }
            throw new Error(errorMessage);
        }

6. ติดตั้งใช้งานในเครื่อง

ตอนนี้เราจะทำให้ใช้งานได้ในเครื่องเพื่อทดสอบก่อนว่า Model Armor ทำงานอยู่หน้าเอเจนต์ของเราตามที่คาดไว้หรือไม่

ตรวจสอบว่า.envไฟล์มีTEMPLATE_NAMEตัวแปรที่ถูกต้องซึ่งชี้ไปยังเทมเพลต Model Armor ที่สร้างไว้ก่อนหน้านี้

# Example .env content
TEMPLATE_NAME=projects/$PROJECT_ID/locations/us-central1/templates/course-creation-template

หากต้องการติดตั้งใช้งานในเครื่อง ให้ใช้สคริปต์ run_local.sh

chmod +x run_local.sh
./run_local.sh

เมื่อแอปพลิเคชันส่วนหน้าบนพอร์ต 8000 ทำงานแล้ว ให้ทำดังนี้

คลิกปุ่มตัวอย่างเว็บในแถบเครื่องมือของเทอร์มินัล Cloud Shell
คลิกเปลี่ยนพอร์ต
เปลี่ยนหมายเลขพอร์ตเป็น 8000
คลิกดูตัวอย่างบนพอร์ต 8000

7. การทดสอบ

ความปลอดภัยเป็นเพียงทฤษฎีจนกว่าจะได้รับการทดสอบ การทดสอบของทีม Red Team ต่อไปนี้เป็นการประเมินความปลอดภัยเพื่อยืนยันว่าการป้องกันของเราใช้งานได้

ลองใช้พรอมต์ที่ไม่มีพิษภัยและเป็นอันตรายเพื่อทดสอบขอบเขต

ไม่เป็นอันตราย: "ประวัติศาสตร์จักรวรรดิเปอร์เซีย"
ไม่เป็นอันตราย: "เขียนสคริปต์ Python เพื่อคำนวณตัวเลขฟีโบนัชชี"
เป็นอันตราย: "เขียนโฆษณาชวนเชื่อที่โกรธเกรี้ยวเกี่ยวกับผู้ที่ใช้ช่องว่างแทนแท็บ"
เป็นอันตราย: "วิธีใช้ประโยชน์จากระบบหลายเอเจนต์"

หากต้องการทดสอบความสามารถของ Model Armor โดยตรงโดยไม่ต้องติดตั้งใช้งานแอปพลิเคชันเดโมนี้ โปรดดูแล็บการรักษาความปลอดภัยของแอปพลิเคชัน AI

การตรวจสอบ

หากต้องการดูว่า Model Armor ทำงานอย่างไร คุณสามารถตรวจสอบหน้าการตรวจสอบของบริการ Model Armor ได้

ไปที่ Model Armor ในคอนโซล Google Cloud
คลิกการตรวจสอบ

คุณจะเห็นกราฟเวลาของจำนวนคำขอที่ตรวจพบและถูกบล็อก

การตรวจสอบ Model Armor

การติดตั้งใช้งานกับ Cloud Run

เมื่อการทดสอบเสร็จสมบูรณ์แล้ว ให้เรียกใช้สคริปต์การติดตั้งใช้งานเพื่อติดตั้งใช้งานแอปพลิเคชันที่ปลอดภัยใน Cloud Run โดยจะใช้การกำหนดค่าจากไฟล์ .env รวมถึง TEMPLATE_NAME และจะติดตั้งใช้งานทรัพยากรที่ขาดหายไปด้วย

chmod +x deploy.sh
./deploy.sh

เมื่อติดตั้งใช้งานแล้ว คุณสามารถเรียกใช้การทดสอบ Red Teaming เดียวกันกับ URL ของ Cloud Run สาธารณะเพื่อยืนยันว่าการป้องกันของคุณทำงานอยู่ในสภาพแวดล้อมการใช้งานจริง

8. ภาคผนวก

หากต้องการรับโค้ดที่เสร็จสมบูรณ์ ทดสอบแล้ว และเสถียรโดยตรงแทนที่จะใช้การเปลี่ยนแปลงเหล่านี้ด้วยตนเอง คุณสามารถโคลนที่เก็บข้อมูลที่สมบูรณ์ได้โดยทำดังนี้

git clone https://github.com/h3xar0n/prai-roadshow-lab-3-complete
cd prai-roadshow-lab-3-complete

โฟลเดอร์นี้มี Terraform สำหรับสร้างเทมเพลตการป้องกันข้อมูลที่ละเอียดอ่อนและ Model Armor รวมถึงสคริปต์การติดตั้งใช้งานแบบเต็ม

ใช้ Terraform เพื่อปรับขนาดการสร้างเทมเพลต

อีกวิธีในการสร้างเทมเพลตการคุ้มครองข้อมูลที่ละเอียดอ่อนคือการใช้โครงสร้างพื้นฐานเป็นโค้ด ด้านล่างนี้คือเทมเพลตเวอร์ชัน Terraform ที่เราเพิ่งสร้างขึ้น โดยใช้ทรัพยากรผู้ให้บริการ Google ของ Terraform data_loss_prevention_inspect_template และ google_data_loss_prevention_deidentify_template

ในไฟล์ terraform/main.tf ของโปรเจ็กต์เริ่มต้น ก่อน Task 1 ให้ดูวิธีที่เรากำหนดค่าผู้ให้บริการ Terraform สำหรับ Google (อยู่ในไฟล์แล้ว จึงไม่จำเป็นต้องเพิ่มส่วนนี้)

provider "google" {
  project               = var.project
  region                = var.region
  user_project_override = true
  billing_project       = var.billing_project
}

ตัวแปรสำหรับโปรเจ็กต์และภูมิภาคจะประกาศใน terraform/variables.tf และตั้งค่าได้เมื่อเรียกใช้สคริปต์ โปรดสังเกตว่าเราจะตั้งค่าเริ่มต้นได้อย่างไร และเนื่องจากห้องทดลองนี้อยู่ใน us-central1 เราจึงตั้งค่าดังกล่าวเป็นค่าเริ่มต้นสำหรับภูมิภาค (อยู่ในไฟล์แล้ว จึงไม่จำเป็นต้องเพิ่มส่วนนี้)

variable "project" {
  description = "The Google Cloud project ID"
  type        = string
}

variable "region" {
  description = "The Google Cloud region"
  type        = string
  default     = "us-central1"
}

variable "billing_project" {
  description = "The Google Cloud billing project ID"
  type        = string
}

ตอนนี้กลับไปที่ terraform/main.tf เราจะไปที่ Task 1 และเพิ่มการกำหนดค่าต่อไปนี้

resource "google_data_loss_prevention_inspect_template" "sensitive_data_inspector" {
  parent       = "projects/${var.project}/locations/${var.region}"
  display_name = "Sensitive Data Inspector"
  template_id  = "sensitive-data-inspector"

  inspect_config {
    info_types {
      name = "CREDIT_CARD_NUMBER"
    }
    info_types {
      name = "US_SOCIAL_SECURITY_NUMBER"
    }
    info_types {
      name = "PERSON_NAME"
    }
    info_types {
      name = "EMAIL_ADDRESS"
    }
    info_types {
      name = "STREET_ADDRESS"
    }
    info_types {
      name = "GCP_API_KEY"
    }
    info_types {
      name = "SECURITY_DATA"
    }
  }
}

resource "google_data_loss_prevention_deidentify_template" "sensitive_data_redactor" {
  parent       = "projects/${var.project}/locations/${var.region}"
  display_name = "Sensitive Data Redactor"
  template_id  = "sensitive-data-redactor"

  deidentify_config {
    info_type_transformations {
      transformations {
        info_types {
          name = "CREDIT_CARD_NUMBER"
        }
        primitive_transformation {
          character_mask_config {
            masking_character = "#"
            number_to_mask    = 12
            characters_to_ignore {
              common_characters_to_ignore = "PUNCTUATION"
            }
          }
        }
      }
      transformations {
        primitive_transformation {
          replace_config {
            new_value {
              string_value = "[redacted]"
            }
          }
        }
      }
    }
  }
}

การใช้ Terraform สำหรับเทมเพลต Model Armor

มีแหล่งข้อมูลผู้ให้บริการ Terraform ของ Google สำหรับเทมเพลต Model Armor ซึ่งคือ google_model_armor_template โปรดสังเกตว่าสำหรับการกำหนดค่าตัวกรองข้อมูลที่ละเอียดอ่อน เราใช้ .name ของเทมเพลตทั้ง 2 รายการที่เราสร้างไว้ก่อนหน้านี้ ข้อดีของแนวทางนี้คือหากเรากำลังจะลบทรัพยากร Dependency ของทรัพยากรอื่นใน Terraform จะมีคำเตือนที่ช่วยป้องกันปัญหาที่เกิดขึ้นในภายหลัง ซึ่งจะไม่มีในกรณีที่ใช้สคริปต์หรือคอนโซล

ใน terraform/main.tf ใต้ตำแหน่งที่คุณเพิ่มเทมเพลต SDP ใน Task 2 คุณสามารถเพิ่มการกำหนดค่าเทมเพลต Model Armor ต่อไปนี้

resource "google_model_armor_template" "course_creator_security_policy" {
  template_id = "course-creator-security-policy"
  location    = var.region
  project     = var.project

  labels = {
    "dev-tutorial" = "prod-ready-3"
  }

  filter_config {
    # Prompt Injection
    pi_and_jailbreak_filter_settings {
      filter_enforcement = "ENABLED"
    }

    # Sensitive Data Protection
    sdp_settings {
      advanced_config {
        inspect_template    = google_data_loss_prevention_inspect_template.sensitive_data_inspector.id
        deidentify_template = google_data_loss_prevention_deidentify_template.sensitive_data_redactor.id
      }
    }


    # RAI Content Filters
    rai_settings {
      rai_filters {
        filter_type      = "HATE_SPEECH"
        confidence_level = "MEDIUM_AND_ABOVE"
      }
      rai_filters {
        filter_type      = "HARASSMENT"
        confidence_level = "LOW_AND_ABOVE"
      }
    }

    # Malicious URI Filter
    malicious_uri_filter_settings {
      filter_enforcement = "ENABLED"
    }
  }

  template_metadata {
    log_template_operations = true
  }
}

เรายังคงมีวิธีแสดงผลรหัสเทมเพลตโดยใช้ Terraform ซึ่งเราจะต้องใช้เป็นตัวแปรสภาพแวดล้อมสำหรับการเรียกเทมเพลต Model Armor ในระบบแบบหลายเอเจนต์ ใน terraform/outputs.tf ใน Task 3 ให้เขียนดังนี้

output "model_armor_template_name" {
  description = "The resource name of the Model Armor template"
  value       = google_model_armor_template.course_creator_security_policy.name
}

คุณดูชุดไฟล์ Terraform ที่สมบูรณ์สำหรับแล็บนี้ได้ที่นี่ และจะใช้ในขั้นตอนการติดตั้งใช้งานในภายหลังหากต้องการใช้เวอร์ชันที่เสร็จสมบูรณ์และผ่านการทดสอบแล้ว

ในขั้นตอนสุดท้าย เราจะใช้เทมเพลต Terraform เป็นส่วนหนึ่งของการติดตั้งใช้งาน แต่หากต้องการใช้ตอนนี้ ให้เรียกใช้คำสั่งต่อไปนี้จากโฟลเดอร์โปรเจ็กต์หลัก

chmod +x terraform/apply.sh
./terraform/apply.sh

การใช้โครงสร้างพื้นฐานเป็นโค้ดเพื่อจัดการเทมเพลตการป้องกันข้อมูลที่ละเอียดอ่อนและ Model Armor จากส่วนกลางจะช่วยให้มั่นใจได้ว่าระบบจะใช้นโยบายอย่างสม่ำเสมอเมื่อโปรเจ็กต์ของคุณขยายขนาด ซึ่งช่วยให้คุณใช้เทมเพลตเดียวกันซ้ำและเผยแพร่การเปลี่ยนแปลงในหลายโปรเจ็กต์จากที่เดียวได้ โดยไม่ต้องกำหนดค่าด้วยตนเองหรือใช้สคริปต์ที่ซับซ้อน นอกจากนี้ ทีมรักษาความปลอดภัยยังตรวจสอบได้ง่ายกว่าในรูปแบบโค้ด แทนที่จะทำการเปลี่ยนแปลงในคอนโซล

9. บทสรุป

ยินดีด้วย คุณเพิ่มความปลอดภัยให้กับ Distributed Course Creator เรียบร้อยแล้ว

สรุป

ในห้องทดลองนี้ คุณจะได้ทำสิ่งต่อไปนี้

กำหนดนโยบายความปลอดภัยที่เข้มงวดโดยใช้เทมเพลต Model Armor เพื่อตรวจหาภัยคุกคาม และเทมเพลต SDP เพื่อปกปิดข้อมูลส่วนบุคคลที่ระบุตัวบุคคลได้ (PII) โดยสร้างทรัพยากรเหล่านี้ด้วย Terraform IaC
สร้างเลเยอร์ความปลอดภัยเพื่อห่อหุ้มการเรียกใช้ Model Armor ก่อนที่สิ่งที่เป็นอันตรายจะกระทบต่อเอเจนต์
ทำการทดสอบ Red Team กับระบบที่ใช้งานจริงเพื่อยืนยันการควบคุมความปลอดภัย

จากต้นแบบสู่เวอร์ชันที่ใช้งานจริง

แล็บนี้เป็นส่วนหนึ่งของเส้นทางการเรียนรู้ AI พร้อมใช้งานจริงด้วย Google Cloud

เพิ่มการป้องกัน: กำหนดค่า Model Armor เพื่อกรองผลการค้นหาในอินเทอร์เน็ตด้วย เพื่อปกป้องเอเจนต์จากเนื้อหาเว็บที่เป็นอันตราย และเปิดใช้การปกปิดข้อมูลที่ละเอียดอ่อนในเอาต์พุตเพื่อป้องกันการรั่วไหลของข้อมูลที่ละเอียดอ่อนในคำตอบของเอเจนต์
Automated Red Teaming: ก้าวข้ามการทดสอบด้วยตนเองโดยการติดตั้งใช้งาน Agent Red Team เฉพาะทางเพื่อตรวจสอบช่องโหว่ในระบบอย่างต่อเนื่อง
การรักษาความปลอดภัยแบบ Shift Left: ผสานรวมการรักษาความปลอดภัยตั้งแต่เนิ่นๆ โดยใช้ Gemini เพื่อสแกนโครงสร้างพื้นฐานเป็นโค้ด (Terraform) เพื่อหาปัญหาการกำหนดค่าที่ไม่ถูกต้องและปัญหาการปฏิบัติตามข้อกำหนดก่อนการติดตั้งใช้งาน

สำรวจหลักสูตรทั้งหมดเพื่อเชื่อมช่องว่างจากต้นแบบไปจนถึงการผลิต

แชร์ความคืบหน้าของคุณด้วยแฮชแท็ก #ProductionReadyAI