การสร้างระบบการค้นหาคุณภาพระดับ Google ด้วย Vertex AI

1. ก่อนเริ่มต้น

ข้อควรทราบบางประการก่อนที่จะใช้งาน Codelab นี้ต่อ

ข้อกำหนดเบื้องต้น

  • ความเข้าใจเบื้องต้นเกี่ยวกับ LLM
  • ความเข้าใจขั้นพื้นฐานเกี่ยวกับระบบ RAG

สิ่งที่คุณจะได้เรียนรู้

  • วิธีสร้างเครื่องมือค้นหาที่มีคุณภาพของ Google ที่สามารถตอบคำถามของคุณจากข้อมูลที่คุณอัปโหลด
  • วิธีสร้าง Vertex AI Datastore
  • วิธีสร้าง Vertex AI Agent
  • วิธีใช้ประโยชน์จาก CloudRun เพื่อทำให้แอปพลิเคชันใช้งานได้

สิ่งที่คุณต้องมี

  • บัญชี Google Cloud
  • โปรเจ็กต์ Google Cloud
  • IDE ที่มีเทอร์มินัล

เกริ่นนำ

Google Search เป็นเครื่องมือที่มีประสิทธิภาพที่ใช้ดัชนีขนาดมหึมาของหน้าเว็บและเนื้อหาอื่นๆ เพื่อมอบผลการค้นหาที่เกี่ยวข้องกับคำค้นหาของผู้ใช้ ทั้งหมดนี้เกิดขึ้นได้ด้วยเทคนิคที่เรียกว่า Retrieval Augmented Generation (RAG) ซึ่งเป็นเทคนิคหลักใน AI สมัยใหม่

RAG ทำงานโดยการดึงข้อมูลข้อความที่เกี่ยวข้องจากคลังเอกสารก่อน ซึ่งทำได้โดยใช้วิธีการต่างๆ เช่น การจับคู่คีย์เวิร์ด ความคล้ายคลึงกันของความหมาย และแมชชีนเลิร์นนิง เมื่อดึงข้อมูลข้อความที่เกี่ยวข้องแล้ว ระบบจะใช้ข้อความเหล่านั้นเพื่อสร้างข้อมูลสรุปหรือคำตอบสำหรับคำค้นหาของผู้ใช้

ประโยชน์หลักของ RAG คือช่วยให้โมเดลภาษาหลีกเลี่ยงความไม่สมเหตุสมผลได้ ประสาทหลอนเป็นคำที่ใช้อธิบายการสร้างข้อความที่หลักฐานในคลังเอกสารไม่รองรับ ซึ่งอาจเกิดขึ้นได้เมื่อโมเดลภาษาไม่สามารถแยกความแตกต่างระหว่างข้อมูลที่เกี่ยวข้องกับข้อมูลที่ไม่เกี่ยวข้อง

RAG ช่วยป้องกันความไม่สมเหตุสมผลโดยการตรวจสอบข้อความที่สร้างขึ้นตามหลักฐานจากคลังเอกสารเสมอ ทำให้เป็นแหล่งข้อมูลที่น่าเชื่อถือและไว้ใจได้มากขึ้น

RAG เป็นเทคนิคอันทรงประสิทธิภาพที่นำไปใช้ในแอปพลิเคชันต่างๆ ซึ่งรวมถึงเครื่องมือค้นหา แชทบ็อต และระบบตอบคำถาม และมีแนวโน้มที่จะเข้ามามีบทบาทสำคัญยิ่งขึ้นใน AI ในอีกไม่กี่ปีข้างหน้า

ต่อไปนี้คือตัวอย่างการใช้ RAG ในทางปฏิบัติ

  • ระบบการค้นหาจำนวนมากใช้ RAG เพื่อสร้างผลการค้นหาที่เกี่ยวข้องกับคำค้นหาของผู้ใช้
  • แชทบ็อตใช้ RAG เพื่อสร้างคำตอบสำหรับคำถามของผู้ใช้ซึ่งมีข้อมูลที่เป็นประโยชน์และน่าสนใจ
  • ระบบตอบคำถามใช้ RAG เพื่อสร้างคำตอบสำหรับคำถามของผู้ใช้ที่ถูกต้องและครอบคลุม

RAG เป็นเทคนิคที่มีประโยชน์หลากหลายซึ่งใช้เพื่อสร้างข้อความในโดเมนและแอปพลิเคชันต่างๆ ได้ ซึ่งเป็นเครื่องมือทรงพลังที่ช่วยให้ AI ฉลาดและให้ข้อมูลได้ดีขึ้น

ใน Codelab นี้ เราจะสร้างระบบ RAG ที่ช่วยตอบคำถามของคุณด้วยคลังข้อมูลที่คุณให้ไว้ตามที่คุณอัปโหลด แพลตฟอร์ม RAG ที่พร้อมใช้งานทันทีที่มีชื่อว่า Vertex AI Search/Agent Builder จะช่วยเร่งการสร้างระบบ RAG ซึ่งทำให้คุณไม่ต้องเสียเวลาไปกับการรวบรวมเอกสาร แยกวิเคราะห์ แบ่งส่วน การสร้างการฝัง การขยายการค้นหา การดึงข้อมูลและการจัดอันดับผู้สมัคร แม้ว่าระบบ RAG ที่พร้อมใช้งานทันทีจะช่วยให้คุณเริ่มต้นใช้งานได้อย่างรวดเร็ว แต่ Google Cloud ยังมี API แยกต่างหากสำหรับทุกกระบวนการสร้างระบบ RAG แบบ DIY ของคุณเอง ซึ่งจะช่วยปรับแต่งระบบ RAG ให้เหมาะกับความต้องการทางธุรกิจของคุณ

สิ่งที่คุณจะสร้าง

เมื่อจบ Codelab นี้ คุณจะมีระบบ RAG ที่ใช้งานได้ ซึ่งจะช่วยตอบคำถามด้วยข้อมูลที่เป็นข้อเท็จจริง มีข้อมูลครบถ้วน และอ้างอิงด้วยการอ้างอิงที่ถูกต้อง

นอกจากนี้ คุณยังมีความเข้าใจที่ดีขึ้นเกี่ยวกับวิธีใช้ Vertex AI Search API เพื่อสร้างสถาปัตยกรรม RAG นี้ใน Google Cloud อีกด้วย นอกจากนี้ คุณจะได้เรียนรู้วิธีทำให้แอปพลิเคชันสถาปัตยกรรม RAG นี้ใช้งานได้ (พร้อมฟรอนท์เอนด์และแบ็กเอนด์) บน CloudRun ซึ่งเป็นแพลตฟอร์มแบบ Serverless ที่ทำให้แอปพลิเคชันใช้งานได้เป็นคอนเทนเนอร์บน Google Cloud

2d055ded874603a6.png

วิธีการทำงานของแอปพลิเคชัน

  • อัปโหลดข้อมูล: ผู้ใช้สามารถอัปโหลดคลังข้อมูลของตนเอง เช่น ไฟล์ PDF เป็นอินพุต
  • ถามคำค้นหาในแถบค้นหา: ผู้ใช้สามารถถามคำถามในแถบค้นหาตามคลังข้อมูลที่อัปโหลด
  • เรียกดูคำตอบ: ผู้ใช้สามารถเรียกดูผลการค้นหา/ผู้สมัครและตรวจสอบข้อเท็จจริง/ข้อเท็จจริงของคำตอบที่ดึงมาโดยอิงตามความเกี่ยวข้องของคำค้นหา

2. การตั้งค่าสภาพแวดล้อม

  1. ในคอนโซล Google Cloud ให้เลือกหรือสร้างโปรเจ็กต์ Google Cloud ในหน้าตัวเลือกโปรเจ็กต์
  2. ตรวจสอบว่าเปิดใช้การเรียกเก็บเงินสำหรับโปรเจ็กต์ Google Cloud แล้ว ดูวิธีตรวจสอบว่าเปิดใช้การเรียกเก็บเงินในโปรเจ็กต์แล้ว
  3. คุณจะใช้ Cloud Shell ซึ่งเป็นสภาพแวดล้อมบรรทัดคำสั่งที่ทำงานใน Google Cloud หากต้องการเข้าถึง ให้คลิก "เปิดใช้งาน Cloud Shell" ที่ด้านบนของคอนโซล Google Cloud

1829c3759227c19b.png

  1. เมื่อเชื่อมต่อกับ Cloud Shell แล้ว คุณต้องตรวจสอบว่าได้ตรวจสอบสิทธิ์แล้วและตั้งค่าโปรเจ็กต์เป็นรหัสโปรเจ็กต์โดยใช้คำสั่งต่อไปนี้
gcloud auth list
  1. เรียกใช้คำสั่งต่อไปนี้ใน Cloud Shell เพื่อยืนยันว่าคำสั่ง gcloud รู้จักโปรเจ็กต์ของคุณ
gcloud config list project
  1. หากไม่ได้ตั้งค่าโปรเจ็กต์ไว้ ให้ใช้คำสั่งต่อไปนี้เพื่อตั้งค่าโปรเจ็กต์
gcloud config set project <YOUR_PROJECT_ID>
  1. ตรวจสอบว่าเปิดใช้ API ต่อไปนี้แล้ว
  • Cloud Run
  • Vertex AI
  • Cloud Storage

อีกทางเลือกหนึ่งนอกเหนือจากการใช้คำสั่ง gcloud คือการดำเนินการผ่านคอนโซลโดยใช้ลิงก์นี้ ดูคำสั่งและการใช้งาน gcloud ในเอกสารประกอบ

3. ขั้นตอนที่ 1: สร้างที่เก็บข้อมูล GCP

  • ไปที่คอนโซลและพิมพ์ Cloud Storage ในแถบค้นหา
  • เลือก Cloud Storage จากผลการค้นหาที่แนะนำ 21d2bc910e71f7ec.png
  • คลิก "สร้างที่เก็บข้อมูล"

adf5c0382f6c3540.png

  • ระบุชื่อที่ไม่ซ้ำกันทั่วโลกสำหรับที่เก็บข้อมูล
  • คลิก "ดำเนินการต่อ"
  • ใน "ประเภทสถานที่ตั้ง" ให้เลือก "หลายภูมิภาค"
  • ในเมนูแบบเลื่อนลง ให้ตรวจสอบว่าได้เลือกตัวเลือก us (multiple regions in United States)

731aead7d8497725.png

  • คลิก "สร้างที่เก็บข้อมูล"

f7ac409ed9c4af21.png

4. ขั้นตอนที่ 2: สร้าง Vertex AI Datastore

  • พิมพ์ "Vertex AI Agent Builder" ในแถบค้นหาของหน้าคอนโซล
  • เลือกผลิตภัณฑ์แรก "Agent Builder"

c4a67b92bb7900e3.png

  • ในหน้าเครื่องมือสร้างตัวแทน ให้คลิก "พื้นที่เก็บข้อมูล" ตามที่แสดงในแถบนำทางด้านซ้าย

f86f67d344d398fb.png

  • คลิก "สร้างที่เก็บข้อมูล"

e64e771f33543f46.png

  • เลือก Cloud Storage เป็นพื้นที่เก็บข้อมูลของคุณ
  • คลิก "เลือก" ใต้ไอคอน Cloud Storage

3a8d22888e7eedc2.png

  • ในแท็บใต้ตัวเลือก "โฟลเดอร์" ให้คลิกปุ่ม "เรียกดู"
  • เลือกที่เก็บข้อมูลที่สร้างไว้ในขั้นตอนที่ 1
  • ในตัวเลือกด้านล่าง โปรดตรวจสอบว่าได้เลือก "เอกสารที่ไม่มีโครงสร้างที่ลิงก์ (JSONL ที่มีข้อมูลเมตา)"
  • คลิก ดำเนินการต่อ

13876b5d12dbe1fb.png

  • ในหน้าการกำหนดค่า ให้เลือก "ส่วนกลาง" เป็นตำแหน่งของพื้นที่เก็บข้อมูลของคุณ
  • ระบุชื่อที่ระบุได้ให้กับพื้นที่เก็บข้อมูลของคุณ
  • คลิก "สร้าง"

618b7a456fbffad4.png

บราวนี่:

  • คุณจะเห็นตัวเลือกการประมวลผลเอกสารเหนือปุ่ม "สร้าง"
  • คุณอาจลองใช้โปรแกรมแยกวิเคราะห์ต่างๆ ได้ เช่น โปรแกรมแยกวิเคราะห์ดิจิทัล, OCR หรือเลย์เอาต์
  • คุณยังเปิดใช้การแยกส่วนขั้นสูงและระบุขีดจำกัดขนาดกลุ่มที่กำหนดเองได้ด้วย

38471c1d3411610d.png

5. ขั้นตอนที่ 3: สร้าง Agent

  • เมื่อสร้างพื้นที่เก็บข้อมูลแล้ว ให้คลิกแอปในแถบนำทางทางด้านซ้ายและเลือก "แอป"
  • คลิกปุ่ม "สร้างแอป"
  • เลือกประเภทแอปเป็น "Search" (คุณยังสร้างตัวแทน บ็อตแบบสนทนา คำแนะนำ ฯลฯ ได้ด้วย)

ae5294e33f63567c.png

  • ตรวจสอบว่าคุณเลือก "ทั่วไป" ใต้ "เนื้อหา" นอกจากนั้น คุณยังเลือกสื่อหรือคําแนะนําตามพื้นที่เก็บข้อมูลและประเภทของข้อมูลและระบบที่ต้องการสร้างได้ด้วย
  • ตรวจสอบว่าได้เปิดทั้งฟีเจอร์รุ่น Enterprise และ LLM ขั้นสูงแล้ว
  • ระบุชื่อแอปพลิเคชันของคุณ
  • ระบุชื่อบริษัทของคุณ

f8a41c9751f7a8d3.png

  • โปรดเลือกภูมิภาคเป็น "ทั่วโลก"
  • คลิก "ต่อไป" ed17b18e094ba59a.png
  • ในหน้าจอถัดไป ให้เลือกพื้นที่เก็บข้อมูลที่สร้างในขั้นตอนที่ 2
  • คลิก "สร้าง"

bc77006e0025ae9e.png

6. ขั้นตอนที่ 4: วางแอปพลิเคชันบนแท่นชาร์จ

  • เปิดเทอร์มินัลในคอนโซล Google Cloud
  • โคลนที่เก็บ <sample_repository_link> โดยใช้คำสั่งต่อไปนี้

git clone https://github.com/kkrishnan90/vertex-ai-search-agent-builder-demo

  • เปลี่ยนไดเรกทอรีและไปยังที่เก็บที่โคลนโดยใช้คำสั่งต่อไปนี้

cd vertex-ai-search-agent-builder-demo

  • โครงสร้างโฟลเดอร์
  • แบ็กเอนด์ - จะเตรียมการใช้งาน API แบบ Python ที่จะช่วยสร้างปลายทางที่ใช้งานได้สำหรับฟรอนท์เอนด์ในการโต้ตอบ
  • ฟรอนท์เอนด์ - จะใช้แอปพลิเคชันที่อิงตามการตอบสนองและจะแสดง UI การดำเนินการนี้จะมีการเรียกระดับแอปพลิเคชันที่จำเป็นไปยังแบ็กเอนด์ผ่านปลายทางที่เหลือด้วย
  • Dockerfile - ไฟล์นี้จะมีคำสั่งที่เกี่ยวข้องทั้งหมดเพื่อสร้างคอนเทนเนอร์ Docker
  • ในรูทของไดเรกทอรีที่เก็บ ให้เรียกใช้คำสั่งต่อไปนี้ ซึ่งจะช่วยสร้างอิมเมจ Docker (หมายเหตุ: โปรดใช้แฟล็ก - - platform เมื่อสร้างคอนเทนเนอร์ Docker ใน Macbooks ที่ใช้ชิป Apple Silicon เช่น M1, M2 เป็นต้น คุณไม่จำเป็นต้องใช้ Flag นี้หากสร้างโดยใช้เครื่อง Windows หรือหากสถาปัตยกรรม CPU ของคุณใช้ Intel)

docker build --platform linux/amd64 -t your-image-name .

  • เมื่อสร้างคอนเทนเนอร์ Docker เรียบร้อยแล้ว ให้เรียกใช้คำสั่งต่อไปนี้เพื่อติดแท็กคอนเทนเนอร์ด้วยแท็กที่ถูกต้องเพื่อให้มั่นใจว่าคุณระบุเวอร์ชันของอิมเมจได้ อย่าลืมว่าอาจมีแอปพลิเคชันได้หลายเวอร์ชัน ดังนั้นจึงมีหลายเวอร์ชันเป็นแท็กในคอนเทนเนอร์ Docker แนวทางที่แนะนำจากมุมมองของ DevOps คือดูแลให้มีการใช้เวอร์ชันเสถียรล่าสุดเสมอ

docker tag your-image-name REGION-docker.pkg.dev/PROJECT-ID/REPOSITORY-NAME/IMAGE-NAME:TAG

  • เมื่อติดแท็กอิมเมจคอนเทนเนอร์ Docker สำเร็จแล้ว เราจะพุชอิมเมจไปยัง Google Artifact Registry (GAR) GAR เป็นแพลตฟอร์มที่มีการจัดการครบวงจรจาก Google เพื่อช่วยจัดการและควบคุมเวอร์ชันคอนเทนเนอร์ Docker เรียกใช้คำสั่งต่อไปนี้ที่จะพุชคอนเทนเนอร์ที่ติดแท็กข้างต้นไปยัง GAR ดูข้อมูลเพิ่มเติมได้ที่ลิงก์ต่อไปนี้ [ https://cloud.google.com/artifact-registry/docs/docker/pushing-and-pulling]

docker push REGION-docker.pkg.dev/PROJECT-ID/REPOSITORY-NAME/IMAGE-NAME:TAG

7. ขั้นตอนที่ 5: ทำให้แอปพลิเคชันใช้งานได้ใน Cloud Run

  • ย่อเทอร์มินัลของคุณ ค้นหา Cloud Run ในแถบค้นหาของคอนโซล Google Cloud
  • คลิกผลิตภัณฑ์ Cloud Run ที่แนะนำ

592103eb61c16738.png

  • คลิก "สร้างบริการ"
  • ในหน้าถัดไป ตรวจสอบว่าได้เลือก "ทำให้การแก้ไข 1 รายการจากอิมเมจคอนเทนเนอร์ที่มีอยู่ใช้งานได้" แล้ว
  • คลิก "เลือก" ด้านล่าง
  • คุณจะได้รับข้อความแจ้งพร้อมแถบนำทางที่ด้านขวา
  • ตรวจสอบว่าได้เลือก Artifact Registry เป็นแท็บ
  • ตรวจสอบว่าได้เลือกโปรเจ็กต์อย่างถูกต้อง
  • คลิกที่ลูกศรเพื่อขยายแอคคอร์เดียนบนลิงก์รูปภาพคอนเทนเนอร์ที่ทำให้ใช้งานได้แล้ว
  • เลือกคอนเทนเนอร์แท็กและขยาย (เลือกรายการล่าสุดที่ทำให้ใช้งานได้ด้วยแท็กล่าสุดที่ถูกต้อง เช่น v1, v2 ฯลฯ)
  • คลิกที่รูปภาพคอนเทนเนอร์ที่แสดงใต้ชื่อคอนเทนเนอร์แท็ก

aac35d55d7dd874e.png

  • ในพื้นที่กำหนดค่า
  • ระบุชื่อบริการสำหรับแอปพลิเคชัน Cloud Run (ซึ่งจะเป็นส่วนหนึ่งของ URL เมื่อคุณทำให้แอปพลิเคชันใช้งานได้บน Cloud Run)
  • เลือกภูมิภาคที่เหมาะสม (ในกรณีนี้ us-central1 หรืออะไรก็ได้ที่คุณต้องการ)
  • ในส่วนการตรวจสอบสิทธิ์
  • ตรวจสอบว่าได้เลือก "อนุญาตคำขอที่ไม่ผ่านการตรวจสอบสิทธิ์" แล้ว
  • ภายใต้การจัดสรรและการกำหนดราคา CPU
  • เลือก "มีการจัดสรร CPU ระหว่างการประมวลผลคำขอเท่านั้น"
  • แก้ไขการปรับขนาดบริการอัตโนมัติเป็น 1 (สำหรับเวอร์ชันที่ใช้งานจริง เราขอแนะนำให้เรียกใช้อินสแตนซ์ขั้นต่ำเพื่อจัดการกับปริมาณการรับส่งข้อมูลรายวัน หรือจะปล่อยไว้ 0 เช่น 0 ก็ได้)
  • ตั้งค่า "การควบคุมการรับส่งข้อมูลขาเข้า" เป็น "ทั้งหมด" เพื่ออนุญาตให้การรับส่งข้อมูลจากอินเทอร์เน็ตเข้าถึงแอปพลิเคชันของคุณ
  • คลิก "สร้าง"
  • การดำเนินการนี้จะทำให้อินสแตนซ์ Cloud Run ใช้งานได้และการจัดสรรอินสแตนซ์เดียวกันจะใช้เวลา 2-3 นาที

b8b147265b8d457b.png

  • เมื่อติดตั้งใช้งานแล้ว คุณจะเห็น URL ที่เผยแพร่ต่อสาธารณะซึ่งคุณเข้าถึงเว็บแอปพลิเคชันได้

1dfdb007c52581a1.png

8. วิธีการทำงาน

  • เมื่ออยู่ในหน้าแรกของแอปพลิเคชัน ให้คลิกปุ่ม "อัปโหลดเอกสาร"
  • อัปโหลดไฟล์ PDF
  • เมื่อการอัปโหลดเสร็จสมบูรณ์
  • คลิกแถบค้นหาที่ด้านบนของหน้าเว็บ
  • เริ่มค้นหาคำค้นหาที่เกี่ยวข้องกับเอกสารที่คุณอัปโหลด
  • เมื่อพิมพ์คำค้นหาและคลิกค้นหา ระบบจะแสดงคำตอบที่เกี่ยวข้องทั้งหมดจากเอกสารที่คุณเพิ่งอัปโหลด
  • คุณสามารถทดลองดูได้โดยดูโค้ดแบ็กเอนด์และเพิ่มการกำหนดค่าเพิ่มเติมดังต่อไปนี้
  • การเพิ่มตัวอย่าง
  • การเพิ่มกลุ่มการดึงข้อมูล
  • การเพิ่มคำตอบ
  • ปรับแต่งผลการค้นหาอันดับสูงสุดเพื่อช่วย LLM สรุปคำตอบ (เช่น ภาพรวม AI ใน Google Search)
  • นอกจากนี้ คุณยังเพิ่มแท็กข้อมูลเมตาขณะอัปโหลดเอกสารเป็นส่วนเสริมได้ด้วย วิธีนี้จะช่วยสร้างข้อมูลประกอบและหมวดหมู่ที่กรองได้

9. ล้างข้อมูล

โปรดทำตามขั้นตอนต่อไปนี้เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ใน Codelab นี้

  1. ในคอนโซล Google Cloud ให้ไปที่หน้าจัดการทรัพยากร
  2. ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
  3. ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเครื่องเพื่อลบโปรเจ็กต์
  4. นอกจากนี้ คุณยังไปที่ Cloud Run ในคอนโซล แล้วเลือกบริการที่คุณเพิ่งทำให้ใช้งานได้และลบได้

10. ขอแสดงความยินดี

ยินดีด้วย คุณได้สร้างระบบ RAG ที่พร้อมใช้งานทันทีโดยใช้โมเดลล้ำสมัยที่ขับเคลื่อนโดย Google และแสดงผลการค้นหาคุณภาพระดับ Google สำหรับคำค้นหาของคุณ Codelab นี้มีไว้เพื่อการสาธิตเท่านั้น ต้องมีการตั้งค่าความปลอดภัยและการป้องกันเพิ่มเติมสำหรับกรณีการใช้งานจริง ลิงก์ไปยังที่เก็บที่สมบูรณ์อยู่ที่นี่ การใช้ประโยชน์จาก Google Cloud เพียง 5 ขั้นตอนก็ทำให้เราสร้างระบบ RAG จากต้นทางถึงปลายทางได้ ซึ่งจะแสดงผลการค้นหาคุณภาพของ Google ให้คุณดูได้ทันทีโดยใช้เวลาเพียงไม่กี่นาที เมื่อ Generative AI และโมเดลภาษาขนาดใหญ่พัฒนาขึ้น การสร้างระบบ RAG ดังกล่าวก็ช่วยให้เราหลีกเลี่ยงอันตรายจากความไม่สมเหตุสมผลและข้อมูลที่ไม่มีการอ้างอิงปรากฏขึ้น

แม้ว่านี่จะเป็นเพียงจุดเริ่มต้น แต่เราทำงานอย่างน่ามหัศจรรย์ด้วย DIY RAG API ที่ปรับแต่งได้ทั้งหมด ซึ่งมอบความโปร่งใส พลัง และประสิทธิภาพที่มากขึ้นให้คุณจัดการทุกส่วนของกระบวนการไปป์ไลน์ได้อย่างมีประสิทธิภาพ