1. ภาพรวม
บทนำ
Gemini 2.5 Pro เป็นโมเดลที่แข็งแกร่งที่สุดของ Google สำหรับการเขียนโค้ดและความรู้เกี่ยวกับโลก
โมเดล Gemini ในซีรีส์ 2.5 เป็นโมเดลการให้เหตุผลแบบไฮบริดแล้ว Gemini 2.5 Pro สามารถใช้เวลาคิดวิเคราะห์นานขึ้นในงานต่างๆ และใช้เครื่องมือเพื่อเพิ่มความแม่นยำของคำตอบให้ได้มากที่สุด
Gemini 2.5 Pro มีคุณสมบัติดังนี้
- ได้รับการปรับปรุงอย่างมากจากโมเดลก่อนหน้าในด้านความสามารถต่างๆ ซึ่งรวมถึงการเขียนโค้ด การให้เหตุผล และมัลติโมดัล
- เป็นผู้นำในอุตสาหกรรมด้านการให้เหตุผลด้วยประสิทธิภาพที่ล้ำสมัยในเกณฑ์มาตรฐานด้านคณิตศาสตร์และ STEM
- โมเดลที่ยอดเยี่ยมสำหรับโค้ด โดยเฉพาะการพัฒนาเว็บ
- เหมาะอย่างยิ่งสำหรับพรอมต์ที่ซับซ้อน ในขณะที่ยังคงมีความรอบด้าน รวมถึงเป็นอันดับ 1 ใน LMSys
สิ่งที่คุณจะได้เรียนรู้
ในบทแนะนำนี้ คุณจะได้เรียนรู้วิธีใช้ Gemini API และ Google Gen AI SDK สำหรับ Python กับโมเดล Gemini 2.5 Pro
คุณจะต้องทํางานต่อไปนี้
- สร้างข้อความจากพรอมต์ข้อความ
- สร้างข้อความสตรีม
- เริ่มแชทแบบหลายรอบ
- ใช้วิธีการแบบไม่พร้อมกัน
- กำหนดค่าพารามิเตอร์โมเดล
- ตั้งค่าคำสั่งของระบบ
- ใช้ตัวกรองความปลอดภัย
- ใช้การสร้างที่ควบคุม
- นับโทเค็น
- ประมวลผลข้อมูลหลายรูปแบบ (เสียง โค้ด เอกสาร รูปภาพ วิดีโอ)
- ใช้การเรียกใช้ฟังก์ชันอัตโนมัติและด้วยตนเอง
- การดำเนินการโค้ด
- ตัวอย่างโหมดการคิด
2. ก่อนเริ่มต้น
ข้อกำหนดเบื้องต้น
ก่อนที่จะเริ่มต้นใช้งานได้ คุณจะต้องมีโปรเจ็กต์ Google Cloud ที่มีบัญชีสำหรับการเรียกเก็บเงินที่ถูกต้อง โปรดเลือกโปรเจ็กต์ Google Cloud ที่ต้องการใช้
เราจะใช้ Colab Enterprise เพื่อเรียกใช้ Codelab ซึ่งเป็นสภาพแวดล้อมสมุดบันทึกที่มีการจัดการและทำงานร่วมกันได้ พร้อมความสามารถด้านความปลอดภัยและการปฏิบัติตามข้อกำหนดของ Google Cloud
เปิดใช้ API ที่จำเป็น
คลิกปุ่มด้านล่างเพื่อเปิดใช้ API ที่จำเป็นสำหรับ Codelab นี้ในโปรเจ็กต์ที่อยู่ในระบบคลาวด์ของ Google ได้แก่ Vertex AI, Dataform และ Compute Engine
คัดลอก Colab Notebook ไปยัง Google Cloud
คลิกปุ่มด้านล่างเพื่อเปิด Notebook บทแนะนำใน Colab Enterprise การดำเนินการนี้จะสร้างสำเนา Colab Notebook ในโปรเจ็กต์ที่อยู่ในระบบคลาวด์ Google Cloud ปัจจุบัน ซึ่งจะช่วยให้คุณเรียกใช้ Notebook ได้
มาเริ่มกันเลย
3. เริ่มต้นสภาพแวดล้อม
เมื่อสร้าง Colab Notebook แล้ว เราจะเรียกใช้โค้ดที่อยู่ใน Notebook ได้ ขั้นตอนแรกๆ จะเป็นการติดตั้งทรัพยากร Dependency และนำเข้าไลบรารีที่จำเป็น
ทำตามขั้นตอนในส่วนการเริ่มต้นใช้งาน
ก่อนอื่น ให้เรียกใช้เซลล์ในส่วน "เริ่มต้นใช้งาน" ทีละเซลล์

หมายเหตุ: คุณเรียกใช้เซลล์ได้โดยวางเคอร์เซอร์เมาส์เหนือเซลล์โค้ดที่ต้องการเรียกใช้ แล้วคลิกไอคอน
เรียกใช้เซลล์

เมื่อสิ้นสุดส่วนนี้ คุณจะทำสิ่งต่อไปนี้ได้
- ติดตั้ง Google Gen AI SDK สำหรับ Python
- นำเข้าไลบรารีที่จำเป็นสำหรับห้องทดลอง
- ตั้งค่าโปรเจ็กต์ Google Cloud เพื่อใช้ Vertex AI
ตอนนี้มาใช้ Gemini 2.5 Pro เพื่อสร้างข้อความกัน
4. สร้างข้อความด้วย Gemini
ในส่วนนี้ของ Notebook คุณจะใช้ Gemini 2.5 Pro เพื่อสร้างการเติมข้อความ
ดำเนินการต่อและรันชุดเซลล์ถัดไปใน Notebook โดยใช้เวลาอ่านโค้ดและทำความเข้าใจวิธีใช้ Google GenAI SDK

เมื่อจบส่วนนี้ คุณจะได้เรียนรู้สิ่งต่อไปนี้
- วิธีระบุโมเดลที่จะใช้
- การสร้างเอาต์พุตแบบไม่สตรีมเทียบกับการสตรีม
- การใช้ความสามารถในการแชทแบบหลายรอบของ SDK
- เรียกใช้ SDK แบบไม่พร้อมกัน
- การกำหนดค่าพารามิเตอร์ของโมเดล
- การตั้งค่าคำสั่งของระบบเพื่อปรับแต่งลักษณะการทำงานของโมเดล
- การกำหนดค่าตัวกรองความปลอดภัยของเนื้อหา
ต่อไปเราจะมาดูวิธีส่งพรอมต์แบบมัลติโมดัลไปยัง Gemini
5. พรอมต์แบบหลายรูปแบบ
ในส่วนนี้ของ Notebook คุณจะใช้ Gemini 2.5 Pro เพื่อประมวลผลรูปภาพและวิดีโอ
ดำเนินการต่อและเรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก 
เมื่อจบส่วนนี้ คุณจะได้เรียนรู้สิ่งต่อไปนี้
- ส่งพรอมต์ที่ประกอบด้วยรูปภาพและข้อความ
- ประมวลผลวิดีโอจาก URL
จากนั้นเราจะสร้างเอาต์พุตที่มีโครงสร้างและกำหนดไว้อย่างดี
6. เอาต์พุตที่มีโครงสร้าง
เมื่อใช้การตอบกลับของโมเดลในโค้ด เราต้องได้รับเอาต์พุตที่สอดคล้องกันและเชื่อถือได้จากโมเดล การสร้างที่ควบคุมได้ช่วยให้คุณกำหนดสคีมาการตอบกลับเพื่อระบุโครงสร้างของเอาต์พุตของโมเดล ชื่อฟิลด์ และประเภทข้อมูลที่คาดไว้สำหรับแต่ละฟิลด์ได้
ดำเนินการต่อและเรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก 
ต่อไปเราจะมาดูวิธีอ้างอิงเอาต์พุตของโมเดล
7. โหมดความสูง
หากต้องการใช้ฐานความรู้ที่มีอยู่หรือให้ข้อมูลแบบเรียลไทม์แก่โมเดล คุณควรพิจารณาการเชื่อมต่อแหล่งข้อมูลเอาต์พุตของโมเดล
Gemini และ Vertex AI ช่วยให้คุณสามารถอ้างอิงเอาต์พุตใน Google Search, เอาต์พุตของคำตอบฟังก์ชัน และสุดท้ายคือในโค้ดเอง การดำเนินการโค้ดช่วยให้โมเดลสร้างและรันโค้ดได้ ซึ่งจะทำให้โมเดลเรียนรู้จากผลลัพธ์และทำซ้ำเพื่อรับเอาต์พุตสุดท้าย
ดำเนินการต่อและเรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก 
ต่อไปเราจะดูความสามารถในการคิดของ Gemini 2.5 Pro
8. กำลังคิด
โหมดการคิดมีประโยชน์อย่างยิ่งสำหรับงานที่ซับซ้อนซึ่งต้องใช้การวางแผนหลายรอบและการแก้ปัญหาแบบทำซ้ำ โมเดล Gemini 2.5 เป็นโมเดลการคิดที่ใช้เหตุผลก่อนจะให้คำตอบ ส่งผลให้มีประสิทธิภาพการทำงานและความแม่นยำมากขึ้น
เรียกใช้เซลล์ต่อไปนี้ใน Notebook เมื่อทำเช่นนั้น ให้สังเกตเอาต์พุตการคิดก่อนที่โมเดลจะแสดงเอาต์พุตจริง 
9. บทสรุป
ยินดีด้วย คุณได้เรียนรู้วิธีใช้ประโยชน์จากความสามารถของ Gemini 2.5 Pro โดยใช้ Google Gen AI SDK สำหรับ Python ซึ่งครอบคลุมการสร้างข้อความ ความสามารถในการประมวลผลข้อมูลหลายรูปแบบ การเชื่อมต่อแหล่งข้อมูล การแสดงผลที่มีโครงสร้าง และความสามารถในการคิดขั้นสูง ตอนนี้คุณมีความรู้พื้นฐานที่จะเริ่มสร้างแอปพลิเคชันนวัตกรรมของคุณเองโดยใช้ SDK แล้ว Gemini 2.5 Pro มาพร้อมโหมดการคิดและการให้เหตุผลอันทรงพลัง ซึ่งเปิดโอกาสใหม่ๆ และส่งเสริมให้เกิดนวัตกรรมในกรณีการใช้งานต่างๆ
ข้อมูลอ้างอิงเพิ่มเติม
- ดูเอกสารอ้างอิง Google Gen AI SDK
- สำรวจ Notebook อื่นๆ ในที่เก็บ GitHub ของ Generative AI ใน Google Cloud
- สำรวจโมเดล AI ใน Model Garden