ข้อมูลเบื้องต้นเกี่ยวกับ Gemini 2.5 Pro ใน Google Cloud

ข้อมูลเบื้องต้นเกี่ยวกับ Gemini 2.5 Pro ใน Google Cloud

เกี่ยวกับ Codelab นี้

subjectอัปเดตล่าสุดเมื่อ เม.ย. 23, 2025
account_circleเขียนโดย Prashanth Subrahmanyam

1 ภาพรวม

บทนำ

Gemini 2.5 Pro เป็นโมเดลที่มีประสิทธิภาพสูงสุดของ Google สำหรับการเขียนโค้ดและความรู้เกี่ยวกับโลก

ซีรีส์ 2.5 นี้ทำให้โมเดล Gemini เป็นโมเดลการหาเหตุผลแบบผสม Gemini 2.5 Pro ใช้การคิดที่หลากหลายกับงานต่างๆ และใช้เครื่องมือต่างๆ เพื่อเพิ่มความแม่นยำในการตอบกลับ

Gemini 2.5 Pro มีดังนี้

  • การปรับปรุงที่สำคัญจากโมเดลก่อนหน้านี้ในด้านความสามารถต่างๆ เช่น การเขียนโค้ด การใช้เหตุผล และสื่อหลากรูปแบบ
  • เหตุผลเชิงชั้นนำของอุตสาหกรรมที่มีประสิทธิภาพล้ำสมัยในมาตรฐานการเปรียบเทียบคณิตศาสตร์และ STEM
  • โมเดลที่ยอดเยี่ยมสําหรับโค้ดที่มีการพัฒนาเว็บที่มีประสิทธิภาพมาก
  • เหมาะอย่างยิ่งสําหรับพรอมต์ที่ซับซ้อน ทั้งยังใช้งานได้รอบด้าน รวมถึงเป็นอันดับ 1 ใน LMSys

สิ่งที่คุณจะได้เรียนรู้

ในบทแนะนํานี้ คุณจะได้เรียนรู้วิธีใช้ Gemini API และ Google Gen AI SDK สําหรับ Python กับโมเดล Gemini 2.5 Pro

คุณจะทำภารกิจต่อไปนี้

  • สร้างข้อความจากพรอมต์ข้อความ
    • สร้างข้อความสตรีม
    • เริ่มแชทแบบหลายรอบ
    • ใช้เมธอดแบบไม่พร้อมกัน
  • กําหนดค่าพารามิเตอร์ของโมเดล
  • วิธีการตั้งค่าระบบ
  • ใช้ตัวกรองความปลอดภัย
  • ใช้การสร้างที่มีการควบคุม
  • นับโทเค็น
  • ประมวลผลข้อมูลหลายรูปแบบ (เสียง โค้ด เอกสาร รูปภาพ วิดีโอ)
  • ใช้การเรียกฟังก์ชันอัตโนมัติและการเรียกฟังก์ชันด้วยตนเอง
  • การดำเนินการกับโค้ด
  • ตัวอย่างโหมดการคิด

2 ก่อนเริ่มต้น

ข้อกำหนดเบื้องต้น

คุณต้องมีโปรเจ็กต์ Google Cloud ที่มีบัญชีสำหรับการเรียกเก็บเงินที่ถูกต้องก่อนจึงจะเริ่มต้นได้ โปรดเลือกโปรเจ็กต์ Google Cloud ที่ต้องการใช้

เราจะใช้ Colab Enterprise ซึ่งเป็นสภาพแวดล้อมแบบสมุดบันทึกที่จัดการร่วมกันและทำงานร่วมกันได้ โดยมีความสามารถด้านความปลอดภัยและการปฏิบัติตามข้อกำหนดของ Google Cloud เพื่อเรียกใช้โค้ดแล็บ

เปิดใช้ API ที่จำเป็น

คลิกปุ่มด้านล่างเพื่อเปิดใช้ API ที่จำเป็นสำหรับโค้ดแล็บนี้ในโปรเจ็กต์ Google Cloud ได้แก่ Vertex AI, Dataform และ Compute Engine

คัดลอกสมุดบันทึก Colab ไปยัง Google Cloud

คลิกปุ่มด้านล่างเพื่อเปิดสมุดบันทึกบทแนะนำใน Colab Enterprise ซึ่งจะสร้างสําเนาของ Colab Notebook ในโปรเจ็กต์ Google Cloud ปัจจุบัน ซึ่งจะช่วยให้คุณเรียกใช้สมุดบันทึกได้

มาเริ่มกันเลย

3 เริ่มต้นสภาพแวดล้อม

เมื่อสร้าง Colab Notebook แล้ว เราจะเรียกใช้โค้ดที่ระบุไว้ใน Notebook ได้ 2-3 ขั้นตอนแรกจะติดตั้ง Dependency และนําเข้าไลบรารีที่จําเป็น

ทำตามขั้นตอนใน "การเริ่มต้นใช้งาน"

ก่อนอื่น ให้เรียกใช้เซลล์ในส่วน "เริ่มต้นใช้งาน" ตามลําดับ

เซลล์โค้ดในส่วน "เริ่มต้นใช้งาน"

หมายเหตุ: คุณสามารถเรียกใช้เซลล์ได้โดยวางเคอร์เซอร์เมาส์เหนือเซลล์โค้ดที่ต้องการเรียกใช้ แล้วคลิกไอคอนไอคอนเรียกใช้เซลล์ เรียกใช้เซลล์

เรียกใช้เซลล์

เมื่อจบส่วนนี้ คุณจะทําสิ่งต่อไปนี้ได้

  • ติดตั้ง Google Gen AI SDK สําหรับ Python
  • นําเข้าไลบรารีที่จําเป็นสําหรับห้องทดลอง
  • ตั้งค่าโปรเจ็กต์ Google Cloud เพื่อใช้ Vertex AI

มาลองใช้ Gemini 2.5 Pro เพื่อสร้างข้อความกัน

4 สร้างข้อความด้วย Gemini

ในส่วนนี้ของโน้ตบุ๊ก คุณจะใช้ Gemini 2.5 Pro เพื่อสร้างการเติมข้อความ

ดําเนินการกับเซลล์ชุดถัดไปในโน้ตบุ๊ก โดยใช้เวลาอ่านโค้ดและทําความเข้าใจวิธีใช้ Google GenAI SDK

สร้างข้อความจากพรอมต์ข้อความ

เมื่อจบส่วนนี้ คุณจะมีความรู้ต่อไปนี้

  • วิธีระบุรูปแบบที่จะใช้
  • การสร้างเอาต์พุตแบบสตรีมมิงเทียบกับแบบไม่สตรีม
  • การใช้ความสามารถของแชทแบบหลายรอบของ SDK
  • การเรียกใช้ SDK แบบอะซิงโครนัส
  • การกําหนดค่าพารามิเตอร์ของโมเดล
  • การตั้งค่าวิธีการของระบบเพื่อปรับแต่งลักษณะการทํางานของโมเดล
  • การกำหนดค่าตัวกรองความปลอดภัยของเนื้อหา

ต่อไปเราจะดูวิธีส่งพรอมต์แบบหลายสื่อไปยัง Gemini

5 พรอมต์แบบหลายรูปแบบ

ในส่วนนี้ของ Notebook คุณจะใช้ Gemini 2.5 Pro เพื่อประมวลผลรูปภาพและวิดีโอ

เรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก โค้ดเซลล์สําหรับพรอมต์แบบหลายรูปแบบ

เมื่อจบส่วนนี้ คุณจะมีความรู้ต่อไปนี้

  • ส่งพรอมต์ที่ประกอบด้วยรูปภาพและข้อความ
  • ประมวลผลวิดีโอจาก URL

จากนั้นเราจะสร้างเอาต์พุตที่ชัดเจนและมีโครงสร้าง

6 เอาต์พุตที่มีโครงสร้าง

เมื่อใช้การตอบสนองของโมเดลในโค้ด สิ่งสำคัญคือเราต้องได้ผลลัพธ์ที่สอดคล้องกันและเชื่อถือได้จากโมเดล การสร้างที่มีการควบคุมช่วยให้คุณกําหนดสคีมาการตอบกลับเพื่อระบุโครงสร้างของเอาต์พุตของโมเดล ชื่อช่อง และประเภทข้อมูลที่คาดไว้สําหรับแต่ละช่องได้

เรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก เซลล์โค้ดสําหรับเอาต์พุตที่มีการควบคุม

ถัดไป เราจะมาดูวิธีกราวด์เอาต์พุตของโมเดล

7 โหมดความสูง

หากต้องการใช้ฐานความรู้ที่มีอยู่หรือให้ข้อมูลแบบเรียลไทม์แก่โมเดล คุณควรพิจารณาการกําหนดพื้นฐานเอาต์พุตของโมเดล

เมื่อใช้ Gemini และ Vertex AI คุณจะเชื่อมต่อแหล่งข้อมูลกับเอาต์พุตใน Google Search, เอาต์พุตของคำตอบฟังก์ชัน และสุดท้ายในโค้ดได้ การดำเนินการกับโค้ดช่วยให้โมเดลสร้างโค้ดและเรียกใช้โค้ดได้ จึงเรียนรู้จากผลลัพธ์และทําซ้ำเพื่อให้ได้เอาต์พุตสุดท้าย

เรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก เซลล์โค้ดเพื่อทดสอบการต่อกราวด์

ต่อไปเราจะดูความสามารถด้านการคิดของ Gemini 2.5 Pro

8 กำลังคิด

โหมดการคิดมีประโยชน์อย่างยิ่งสำหรับงานที่ซับซ้อนซึ่งต้องใช้การวางกลยุทธ์และการแก้ปัญหาซ้ำหลายรอบ โมเดล Gemini 2.5 เป็นโมเดลการคิดที่ใช้เหตุผลก่อนจะให้คำตอบ ส่งผลให้มีประสิทธิภาพการทำงานและความแม่นยำมากขึ้น

เรียกใช้เซลล์ต่อไปนี้ในสมุดบันทึก เมื่อดำเนินการดังกล่าว ให้สังเกตเอาต์พุตการคิดก่อนที่โมเดลจะแสดงเอาต์พุตจริง เซลล์โค้ดเพื่อแสดงเอาต์พุตการคิด

9 บทสรุป

ยินดีด้วย คุณได้เรียนรู้วิธีใช้ประโยชน์จากความสามารถของ Gemini 2.5 Pro โดยใช้ Google Gen AI SDK สําหรับ Python ซึ่งครอบคลุมการสร้างข้อความ มัลติโมดัล การกําหนดพื้นฐาน เอาต์พุตที่มีโครงสร้าง และความสามารถด้านการคิดขั้นสูง ตอนนี้คุณมีความรู้พื้นฐานในการเริ่มสร้างแอปพลิเคชันนวัตกรรมของคุณเองโดยใช้ SDK แล้ว Gemini 2.5 Pro ที่มีโหมดการคิดและให้เหตุผลที่มีประสิทธิภาพจะเปิดโอกาสใหม่ๆ และนำไปสู่นวัตกรรมใน Use Case ต่างๆ

ข้อมูลอ้างอิงเพิ่มเติม

คุณชอบ Codelab นี้ไหม