1. סקירה כללית
מבוא
Gemini 2.5 Pro הוא המודל החזק ביותר של Google לתכנות ולידע על העולם.
החל מהסדרה 2.5, המודלים של Gemini הם מודלים משולבים להסקת מסקנות. המודל Gemini 2.5 Pro יכול להפעיל יכולות חשיבה מתקדמות במגוון משימות, ולהשתמש בכלים כדי לשפר את הדיוק של התשובות.
Gemini 2.5 Pro כולל:
- שיפור משמעותי ביכולות של המודלים הקודמים, כולל תכנות, הסקת מסקנות ומולטימודיאליות.
- מובילים בתחום ההסקת מסקנות עם ביצועים מתקדמים בנקודות השוואה בתחומי המתמטיקה וה-STEM.
- מודל מדהים לקוד, עם פיתוח אינטרנט חזק במיוחד.
- מתאים במיוחד להנחיות מורכבות, אבל עדיין מגוון, כולל האפשרות מספר 1 ב-LMSys.
מה תלמדו
במדריך הזה תלמדו איך להשתמש ב-Gemini API וב-Google Gen AI SDK ל-Python עם המודל Gemini 2.5 Pro.
עליכם להשלים את המשימות הבאות:
- יצירת טקסט מהנחיות טקסט
- יצירת טקסט בסטרימינג
- התחלת שיחות עם זיכרון
- שימוש בשיטות אסינכרוניות
- הגדרת פרמטרים של מודל
- הוראות להגדרת המערכת
- שימוש בפילטרים לשמירה על הבטיחות
- שימוש ביצירה מבוקרת
- ספירת אסימונים
- עיבוד נתונים מולטי-מודאליים (אודיו, קוד, מסמכים, תמונות, סרטונים)
- שימוש בקריאה אוטומטית וידנית לפונקציות
- ביצוע קוד
- דוגמאות למצב חשיבה
2. לפני שמתחילים
דרישות מוקדמות
כדי להתחיל, צריך פרויקט ב-Google Cloud עם חשבון תקין לחיוב. בוחרים את הפרויקט ב-Google Cloud שבו רוצים להשתמש.
כדי להריץ את הקודלאב, נשתמש ב-Colab Enterprise, סביבת notebook מנוהלת ושיתופית עם יכולות האבטחה והתאימות של Google Cloud.
מפעילים את ממשקי ה-API הנדרשים
לוחצים על הלחצן שלמטה כדי להפעיל את ממשקי ה-API הנדרשים לקודלאב הזה בפרויקט ב-Google Cloud: Vertex AI, Dataform ו-Compute Engine.
העתקת קובץ ה-notebook של Colab ל-Google Cloud
לוחצים על הלחצן שלמטה כדי לפתוח את המדריך ב-Colab Enterprise. כך נוצר עותק של ה-notebook ב-Colab בפרויקט הנוכחי ב-Google Cloud, שיאפשר לכם להריץ את ה-notebook.
קדימה, מתחילים!
3. איך מפעילים את הסביבה
עכשיו, אחרי שיצרנו את מסמך ה-notebook ב-Colab, אנחנו יכולים להריץ את הקוד שמופיע במסמך. בשלבים הראשונים מתקינים את הרכיבים התלויים וייבאים את הספריות הנדרשות.
מבצעים את השלבים שמפורטים בקטע 'תחילת העבודה'
קודם כול, מריצים את התאים בקטע 'תחילת העבודה', אחד אחרי השני.
הערה: כדי להריץ תא, מעבירים את סמן העכבר מעל תא הקוד שרוצים להריץ ולוחצים על סמל הרצת התא .
בסוף הקטע הזה תבצעו את הפעולות הבאות:
- התקנת Google Gen AI SDK ל-Python
- ייבוא הספריות הנדרשות למעבדה
- הגדרת פרויקט ב-Google Cloud לשימוש ב-Vertex AI
עכשיו נשתמש ב-Gemini 2.5 Pro כדי ליצור טקסט
4. יצירת טקסט באמצעות Gemini
בקטע הזה של המחברות, תשתמשו ב-Gemini 2.5 Pro כדי ליצור השלמות טקסט.
מריצים את הקבוצה הבאה של התאים במסמך, ומקפידים לקרוא את הקוד ולהבין איך משתמשים ב-Google GenAI SDK.
בסוף הקטע הזה תלמדו את הנושאים הבאים:
- איך מציינים את המודל שבו רוצים להשתמש.
- יצירת פלט ללא סטרימינג לעומת יצירת פלט בסטרימינג.
- שימוש ביכולת של ה-SDK לנהל שיחות עם זיכרון.
- קריאה ל-SDK באופן אסינכרוני.
- הגדרת הפרמטרים של המודל.
- הגדרת הוראות מערכת להתאמה אישית של התנהגות המודל.
- הגדרת מסנני בטיחות תוכן.
בהמשך נסביר איך שולחים הנחיות רב-מודאליות ל-Gemini
5. הנחיות במגוון מצבים
בקטע הזה של המחברת, תשתמשו ב-Gemini 2.5 Pro כדי לעבד תמונות וסרטונים.
מריצים את התאים הבאים ב-notebook.
בסוף הקטע הזה תלמדו את הנושאים הבאים:
- שולחים הנחיה שכוללת תמונה וטקסט.
- עיבוד סרטון מכתובת URL
בשלב הבא ניצור פלט מובנה ומוגדר היטב
6. פלטים מובְנים
כשמשתמשים בתגובה של מודלים בקוד, חשוב לקבל מהמודל פלט עקבי ואמין. יצירת נתונים מבוקרת מאפשרת לכם להגדיר סכימה של תגובה כדי לציין את המבנה של הפלט של מודל, את שמות השדות ואת סוג הנתונים הצפוי לכל שדה.
מריצים את התאים הבאים ב-notebook.
בהמשך נראה איך לבחון את הפלט של המודלים
7. נקודת התייחסות
אם אתם רוצים להשתמש בבסיס ידע קיים או לספק מידע בזמן אמת למודל, כדאי לכם לבדוק את האופן שבו מתבצעת ההתאמה של הפלט של המודל.
בעזרת Gemini ו-Vertex AI, אפשר לבסס את הפלט בחיפוש Google, בפלט של תשובות הפונקציות ולבסוף בקוד עצמו. באמצעות היכולת הזו, המודל יכול ליצור קוד ולהריץ אותו, וכך ללמוד מהתוצאות ולבצע איטרציות כדי לקבל את הפלט הסופי.
מריצים את התאים הבאים ב-notebook.
בהמשך נראה את יכולות החשיבה של Gemini 2.5 Pro
8. מעבד
מצב החשיבה שימושי במיוחד למשימות מורכבות שדורשות כמה סיבובים של תכנון אסטרטגיה ופתרון איטרטיבי. למודלים של Gemini 2.5 יש יכולות מתקדמות של הסקת מסקנות ברמה מרשימה לחלוטין. כתוצאה מכך, המשתמשים יכולים ליהנות מתשובות מדויקות יותר שמבוססות על ביצועים משופרים.
מריצים את התאים הבאים ב-notebook. כשעושים זאת, אפשר לראות את הפלט של תהליך החשיבה לפני שהמודל מציג את הפלט בפועל.
9. סיכום
מזל טוב! למדתם איך להשתמש ביכולות של Gemini 2.5 Pro באמצעות Google Gen AI SDK ל-Python, תוך התמקדות ביצירת טקסט, במודל רב-מודלי, ביצירת קשר, בפלט מובנה וביכולות החשיבה המתקדמות שלו. עכשיו יש לכם את הידע הבסיסי כדי להתחיל לפתח אפליקציות חדשניות משלכם באמצעות ה-SDK. Gemini 2.5 Pro, עם מצב החשיבה וההסקה המסקנות המתקדם שלו, פותח אפשרויות חדשות ומאפשר חדשנות בתרחישי שימוש שונים.
מקורות מידע נוספים
- מאמרי העזרה של Google Gen AI SDK
- במאגר של Google Cloud Generative AI ב-GitHub תוכלו למצוא מסמכי notebook נוספים.
- אפשר לבדוק מודלים של AI ב-Model Garden.