معرفی Gemini 2.5 Pro در Google Cloud

۱. مرور کلی

مقدمه

جمینی ۲.۵ پرو قوی‌ترین مدل گوگل برای کدنویسی و دانش جهانی است.

با سری ۲.۵، مدل‌های Gemini اکنون مدل‌های استدلال ترکیبی هستند! Gemini 2.5 Pro می‌تواند حجم گسترده‌ای از تفکر را در وظایف مختلف اعمال کند و از ابزارهایی برای به حداکثر رساندن دقت پاسخ استفاده کند.

جمینی ۲.۵ پرو:

  • پیشرفت قابل توجهی نسبت به مدل‌های قبلی در زمینه‌های قابلیت‌ها از جمله کدنویسی، استدلال و چندوجهی بودن.
  • پیشرو در صنعت در استدلال با عملکرد پیشرفته در معیارهای ریاضی و STEM.
  • یک مدل شگفت‌انگیز برای کدنویسی، با توسعه وب بسیار قوی.
  • مخصوصاً برای سوالات پیچیده مناسب است، در عین حال که کاملاً جامع است، از جمله رتبه ۱ در LMSys.

آنچه یاد خواهید گرفت

در این آموزش، نحوه استفاده از رابط برنامه‌نویسی نرم‌افزار Gemini و کیت توسعه نرم‌افزاری هوش مصنوعی گوگل Gen برای پایتون را با مدل Gemini 2.5 Pro خواهید آموخت.

شما وظایف زیر را انجام خواهید داد:

  • تولید متن از روی متن‌های پیشنهادی
    • تولید متن جریانی
    • چت‌های چند نوبتی را شروع کنید
    • استفاده از متدهای ناهمزمان
  • پیکربندی پارامترهای مدل
  • تنظیم دستورالعمل‌های سیستم
  • استفاده از فیلترهای ایمنی
  • استفاده از تولید کنترل‌شده
  • تعداد توکن‌ها
  • پردازش داده‌های چندوجهی (صوتی، کد، اسناد، تصاویر، ویدیو)
  • استفاده از فراخوانی خودکار و دستی توابع
  • اجرای کد
  • مثال‌هایی از حالت تفکر

۲. قبل از شروع

پیش‌نیازها

قبل از شروع، به یک پروژه Google Cloud با یک حساب پرداخت معتبر نیاز دارید. لطفاً پروژه Google Cloud مورد نظر خود را انتخاب کنید.

برای اجرای codelab، از Colab Enterprise استفاده خواهیم کرد که یک محیط نوت‌بوک مدیریت‌شده و مشارکتی با قابلیت‌های امنیتی و انطباق‌پذیری Google Cloud است.

فعال کردن API های مورد نیاز

برای فعال کردن API های لازم برای این آزمایشگاه کد در پروژه Google Cloud خود، روی دکمه زیر کلیک کنید: Vertex AI، Dataform و Compute Engine.

دفترچه یادداشت Colab را در Google Cloud کپی کنید

برای باز کردن دفترچه آموزش در Colab Enterprise، روی دکمه زیر کلیک کنید. این کار یک کپی از دفترچه آموزش Colab را در پروژه فعلی Google Cloud شما ایجاد می‌کند که به شما امکان می‌دهد دفترچه را اجرا کنید.

بیایید شروع کنیم!

۳. مقداردهی اولیه محیط

حالا که دفترچه یادداشت Colab را ایجاد کرده‌ایم، می‌توانیم کدی را که درون دفترچه یادداشت ارائه شده است اجرا کنیم. چند مرحله اول شامل نصب وابستگی‌ها و وارد کردن کتابخانه‌های لازم خواهد بود.

مراحل شروع به کار را اجرا کنید

ابتدا سلول‌های بخش شروع کار را یکی پس از دیگری اجرا کنید.

سلول‌های کد در بخش شروع به کار

توجه: می‌توانید با نگه داشتن نشانگر ماوس روی سلول کدی که می‌خواهید اجرا شود، و سپس کلیک کردن روی ...، یک سلول را اجرا کنید. آیکون سلول را اجرا کنید آیکون سلول را اجرا کنید.

سلول را اجرا کنید

در پایان این بخش، شما موارد زیر را انجام داده‌اید.

  • نصب کیت توسعه نرم‌افزاری هوش مصنوعی گوگل (Google Gen AI SDK) برای پایتون
  • کتابخانه‌های لازم برای آزمایشگاه را وارد کنید
  • یک پروژه Google Cloud برای استفاده از Vertex AI راه‌اندازی کنید

حالا بیایید از Gemini 2.5 Pro برای تولید متن استفاده کنیم

۴. تولید متن با Gemini

در این بخش از دفترچه یادداشت، از Gemini 2.5 Pro برای تولید تکمیل متن استفاده خواهید کرد.

ادامه دهید و مجموعه بعدی سلول‌ها را در دفترچه یادداشت اجرا کنید، برای خواندن کد و درک نحوه استفاده از Google GenAI SDK وقت بگذارید.

تولید متن از روی متن‌های پیشنهادی

در پایان این بخش، موارد زیر را یاد خواهید گرفت.

  • نحوه مشخص کردن مدل مورد استفاده.
  • تولید خروجی غیر استریمینگ در مقابل استریمینگ.
  • استفاده از قابلیت چت چند نوبتی SDK.
  • فراخوانی SDK به صورت غیرهمزمان.
  • پیکربندی پارامترهای مدل.
  • تنظیم دستورالعمل‌های سیستم برای سفارشی‌سازی رفتار مدل.
  • پیکربندی فیلترهای ایمنی محتوا.

در ادامه خواهیم دید که چگونه می‌توان درخواست‌های چندوجهی را به Gemini ارسال کرد.

۵. دستورالعمل‌های چندوجهی

در این بخش از نوت‌بوک، از Gemini 2.5 Pro برای پردازش تصاویر و ویدیو استفاده خواهید کرد.

ادامه دهید و سلول‌های زیر را در دفترچه یادداشت اجرا کنید. سلول‌های کد برای اعلان‌های چندوجهی

در پایان این بخش، موارد زیر را یاد خواهید گرفت.

  • یک پیام شامل تصویر و متن ارسال کنید.
  • پردازش یک ویدیو از یک URL

در مرحله بعد، خروجی‌های خوش‌تعریف و ساختاریافته تولید خواهیم کرد.

۶. خروجی‌های ساختاریافته

هنگام استفاده از پاسخ مدل‌ها در کد، مهم است که خروجی‌های سازگار و قابل اعتمادی از مدل دریافت کنیم. تولید کنترل‌شده به شما امکان می‌دهد یک طرحواره پاسخ تعریف کنید تا ساختار خروجی مدل، نام فیلدها و نوع داده مورد انتظار برای هر فیلد را مشخص کنید.

ادامه دهید و سلول‌های زیر را در دفترچه یادداشت اجرا کنید. سلول‌های کد برای خروجی کنترل‌شده

در ادامه خواهیم دید که چگونه خروجی‌های مدل‌ها را به زمین متصل کنیم.

۷. اتصال به زمین

اگر می‌خواهید از پایگاه‌های دانش موجود استفاده کنید یا اطلاعات بلادرنگ را به مدل ارائه دهید، باید به پایه‌گذاری خروجی‌های مدل توجه کنید.

با Gemini و Vertex AI، شما می‌توانید خروجی را در جستجوی گوگل، بر روی خروجی پاسخ‌های تابع و در نهایت در خود کد قرار دهید. اجرای کد به مدل اجازه می‌دهد تا کد تولید کرده و آن را اجرا کند، در نتیجه از نتایج یاد می‌گیرد و برای رسیدن به خروجی نهایی تکرار می‌کند.

ادامه دهید و سلول‌های زیر را در دفترچه یادداشت اجرا کنید. کد سلول‌ها برای آزمایش

در ادامه قابلیت‌های تفکر Gemini 2.5 Pro را خواهیم دید.

۸. تفکر

حالت تفکر به ویژه برای کارهای پیچیده‌ای که نیاز به چندین دور استراتژی‌سازی و حل تکراری دارند، مفید است. مدل‌های Gemini 2.5 مدل‌های متفکری هستند که قادر به استدلال از طریق افکار خود قبل از پاسخ دادن هستند و در نتیجه عملکرد و دقت را بهبود می‌بخشند.

ادامه دهید و سلول‌های زیر را در دفترچه یادداشت اجرا کنید. وقتی این کار را انجام می‌دهید، قبل از اینکه مدل خروجی واقعی خود را ارائه دهد، به خروجی تفکر توجه کنید. کدنویسی سلول‌ها برای نمایش خروجی تفکر

۹. نتیجه‌گیری

تبریک! شما یاد گرفته‌اید که چگونه با استفاده از Google Gen AI SDK برای پایتون، از قدرت Gemini 2.5 Pro بهره ببرید، که شامل تولید متن، چندوجهی بودن، پایه‌گذاری، خروجی‌های ساختاریافته و قابلیت‌های تفکر پیشرفته آن می‌شود. اکنون دانش پایه‌ای برای شروع ساخت برنامه‌های نوآورانه خود با استفاده از SDK را دارید. Gemini 2.5 Pro، با حالت تفکر و استدلال قدرتمند خود، امکانات جدیدی را ایجاد می‌کند و خود را به نوآوری در موارد استفاده مختلف وام می‌دهد.

منابع اضافی

این آزمایشگاه کدنویسی چطور بود؟

عالی میانگین می‌توانست بهتر باشد