1. Giriş 👋

Bu kod laboratuvarında, geliştirici olarak Gemini ekosistemi hakkında bilmeniz gereken her şeyi öğreneceksiniz. Daha spesifik olarak, farklı Gemini modelleri, Gemini destekli farklı araçlar ve Gemini ile entegrasyon için Google Gen AI SDK hakkında bilgi edineceksiniz. Ayrıca Gemini'ın uzun bağlam, düşünme modu, uzamsal anlama, Live API, yerel görüntü ve ses çıkışı gibi çeşitli özelliklerini de keşfedeceksiniz.
Bu codelab'in sonunda Gemini ekosistemi hakkında kapsamlı bilgi sahibi olacaksınız.
💡Öğrenecekleriniz
- Farklı Gemini modelleri.
- Gemini modelleri tarafından desteklenen araçlar.
- Google Gen AI SDK'yı kullanarak Gemini ile entegrasyon yapma
- Gemini'ın uzun bağlam penceresi.
- Gemini'ın düşünme modu.
- Google Arama ve Google Haritalar gibi farklı yerleşik araçlar
- Etkileşim API'si ile araştırma aracılarıyla nasıl etkileşim kurulur?
- Görüntü ve metin okuma üretimi.
- Gemini'ın uzamsal anlayışı.
- Gerçek zamanlı ses ve video etkileşimleri için Live API.
⚠️ İhtiyacınız olanlar
- Google AI Studio örnekleri için bir API anahtarı.
- Vertex AI örnekleri için faturalandırmanın etkin olduğu bir Google Cloud projesi.
- Yerel geliştirme ortamınız veya Google Cloud'daki Cloud Shell Düzenleyici.
2. Gemini Ailesi 🫂
Gemini, Google'ın hayal ettiğiniz her şeyi hayata geçiren yapay zeka modelidir. Çok formatlı anlama, aracı ve vibe kodlama için mükemmel bir modeldir. Tüm bu özellikler, en son teknoloji ürünü akıl yürütme temeli üzerine inşa edilmiştir. Gemini modeline hızlı bir genel bakış için bu videoyu izleyebilirsiniz:
Gemini yalnızca bir model değildir. Ayrıca Google ürünlerinde kullanılan bir şemsiye markadır.
Gemini modelini kullanır. Google Cloud'un tüketici odaklı Gemini uygulaması ve NotebookLM'den geliştirici odaklı AI Studio'ya ve kurumsal odaklı Vertex AI'a kadar çeşitli Gemini ürünleri vardır. Ayrıca Gemini destekli Gemini CLI ve Google Antigravity gibi geliştirici araçları da vardır.

3. Gemini Destekli Araçlar 🧰
Gemini destekli araçlara kısaca göz atalım.
Gemini Uygulaması 💬
Gemini Uygulaması ( gemini.google.com), sohbet tabanlı bir tüketici uygulamasıdır. Gemini ile etkileşime girmenin en kolay yoludur. Deep Research, resim, video ve müzik üretimi gibi araçlar içerir. Ayrıca en yeni Gemini modelinin farklı versiyonlarını (Hızlı, Düşünen, Pro) içerir. Gemini uygulaması, günlük kullanım için idealdir.

NotebookLM 📓
NotebookLM ( notebooklm.google.com), yapay zeka destekli bir araştırma asistanıdır. PDF, web sitesi, YouTube videosu, ses dosyası, Google Dokümanı, Google Slaytlar sunusu ve diğer içerikleri yükleyin. NotebookLM, Gemini'ın en yeni sürümünün çok formatlı anlama özelliklerinden yararlanarak bu içerikleri özetler ve konular arasında ilginç bağlantılar kurar. Ayrıca, yüklediğiniz kaynaklardan ilgi çekici ve etkileşimli sesli özetler, videolu özetler, infografikler ve daha fazlasını oluşturur.

Google AI Studio 🎨
Google AI Studio ( ai.dev), Gemini ile uygulama geliştirmeye başlamanın en hızlı yoludur. Google AI Studio'daki Playground paneli, metin, resim ve video oluşturmak için farklı modellerle denemeler yapmanıza ve Gemini Live API ile anlık ses ve video özelliklerini denemenize olanak tanır. Google AI Studio'daki Build (Derleme) paneli, web uygulamalarını vibe-code ile oluşturmanıza, bunları Google Cloud'da Cloud Run'a dağıtmanıza ve kodu GitHub'a aktarmanıza olanak tanır.

Vertex AI Studio ☁️
Vertex AI, Google Cloud'da üretken yapay zeka oluşturmak ve kullanmak için tam olarak yönetilen, birleşik bir yapay zeka geliştirme platformudur. Vertex AI Studio ( console.cloud.google.com/vertex-ai/studio), işletmeye hazır üretken yapay zeka uygulamalarını test etmenize, ayarlamanıza ve dağıtmanıza yardımcı olur.

Gemini CLI ⚙️
Gemini CLI ( geminicli.com), Gemini'ın gücünü doğrudan terminalinize getiren açık kaynaklı bir yapay zeka aracısıdır. Geliştiriciler, mühendisler, SRE'ler ve diğer kullanıcılar için terminal odaklı, genişletilebilir ve güçlü bir araç olarak tasarlanmıştır. Gemini CLI, yerel ortamınızla entegre olur. Proje bağlamınızı koruyarak dosyaları okuyup düzenleyebilir, kabuk komutlarını yürütebilir ve web'de arama yapabilir.

Google Antigravity 🚀
Google Antigravity ( antigravity.google), entegre geliştirme ortamını artık temsilcilerin öne çıktığı yeni bir döneme taşıyan, temsilci tabanlı geliştirme platformudur. Antigravity, geliştiricilerin görev odaklı daha yüksek bir düzeyde çalışmasına olanak tanır. Bu sayede, çalışma alanlarındaki temsilcileri yönetirken temelinde tanıdık bir yapay zeka IDE deneyimi sunar.
Antigravity, temsilcileri kendi yüzeylerine çıkarır ve düzenleyici, terminal ve tarayıcıda bağımsız olarak çalışmak için gereken araçları sağlar. Görevler ve yapılar aracılığıyla doğrulama ve üst düzey iletişimi vurgular. Bu özellik, aracıların daha karmaşık ve uçtan uca yazılım görevlerini planlayıp yürütmesine olanak tanıyarak geliştirmenin tüm yönlerini iyileştirir. Özellik oluşturma, kullanıcı arayüzü yinelemesi ve hataları düzeltmenin yanı sıra araştırma ve rapor oluşturma da bu kapsamdadır.

Bu araçları indirip kullanabilirsiniz. Hangi aracı ne zaman kullanacağınıza dair bazı genel yönergeleri aşağıda bulabilirsiniz:
- Yeni başlıyorsanız soru sormak veya temel kodlar oluşturmak için Gemini Uygulaması'nı kullanabilirsiniz.
- Bir web uygulamasını vibe-coding ile geliştiriyorsanız muhtemelen Google AI Studio'yu tercih edersiniz.
- Yerel geliştirme ortamınızdaki bağlamı kullanarak karmaşık bir uygulama oluşturmak istiyorsanız Gemini CLI veya Google Antigravity'yi seçersiniz.
- Google Cloud'u dağıtmak veya kullanmak istiyorsanız ve kurumsal düzeyde destek ile özellikler arıyorsanız Vertex AI ve Studio'yu tercih edebilirsiniz.
Elbette bu araçları birlikte kullanabilirsiniz. Örneğin, GitHub'a aktarmak için AI Studio'da vibe coding ile başlayın, ardından kodlamaya devam etmek ve Google Cloud'a dağıtmak için Antigravity'yi kullanın.
4. Gemini Modelleri 🧠
Gemini Modelleri, birkaç ayda bir yayınlanan yeni sürümlerle sürekli olarak daha iyi hale geliyor. Bugün (Şubat 2026) itibarıyla Google Cloud'daki Vertex AI'da öne çıkan modeller şunlardır:

Genel kullanıma açık Gemini modelleri, önizleme Gemini modelleri, açık Gemma modelleri, gömme modelleri, Imagegen modelleri, Veo modelleri ve daha birçok model bulunmaktadır.
Farklı kullanım alanları için Vertex AI'da bulunan başlıca modelleri keşfetmek üzere Google Modelleri doküman sayfasını ziyaret edin.
5. Google Gen AI SDK 📦
Gemini'ı uygulamanıza entegre etmek için Google Gen AI SDK'yı kullanabilirsiniz.
Daha önce de belirttiğimiz gibi, Gemini modellerine Google AI Studio veya Vertex AI Studio üzerinden erişebilirsiniz. Google Gen AI SDK, hem Google Yapay Zeka API'si hem de Google Cloud API aracılığıyla Gemini modellerine yönelik birleşik bir arayüz sunar. Birkaç istisna dışında, bir platformda çalışan kod her ikisinde de çalışır.

Google Gen AI SDK şu anda Python, Go, Node, Java ve C# dillerini desteklemektedir.
Örneğin, Python'da Google Yapay Zeka'daki Gemini ile şu şekilde konuşabilirsiniz:
client = genai.Client(
api_key=your-gemini-api-key)
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="Why is the sky blue?")
Vertex AI'da Gemini'a karşı aynı işlemi yapmak için istemci başlatmayı değiştirmeniz yeterlidir. Geri kalan işlemler aynıdır:
client = genai.Client(
vertexai=True,
project=your-google-cloud-project,
location="us-central1")
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="Why is the sky blue?")
Bu örnekleri kendiniz çalıştırmak için github.com/meteatamel/genai-samples/tree/main/vertexai/gemini2/hello-world adresinde main.py komutunu çalıştırabilirsiniz.
6. Interactions API 🔄
Etkileşimler API'si (beta), Gemini modelleri ve aracılarıyla etkileşim kurmak için kullanılan yeni birleşik arayüzdür. generateContent API'nin geliştirilmiş bir alternatifi olarak durum yönetimini, araç düzenlemeyi ve uzun süren görevleri basitleştirir.
Yeni API ile temel etkileşim kurma şekliniz:
interaction = client.interactions.create(
model="gemini-3-flash-preview",
input="Tell me a short joke."
)
print(interaction.outputs[-1].text)
Önceki etkileşimden etkileşim kimliğini ileterek durum bilgisi içeren bir görüşme yapabilirsiniz:
interaction1 = client.interactions.create(
model="gemini-3-flash-preview",
input="Hi, my name is Phil."
)
print(f"Model: {interaction1.outputs[-1].text}")
interaction2 = client.interactions.create(
model="gemini-3-flash-preview",
input="What is my name?",
previous_interaction_id=interaction1.id
)
print(f"Model: {interaction2.outputs[-1].text}")
Interactions API, temsilciler oluşturmak ve onlarla etkileşim kurmak için tasarlanmıştır. İşlev çağrıları, yerleşik araçlar, yapılandırılmış çıkışlar ve Model Context Protocol (MCP) desteği içerir. Deep Research Agent ile nasıl kullanılabileceğini görmek için aşağıdaki 🤖 Aracılar adımına bakın.
Bu örnekleri kendiniz çalıştırmak için main.py komutunu github.com/meteatamel/genai-samples/blob/main/vertexai/interactions-api adresinde çalıştırabilirsiniz.
7. Uzun bağlam penceresi 🪟
Birçok Gemini modeli, 1 milyon veya daha fazla parçalık büyük bağlam pencereleriyle birlikte gelir. Geçmişte, büyük dil modelleri (LLM'ler) tek seferde modele aktarılabilecek metin (veya jeton) miktarıyla önemli ölçüde sınırlıydı. Gemini'ın uzun bağlam penceresi, birçok yeni kullanım alanının ve geliştirici paradigmasının kilidini açıyor.

Uzun bağlam penceresini çalışırken görmek için Vertex AI Studio İstem Galerisi'ne gidip Extract Video Chapters istemini seçebilirsiniz. Bu istem, video içeriğini bölümlere ayırır ve her bölüm için bir özet sağlar.
Sağlanan video ile çalıştırdığınızda aşağıdaki gibi bir çıkış elde etmeniz gerekir:
[
{
"timecode": "00:00",
"chapterSummary": "The video opens with scenic views of Rio de Janeiro, introducing the \"Marvelous City\" and its famous beaches like Ipanema and Copacabana, before pivoting to the existence of the favelas."
},
{
"timecode": "00:20",
"chapterSummary": "The narrator describes the favelas, home to one in five Rio residents, highlighting that while often associated with crime and poverty, this is only a small part of their story."
},
{
"timecode": "00:36",
"chapterSummary": "Google introduces its project to map the favelas, emphasizing that providing addresses to these uncharted areas is a crucial step in giving residents an identity."
},
{
"timecode": "00:43",
"chapterSummary": "The video concludes by focusing on the people of the favelas, inviting viewers to go beyond the map and explore their world through a 360-degree experience."
}
]
Bu, yalnızca Gemini'ın uzun bağlam penceresi sayesinde mümkündür.
8. Düşünme Modu 🧠
Gemini modelleri, karmaşık görevlerde akıl yürütme becerilerini önemli ölçüde geliştiren bir iç düşünme süreci kullanır. Düşünme seviyeleri (Gemini 3) ve bütçeler (Gemini 2.5) düşünme davranışını kontrol eder. Modelin ham düşüncelerini görmek için include_thoughts işaretini de etkinleştirebilirsiniz.
Düşünme modunu uygulamalı olarak görmek için Google AI Studio'yu ( ai.dev) açıp yeni bir sohbet başlatalım. Sağdaki yan panelde düşünme düzeyini ayarlayabilirsiniz:

Sağ üstteki Get code düğmesini tıklarsanız düşünme düzeyini kodda nasıl ayarlayabileceğinizi de görebilirsiniz. Örneğin:
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="How does AI work?",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(
thinking_level="low",
include_thoughts=True
)
),
)
Modelin davranışını görmek için farklı istemler ve farklı düşünce seviyeleriyle oynayın.
9. Araçlar 🧰
Gemini'da Google Arama, Google Haritalar, Kod Yürütme, Bilgisayar Kullanımı ve Dosya Arama gibi birçok yerleşik araç bulunur. Ayrıca, Function Calling ile özel araçlarınızı da tanımlayabilirsiniz. Bunları nasıl kullanacağımıza kısaca göz atalım.
Google Arama 🔎
Daha doğru, güncel ve alakalı yanıtlar için model yanıtlarını Google Arama sonuçlarına dayandırabilirsiniz.
Vertex AI Studio ( console.cloud.google.com/vertex-ai/studio) veya Google AI Studio'da ( ai.dev) yeni bir sohbet başlatabilir ve Google Arama'nın temellendirme özelliğinin devre dışı olduğundan emin olabilirsiniz:

Ardından, bulunduğunuz yerdeki bugünkü hava durumu hakkında soru sorabilirsiniz. Örneğin:
How's the weather in London today?
Model, en son bilgilere erişemediği için genellikle geçmişteki bir güne ait yanıt alırsınız. Örneğin:
In London today (Friday, May 24, 2025), the weather is a bit of a mixed bag, typical for late May.
Şimdi Google Arama'yı temellendirmeyi etkinleştirin ve aynı soruyu sorun. Temellendirme kaynaklarının bağlantılarını içeren güncel hava durumu bilgilerini alırsınız:
In London today (Wednesday, February 11, 2026), the weather is cool and mostly cloudy with a chance of light rain.
Bu şekilde, kodunuzda Google Arama'yı temel alabilirsiniz. Temellendirme örneği almak için Vertex AI Studio'daki Kod düğmesini de tıklayabilirsiniz:
google_search_tool = Tool(google_search=GoogleSearch())
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="How's the weather like today in London?",
config=GenerateContentConfig(tools=[google_search_tool])
)
Google Haritalar 🗺️
Ayrıca, 250 milyondan fazla yerle ilgili bilgilere erişimi olan Google Haritalar ile model yanıtlarını temellendirebilirsiniz.
Bu özelliği kullanırken görmek için Vertex AI Studio'daki model ayarlarının temellendirme bölümünde Google Arama yerine Google Haritalar'ı seçebilir ve Haritalar verileri gerektiren bir soru sorabilirsiniz. Örneğin:
Can you show me some Greek restaurants and their map coordinates near me?
Bunun kodu şu şekilde görünür:
google_maps_tool = Tool(google_maps=GoogleMaps())
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents=""What are the best restaurants near here?",
config=GenerateContentConfig(tools=[google_maps_tool]),
# Optional: Provide location context (this is in Los Angeles)
tool_config=ToolConfig(
retrieval_config=types.RetrievalConfig(
lat_lng=types.LatLng(
latitude=34.050481, longitude=-118.248526))),
)
Kod Yürütme 🧑💻
Gemini, desteklenen kitaplıkların (pandas, numpy, PyPDF2 vb.) listesiyle Python kodu oluşturup çalıştırabilir. Bu, kod tabanlı akıl yürütmeden yararlanan uygulamalar (ör.denklemleri çözme) için kullanışlıdır.
Bu özelliği denemek için Google AI Studio'ya geçin, yeni bir sohbet başlatın ve Code execution açma/kapatma düğmesinin açık olduğundan emin olun. Ardından, kod yürütme aracının faydalı olabileceği bir soru sorun. Örneğin:
What is the sum of the first 50 prime numbers?
Gemini, Python kodu oluşturup çalıştırmalıdır. Sonuç olarak doğru cevap 5117'dir.
Kod yürütme aracını koddan aşağıdaki şekilde çalıştırabilirsiniz:
code_execution_tool = Tool(code_execution=ToolCodeExecution())
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="What is the sum of the first 50 prime numbers?",
config=GenerateContentConfig(
tools=[code_execution_tool],
temperature=0))
Bilgisayar Kullanımı 🖥️
Gemini Computer Use modeli (önizleme), görevleri otomatikleştirmek için tarayıcı kontrolü temsilcileri oluşturmanıza olanak tanır. İşleyişi şu şekildedir:

Nasıl çalıştığını görmek için main.py komutunu github.com/google-gemini/computer-use-preview adresinde çalıştırabilirsiniz.
Örneğin, API anahtarınızı Google AI Studio'dan alabilir ve Gemini'dan sizin için uçuş aramasını isteyebilirsiniz:
export GEMINI_API_KEY=your-api-key
python main.py --query "Find me top 5 fights sorted by price with the following constraints:
Flight site to use: www.google.com/travel/flights
From: London
To: Larnaca
One-way or roundtrip: One way
Date to leave: Sometime next week
Date to return: N/A
Travel preferences:
-Direct flights
-No flights before 10am
-Carry-on luggage"
Gemini'ın gizli bir tarayıcı açtığını ve sizin için uçuş aramaya başladığını görürsünüz.
Dosya Arama 📁
Dosya Arama Aracı, zahmetsiz Almayla Artırılmış Üretim (RAG) sağlar. Dosyalarınızı yüklemeniz yeterlidir. Bu araç, RAG ile ilgili tüm ayrıntıları (parçalama, yerleştirme, alma) sizin için halleder.
Çalışırken görmek için main.py komutunu github.com/meteatamel/genai-beyond-basics/blob/main/samples/grounding/file-search-tool adresinde çalıştırabilirsiniz.
Google AI Studio'dan API anahtarınızı alın ve dosya arama deposu oluşturun:
export GEMINI_API_KEY=your-gemini-api-key
python main.py create_store my-file-search-store
Mağazaya PDF yükleme:
python main.py upload_to_store fileSearchStores/myfilesearchstore-5a9x71ifjge9 cymbal-starlight-2024.pdf
Mağazayı işaret eden PDF hakkında soru sorun:
python main.py generate_content "What's the cargo capacity of Cymbal Starlight?" fileSearchStores/myfilesearchstore-5a9x71ifjge9
PDF'ye dayalı bir yanıt alırsınız:
Generating content with file search store: fileSearchStores/myfilesearchstore-5a9x71ifjge9
Response: The Cymbal Starlight 2024 has a cargo capacity of 13.5 cubic feet, which is located in the trunk of the vehicle. It is important to distribute the weight evenly and not overload the trunk, as this could impact the vehicle's handling and stability. The vehicle can also accommodate up to two suitcases in the trunk, and it is recommended to use soft-sided luggage to maximize space and cargo straps to secure it while driving.
Grounding sources: cymbal-starlight-2024.pdf
İşlev Çağrısı 📲
Yerleşik araçlar yeterli değilse Gemini'da kendi araçlarınızı (işlevlerinizi) da tanımlayabilirsiniz. İşlevin ayrıntılı bir OpenAPI spesifikasyonunu göndermek yerine, yalnızca bir Python işlevini araç olarak gönderirsiniz. Model ve SDK tarafından otomatik olarak araç olarak kullanılır.
Örneğin, bir konumun enlemini ve boylamını döndüren bir işleviniz olabilir:
def location_to_lat_long(location: str):
"""Given a location, returns the latitude and longitude
Args:
location: The location for which to get the weather.
Returns:
The latitude and longitude information in JSON.
"""
logger.info(f"Calling location_to_lat_long({location})")
url = f"https://geocoding-api.open-meteo.com/v1/search?name={location}&count=1"
return api_request(url)
Ayrıca, enlem ve boylamdan hava durumu bilgilerini döndüren bir işlev de kullanabilirsiniz:
def lat_long_to_weather(latitude: str, longitude: str):
"""Given a latitude and longitude, returns the weather information
Args:
latitude: The latitude of a location
longitude: The longitude of a location
Returns:
The weather information for the location in JSON.
"""
logger.info(f"Calling lat_long_to_weather({latitude}, {longitude})")
url = (f"https://api.open-meteo.com/v1/forecast?latitude={latitude}&longitude={longitude}¤t=temperature_2m,"
f"relative_humidity_2m,surface_pressure,wind_speed_10m,wind_direction_10m&forecast_days=1")
return api_request(url)
Artık bu iki işlevi Gemini'a araç olarak iletebilir ve bir konumun hava durumu bilgilerini getirmek için kullanmasına izin verebilirsiniz:
def generate_content_with_function_calls():
client = genai.Client(
vertexai=True,
project=PROJECT_ID,
location=LOCATION)
response = client.models.generate_content(
model=MODEL_ID,
contents=PROMPT,
config=GenerateContentConfig(
system_instruction=[
"You are a helpful weather assistant.",
"Your mission is to provide weather information for different cities."
"Make sure your responses are in plain text format (no markdown) and include all the cities asked.",
],
tools=[location_to_lat_long, lat_long_to_weather],
temperature=0),
)
print(response.text)
#print(response.automatic_function_calling_history)
Çalışırken görmek için main_genaisdk.py kodunu github.com/meteatamel/genai-beyond-basics/blob/main/samples/function-calling/weather adresinde çalıştırabilirsiniz.
10. Temsilciler 🤖
Gemini'ın Interactions API'si, aracı oluşturmak ve bunlarla etkileşim kurmak için tasarlanmıştır. Gemini Deep Research Agent gibi uzmanlaşmış temsilcileri kullanabilirsiniz. Gemini Deep Research Agent, çok adımlı araştırma görevlerini bağımsız olarak planlar, yürütür ve sentezler. Web aramayı ve kendi verilerinizi kullanarak karmaşık bilgi ortamlarında gezinir ve ayrıntılı, alıntılanmış raporlar oluşturur.
Deep Research aracısını Interaction API ile nasıl kullanacağınız aşağıda açıklanmıştır:
interaction = client.interactions.create(
input="Research the history of the Google TPUs.",
agent="deep-research-pro-preview-12-2025",
background=True
)
while True:
if interaction.status == "completed":
print("\nFinal Report:\n",
interaction.outputs[-1].text)
break
Bu örneği kendiniz çalıştırmak için github.com/meteatamel/genai-samples/blob/main/vertexai/interactions-api adresinde main.py komutunu çalıştırabilirsiniz.
export GOOGLE_API_KEY=your-api-key
python main.py agent
Bir süre sonra yapılan araştırmayı görürsünüz:
User: Research the history of the Google TPUs with a focus on 2025 and 2026
Status: in_progress
Status: in_progress
Status: in_progress
...
Model Final Report:
# Architectural Convergence and Commercial Expansion: The History of Google TPUs (2015–2026)
## Key Findings
* **Strategic Pivot (2025):** Google transitioned the Tensor Processing Unit (TPU) from a primarily internal differentiator to a commercial merchant-silicon competitor, epitomized by the massive "Ironwood" (TPU v7) deployment and external sales strategy.
* **Technological Leap:** The introduction of TPU v7 "Ironwood" in 2025 marked a paradigm shift, utilizing 3nm process technology to deliver 42.5 exaFLOPS per pod, directly challenging NVIDIA's Blackwell architecture in the high-performance computing (HPC) sector.
...
11. Görüntü Üretme 📷
Nano Banana 🍌, Gemini'ın yerel görüntü üretme özelliklerinin adıdır. Gemini, metin, resim veya her ikisinin kombinasyonuyla etkileşimli olarak resim oluşturabilir ve işleyebilir. Bu sayede, görselleri benzeri görülmemiş bir kontrolle oluşturabilir, düzenleyebilir ve yineleyebilirsiniz.
Nano Banana, Gemini API'de kullanılabilen iki farklı modeli ifade eder:
- Nano Banana: Gemini 2.5 Flash görüntü modeli (
gemini-2.5-flash-image). Bu model, hız ve verimlilik için tasarlanmıştır ve yüksek hacimli, düşük gecikmeli görevler için optimize edilmiştir. - Nano Banana Pro: Gemini 3 Pro Görüntü Önizleme modeli (
gemini-3-pro-image-preview). Bu model, karmaşık talimatları uygulamak ve yüksek doğrulukta metin oluşturmak için gelişmiş akıl yürütme becerilerinden yararlanarak profesyonel öğe üretimi için tasarlanmıştır.
Mevcut bir resmi iletebileceğiniz ve Nano Banana'dan resmi düzenlemesini isteyebileceğiniz bir kod snippet'i aşağıda verilmiştir:
from google import genai
from google.genai import types
from PIL import Image
client = genai.Client()
prompt = (
"Create a picture of my cat eating a nano-banana in a "
"fancy restaurant under the Gemini constellation",
)
image = Image.open("/path/to/cat_image.png")
response = client.models.generate_content(
model="gemini-2.5-flash-image",
contents=[prompt, image],
)
for part in response.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = part.as_image()
image.save("generated_image.png")
Nano Banana, Gemini Uygulaması, AI Studio veya Vertex AI Studio'da kullanılabilir. Özelliği denemenin en kolay yolu Gemini Uygulaması'dır. Gemini Uygulaması'nda ( gemini.google.com), Tools bölümünde 🍌 Create images simgesini seçin. Ardından bir resim yükleyip eğlenceli bir şey deneyin. Örneğin, şöyle diyebilirsiniz:
Can you transform this picture of mine to a nice beach on a tropical island?

12. Metin Okuma Üretimi 🎶
Gemini, Gemini metin okuma (TTS) oluşturma özelliklerini kullanarak metin girişini tek veya çok konuşmacılı seslere dönüştürebilir. TTS üretimi kontrol edilebilir. Bu sayede, etkileşimleri yapılandırmak ve sesin stilini, aksanını, hızını ve tonunu yönlendirmek için doğal dil kullanabilirsiniz.
TTS'yi destekleyen 2 model vardır:
TTS özelliği, etkileşimli, yapılandırılmamış ses ve çok formatlı girişler ve çıkışlar için tasarlanmış olan Live API aracılığıyla sağlanan konuşma üretiminden farklıdır. Live API, dinamik sohbet bağlamlarında mükemmel performans gösterirken Gemini API aracılığıyla TTS, stil ve ses üzerinde ayrıntılı kontrolle metinlerin tam olarak okunmasını gerektiren senaryolar (ör. podcast veya sesli kitap oluşturma) için özel olarak tasarlanmıştır.
Tek sesli TTS için kod snippet'i:
from google import genai
from google.genai import types
import wave
# Set up the wave file to save the output:
def wave_file(filename, pcm, channels=1, rate=24000, sample_width=2):
with wave.open(filename, "wb") as wf:
wf.setnchannels(channels)
wf.setsampwidth(sample_width)
wf.setframerate(rate)
wf.writeframes(pcm)
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-flash-preview-tts",
contents="Say cheerfully: Have a wonderful day!",
config=types.GenerateContentConfig(
response_modalities=["AUDIO"],
speech_config=types.SpeechConfig(
voice_config=types.VoiceConfig(
prebuilt_voice_config=types.PrebuiltVoiceConfig(
voice_name='Kore',
)
)
),
)
)
data = response.candidates[0].content.parts[0].inline_data.data
file_name='out.wav'
wave_file(file_name, data) # Saves the file to current directory
Daha fazla örneği Metin okuma (TTS) belgelerinde bulabilirsiniz.
Google AI Studio playground'da konuşma oluşturmayı da deneyebilirsiniz. generate-speech uygulamasında farklı istemlerle denemeler yapın:

13. Uzamsal Anlama 🌐
Gemini, gelişmiş nesne algılama ve uzamsal anlama özelliklerine sahiptir.
Bunu anlamanın en kolay yolu, nasıl çalıştığını görmektir. AI Studio'da Spatial Understanding Starter App'e (Mekansal Anlama Başlangıç Uygulaması) gidin. Bazı resimleri seçin ve Gemini ile resimdeki bazı öğeleri algılamayı deneyin.
Örneğin, farklı resimlerde "gölgeler" veya "meyveler" algılayabilirsiniz:

Farklı resimlerle oynayarak Gemini'ın farklı nesneleri ne kadar iyi tespit edip etiketlediğini görün.
14. Live API 🎤
Live API, Gemini ile düşük gecikmeli ve anlık sesli ve görüntülü etkileşimler sağlar. Kullanıcılarınıza doğal bir sohbet deneyimi sunmak için anında, insan benzeri sözlü yanıtlar vermek üzere sürekli ses, video veya metin akışlarını işler.

Google AI Studio'daki Live API'yi veya Vertex AI Studio'daki Live API'yi deneyin. Her iki uygulamada da sesinizi, videonuzu ve ekranınızı paylaşabilir, Gemini ile canlı sohbet edebilirsiniz.

Videonuzu veya ekranınızı paylaşmaya başlayın ve Gemini'a sesli olarak genel sorular sorun. Örneğin:
Can you describe what you see on the screen?
Gemini'ın yanıtlarının ne kadar doğal olduğunu görünce şaşıracaksınız.
15. Sonuç
Bu codelab'de, Gemini ürün ailesiyle başlayarak Gemini ekosistemini ele aldık ve birleşik Google Gen AI SDK'yı kullanarak modelleri uygulamalarımıza nasıl entegre edeceğimizi öğrendik. Uzun Bağlam Penceresi, Düşünme Modu, yerleşik temellendirme araçları, Live API ve Uzamsal Anlama gibi Gemini'ın en yeni özelliklerini inceledik. Referans dokümanlarını daha ayrıntılı bir şekilde incelemenizi ve Gemini'ın tüm potansiyelini kullanarak denemeler yapmaya devam etmenizi öneririz.