🤖 יצירת סוכן AI מולטימודאלי באמצעות Graph RAG, ‏ ADK ו-Memory Bank

1. מבוא

גרסת כיסוי

1. האתגר

בתרחישים של תגובה לאסונות, נדרשת יכולת ניהול נתונים וחיפוש חכמה כדי לתאם בין ניצולים עם כישורים, משאבים וצרכים שונים בכמה מיקומים. בסדנה הזו תלמדו איך לבנות מערכת AI לייצור שמשלבת:

🗄️ מסד נתונים של גרפים (Spanner): אחסון של קשרים מורכבים בין ניצולים, כישורים ומשאבים
🔍 חיפוש מבוסס-AI: חיפוש היברידי של מילים סמנטיות + מילות מפתח באמצעות הטמעות
📸 עיבוד מולטי-מודאלי: חילוץ נתונים מובְנים מתמונות, מטקסט ומסרטונים
🤖 תזמור של כמה סוכנים: תיאום בין סוכנים מומחים לתהליכי עבודה מורכבים
🧠 זיכרון לטווח ארוך: התאמה אישית באמצעות Vertex AI Memory Bank

שיחה

2. מה תפַתחו

מסד נתונים של תרשים רשת של ניצולים עם:

‫🗺️ 3D Interactive Graph Visualization of survivor relationships
🔍 חיפוש חכם (מילות מפתח, סמנטי והיברידי)
📸 צינור עיבוד נתונים להעלאה מולטימודאלית (חילוץ ישויות מתמונות או מסרטונים)
‫🤖 Multi-Agent System לתזמור משימות מורכבות
‫🧠 Memory Bank Integration לאינטראקציות בהתאמה אישית

3. טכנולוגיות ליבה

רכיב	טכנולוגיה	מטרה
מסד נתונים	Cloud Spanner Graph	אחסון של צמתים (שורדים, מיומנויות) וקשתות (קשרים)
AI Search	‫Gemini + הטמעות	הבנה סמנטית + חיפוש דמיון
Agent Framework	ADK (ערכת כלים לפיתוח סוכנים)	תזמור תהליכי עבודה של AI
זיכרון	Vertex AI Memory Bank	אחסון העדפות משתמש לטווח ארוך
Frontend	React + Three.js	הדמיה אינטראקטיבית של גרף תלת-ממדי

2. הכנת הסביבה (אפשר לדלג אם אתם משתתפים בסדנה)

חלק ראשון: הפעלת החשבון לחיוב

כדי לממש את הזיכוי בסך 5 דולר בחשבון לחיוב, תצטרכו אותו לפריסה. חשוב לוודא שאתם מחוברים לחשבון Gmail.

חלק שני: סביבה פתוחה

👈 לוחצים על הקישור הזה כדי לעבור ישירות אל Cloud Shell Editor
‫👉 אם מתבקשים לאשר בשלב כלשהו היום, לוחצים על Authorize כדי להמשיך.
‫👈 אם הטרמינל לא מופיע בחלק התחתון של המסך, פותחים אותו:
- לוחצים על הצגה.
- לוחצים על Terminal (מסוף).
‫👈💻 בטרמינל, מוודאים שכבר עברתם אימות ושהפרויקט מוגדר למזהה הפרויקט שלכם באמצעות הפקודה הבאה:
```
gcloud auth list
```
‫👈💻 משכפלים את פרויקט ה-bootstrap מ-GitHub:
```
git clone https://github.com/google-americas/way-back-home.git
```

3. הגדרת הסביבה

1. התחלה

בטרמינל של Cloud Shell Editor, אם הטרמינל לא מופיע בתחתית המסך, פותחים אותו:

לוחצים על הצגה.
לוחצים על Terminal (מסוף).

פתיחת טרמינל חדש ב-Cloud Shell Editor

‫👈💻 בטרמינל, הופכים את סקריפט ההפעלה לקובץ הפעלה ומריצים אותו:

cd ~/way-back-home/level_2
./init.sh

2. הגדרת הפרויקט

‫👈💻 מגדירים את מזהה הפרויקט:

gcloud config set project $(cat ~/project_id.txt) --quiet

‫👉💻 מפעילים את ממשקי ה-API הנדרשים (הפעולה הזו אורכת כ-2-3 דקות):

gcloud services enable compute.googleapis.com \
                       aiplatform.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \
                       artifactregistry.googleapis.com \
                       spanner.googleapis.com \
                       storage.googleapis.com

3. הרצת סקריפט ההגדרה

‫👉💻 מריצים את סקריפט ההגדרה:

cd ~/way-back-home/level_2
./setup.sh

המערכת תיצור בשבילכם את .env. ב-Cloud Shell, פותחים את way_back_homeproject. בתיקייה level_2, אפשר לראות שנוצר בשבילכם קובץ .env. אם לא מוצאים אותו, אפשר ללחוץ על View -> Toggle Hidden File כדי לראות אותו. open_project

4. טעינת נתונים לדוגמה

‫👈💻 עוברים לחלק האחורי של האתר ומתקינים את יחסי התלות:

cd ~/way-back-home/level_2/backend
uv sync

‫👉💻 טעינה של נתוני הניצולים הראשוניים:

uv run python ~/way-back-home/level_2/backend/setup_data.py

הפעולה הזו יוצרת:

מכונת Spanner‏ (survivor-network)
מסד נתונים (graph-db)
כל טבלאות הצמתים והקשתות
תרשימי מאפיינים לשאילתות הפלט הצפוי:

============================================================
SUCCESS! Database setup complete.
============================================================

Instance:  survivor-network
Database:  graph-db
Graph:     SurvivorGraph

Access your database at:
https://console.cloud.google.com/spanner/instances/survivor-network/databases/graph-db?project=waybackhome

אם לוחצים על הקישור אחרי Access your database at בפלט, אפשר לפתוח את Google Cloud Console Spanner.

open_spanner

Spanner יופיע במסוף Google Cloud.

מפתח ברגים

4. המחשה חזותית של נתוני גרף ב-Spanner Studio

במדריך הזה נסביר איך להציג את הנתונים של גרף רשת הניצולים ולקיים איתם אינטראקציה ישירות במסוף Google Cloud באמצעות Spanner Studio. זו דרך מצוינת לאמת את הנתונים ולהבין את מבנה הגרף לפני שיוצרים את נציג ה-AI.

1. גישה ל-Spanner Studio

בשלב האחרון, לוחצים על הקישור ופותחים את Spanner Studio.

spanner_studio

2. הסבר על מבנה הגרף (התמונה הגדולה)

אפשר לחשוב על מערך הנתונים של Survivor Network כעל חידת היגיון או מצב משחק:

ישות	תפקיד במערכת	אנלוגיה
Survivors	הנציגים/השחקנים	שחקנים
Biomes	איפה הם נמצאים	אזורים במפה
מיומנויות	מה הם יכולים לעשות	פעולות שניתן לבצע
צריך	מה חסר להם (משברים)	קווסטים/משימות
מקורות מידע	פריטים שנמצאו בעולם	שלל

המטרה: התפקיד של סוכן ה-AI הוא לקשר בין כישורים (פתרונות) לבין צרכים (בעיות), תוך התחשבות בביומים (מגבלות מיקום).

🔗 קצוות (קשרים):

‫SurvivorInBiome: מעקב אחר מיקום
SurvivorHasSkill: מלאי יכולות
SurvivorHasNeed: רשימת הבעיות הפעילות
SurvivorFoundResource: מלאי פריטים
‫SurvivorCanHelp: קשר משוער (ה-AI מחשב את זה!)

3. שאילתות בגרף

נריץ כמה שאילתות כדי לראות את הסיפור שמאחורי הנתונים.

ב-Spanner Graph נעשה שימוש ב-GQL (Graph Query Language). כדי להריץ שאילתה, משתמשים ב-GRAPH SurvivorNetwork ואחריו בדפוס ההתאמה.

‫👈 שאילתה 1: רשימת המשתמשים הגלובלית (מי נמצא איפה?) זהו הבסיס שלכם – הבנה של מיקום היא קריטית לפעולות חילוץ.

GRAPH SurvivorNetwork
MATCH result = (s:Survivors)-[:SurvivorInBiome]->(b:Biomes)
RETURN TO_JSON(result) AS json_result

התוצאה שצפויה להתקבל היא: query1

‫👉 שאילתה 2: מטריצת הכישורים (יכולות) אחרי שגיליתם איפה כולם נמצאים, תוכלו לגלות מה הם יכולים לעשות.

GRAPH SurvivorNetwork
MATCH result = (s:Survivors)-[h:SurvivorHasSkill]->(k:Skills)
RETURN TO_JSON(result) AS json_result

התוצאה שצפויה להתקבל היא: query2

‫👉 שאילתה 3: מי נמצא במשבר? (לוח המשימות) אפשר לראות את הניצולים שזקוקים לעזרה ואת מה שהם צריכים.

GRAPH SurvivorNetwork
MATCH result = (s:Survivors)-[h:SurvivorHasNeed]->(n:Needs)
RETURN TO_JSON(result) AS json_result

התוצאה שצפויה להתקבל היא: query3

🔎 מתקדם: שידוך – מי יכול לעזור למי?

כאן הגרף הופך לחזק! השאילתה הזו מוצאת שורדים שיש להם כישורים שיכולים לעזור לשורדים אחרים.

GRAPH SurvivorNetwork
MATCH result = (helper:Survivors)-[:SurvivorHasSkill]->(skill:Skills)-[:SkillTreatsNeed]->(need:Needs)<-[:SurvivorHasNeed]-(helpee:Survivors)
RETURN TO_JSON(result) AS json_result

התוצאה שצפויה להתקבל היא: query4

aside positive What This Query Does:

במקום להציג רק את התוצאה 'עזרה ראשונה לטיפול בכוויות' (שברורה מהסכימה), השאילתה הזו מוצאת:

ד"ר אלנה פרוסט (שיש לה הכשרה רפואית) ← יכולה לטפל ב- ← קפטן טנאקה (שסובל מכוויות)
דוד כהן (שיש לו ערכת עזרה ראשונה) ← יכול לטפל ב- ← סגן פארק (שנקע את הקרסול)

למה זה חשוב:

מה סוכן ה-AI יעשה:

כשמשתמש ישאל "מי יכול לטפל בכוויות?", הסוכן יבצע את הפעולות הבאות:

הרצת שאילתת גרף דומה
החזר: "Dr. Frost has Medical Training and can help Captain Tanaka"
המשתמש לא צריך לדעת על טבלאות או קשרים ביניים.

5. הטמעות מבוססות-AI ב-Spanner

1. למה כדאי להשתמש בהטמעות? (ללא פעולה, קריאה בלבד)

בתרחיש ההישרדות, הזמן הוא קריטי. כשניצול או ניצולת מדווחים על מקרה חירום, כמו I need someone who can treat burns או Looking for a medic, הם לא יכולים לבזבז זמן בניסיון לנחש את השמות המדויקים של הכישורים במסד הנתונים.

הבעיה בחיפוש המסורתי:

התאמה מדויקת: חיפוש מילת המפתח 'רופא' לא ימצא את 'הכשרה רפואית' או 'עזרה ראשונה'
אי התאמה במינוח: ניצולי אלימות עשויים להשתמש במילים כמו "רופא", "מטפל" או "חובש", אבל במסד הנתונים מאוחסנים שמות רשמיים של כישורים
אובדן הקשר: החיפוש של "treat burns" (טיפול בכוויות) צריך למצוא גם את "Medical Training" (הכשרה רפואית) וגם את "First Aid" (עזרה ראשונה), אבל חיפוש טקסט פשוט לא יבין את הקשר הסמנטי

הפתרון: חיפוש סמנטי עם הטמעות: הטמעות ממירות טקסט לוקטורים עם 768 ממדים שמייצגים משמעות, ולא רק איות. מושגים דומים מתקבצים יחד במרחב הווקטורי, כך שהמילה "חובש" מוצאת באופן טבעי את המילה "הכשרה רפואית" גם אם אין חפיפה בין המילים.

תרחיש אמיתי: Survivor: Captain Tanaka has burns—we need medical help NOW!

חיפוש מילות מפתח מסורתי של 'רופא' → 0 תוצאות ❌

חיפוש סמנטי עם הטמעות ← מוצא את 'הכשרה רפואית', 'עזרה ראשונה' ✅

זה בדיוק מה שסוכנים צריכים: חיפוש חכם שדומה לחיפוש אנושי ומבין את הכוונה, ולא רק מילות מפתח.

למה כדאי לבחור ב-Spanner?: במקום לייצא נתונים ל-Python, ליצור הטמעות באופן חיצוני ולייבא אותן מחדש (תהליך איטי שעלול להוביל לשגיאות), הפונקציה ML.PREDICT של Spanner מאפשרת לכם:

יצירת הטמעות ישירות ב-SQL באמצעות מודלים של Vertex AI
אחסון וקטורים לצד נתוני גרף (אין מסד נתונים נפרד של וקטורים)
ביצוע שאילתות של חיפוש סמנטי בזמן אמת במהלך מעבר על גרפים

כך נוצרת מערכת Graph RAG עוצמתית: קשרים בין צמתים בתרשים (למי יש איזו מיומנות) + חיפוש סמנטי (חיפוש מיומנויות לפי משמעות) = שאילתות של סוכן חכם.

2. יצירת מודל הטמעה

מהי הפונקציה ML.PREDICT?

‫ML.PREDICT היא פונקציה מובנית ב-Spanner שמאפשרת להפעיל מודלים של למידת מכונה ישירות מ-SQL – בלי Python, בלי ייצוא או ייבוא ובלי שירותים נפרדים. אפשר לחשוב על זה כגישור בין מסד הנתונים לבין Vertex AI בזמן אמת.

איך זה עובד:

יוצרים מודל וירטואלי ב-Spanner (רק הפניה, בלי משקלי מודל שמאוחסנים באופן מקומי)
כשמשתמשים ב-ML.PREDICT(model, data) בשאילתה, מערכת Spanner שולחת את הנתונים ל-Vertex AI באמצעות API
‫Vertex AI מעבד את הנתונים ומחזיר תוצאות כעמודות בתוצאת ה-SQL.

למה זה חשוב:

‫✅ Zero-ETL: עיבוד נתונים במקום שבו הם נמצאים – ללא ייצוא לסקריפטים של Python
‫✅ בזמן אמת: יצירת הטבעות או תשובות של מודל שפה גדול (LLM) תוך כדי השאילתות
‫✅ Scalable: Spanner מטפל בארגון, Vertex AI מטפל בחישובים

spanner_embedding

עכשיו ניצור מודל שממיר טקסט להטמעות באמצעות text-embedding-004 של Google.

‫👈 ב-Spanner Studio, מריצים את ה-SQL הזה (מחליפים את $YOUR_PROJECT_ID במזהה הפרויקט בפועל):

‼️ בעורך של Cloud Shell, פותחים את File -> Open Folder -> way-back-home/level_2 כדי לראות את הפרויקט כולו.

project_id

‫👈 מריצים את השאילתה הזו ב-Spanner Studio על ידי העתקה והדבקה של השאילתה שלמטה, ואז לוחצים על הלחצן Run:

CREATE MODEL TextEmbeddings
INPUT(content STRING(MAX))
OUTPUT(embeddings STRUCT<values ARRAY<FLOAT32>>)
REMOTE OPTIONS (
    endpoint = '//aiplatform.googleapis.com/projects/$YOUR_PROJECT_ID/locations/us-central1/publishers/google/models/text-embedding-004'
);

מה זה עושה:

יוצרת מודל וירטואלי ב-Spanner (משקלי המודל לא נשמרים באופן מקומי)
נקודות ל-text-embedding-004 של Google ב-Vertex AI
הגדרת החוזה: הקלט הוא טקסט, הפלט הוא מערך של מספרים ממשיים עם 768 ממדים

למה 'אפשרויות מרחוק'?

‫Spanner לא מפעיל את המודל עצמו
הוא קורא ל-Vertex AI באמצעות API כשמשתמשים ב-ML.PREDICT
‫Zero-ETL: אין צורך לייצא נתונים ל-Python, לעבד אותם ולייבא אותם מחדש

לוחצים על הלחצן Run. אם הפעולה מצליחה, התוצאה מוצגת כמו בדוגמה הבאה:

spanner_result

3. הוספת עמודה של הטמעה

‫👉 מוסיפים עמודה לאחסון הטמעות:

ALTER TABLE Skills ADD COLUMN skill_embedding ARRAY<FLOAT32>;

לוחצים על הלחצן Run. אם הפעולה מצליחה, התוצאה מוצגת כמו בדוגמה הבאה:

embedding_result

4. יצירת הטמעות

‫👈 שימוש ב-AI כדי ליצור הטמעות וקטוריות לכל מיומנות:

UPDATE Skills
SET skill_embedding = (
    SELECT embeddings.values
    FROM ML.PREDICT(
        MODEL TextEmbeddings,
        (SELECT name AS content)
    )
)
WHERE skill_embedding IS NULL;

לוחצים על הלחצן Run. אם הפעולה מצליחה, התוצאה מוצגת כמו בדוגמה הבאה:

skills_result

מה קורה: כל שם של מיומנות (למשל, 'עזרה ראשונה') מומר לווקטור של 768 ממדים שמייצג את המשמעות הסמנטית שלו.

5. אימות ההטמעות

‫👈 בודקים שההטמעות נוצרו:

SELECT 
    skill_id,
    name,
    ARRAY_LENGTH(skill_embedding) AS embedding_dimensions
FROM Skills
LIMIT 5;

הפלט המצופה:

spanner_result

6. בדיקת חיפוש סמנטי

עכשיו נבדוק את תרחיש השימוש המדויק מהדוגמה שלנו: חיפוש כישורים רפואיים באמצעות המונח 'רופא'.

‫👉 חיפוש מיומנויות דומות ל'חובש/ת':

WITH query_embedding AS (
    SELECT embeddings.values AS val
    FROM ML.PREDICT(MODEL TextEmbeddings, (SELECT "medic" AS content))
)
SELECT
    s.name AS skill_name,
    s.category,
    COSINE_DISTANCE(s.skill_embedding, (SELECT val FROM query_embedding)) AS distance
FROM Skills AS s
WHERE s.skill_embedding IS NOT NULL
ORDER BY distance ASC
LIMIT 10;

המרת מונח החיפוש של המשתמש 'רופא' להטמעה
מאחסן אותו בquery_embedding טבלה זמנית

התוצאות הצפויות (מרחק קטן יותר = דמיון רב יותר):

spanner_result

7. יצירת מודל Gemini לניתוח

spanner_gemini

‫👈 יוצרים הפניה למודל AI גנרטיבי (מחליפים את $YOUR_PROJECT_ID במזהה הפרויקט בפועל):

CREATE MODEL GeminiPro
INPUT(prompt STRING(MAX))
OUTPUT(content STRING(MAX))
REMOTE OPTIONS (
    endpoint = '//aiplatform.googleapis.com/projects/$YOUR_PROJECT_ID/locations/us-central1/publishers/google/models/gemini-2.5-pro',
    default_batch_size = 1
);

הבדל ממודל ההטמעות:

הטמעות: טקסט → וקטור (לחיפוש דמיון)
‫Gemini: טקסט ← טקסט שנוצר (לנימוק או לניתוח)

spanner_result

8. שימוש ב-Gemini לניתוח תאימות

‫👉 ניתוח של זוגות שורדים לצורך התאמה למשימה:

WITH PairData AS (
    SELECT
        s1.name AS Name_A,
        s2.name AS Name_B,
        CONCAT(
            "Assess compatibility of these two survivors for a resource-gathering mission. ",
            "Survivor 1: ", s1.name, ". ",
            "Survivor 2: ", s2.name, ". ",
            "Give a score from 1-10 and a 1-sentence reason."
        ) AS prompt
    FROM Survivors s1
    JOIN Survivors s2 ON s1.survivor_id < s2.survivor_id
    LIMIT 1
)
SELECT
    Name_A,
    Name_B,
    content AS ai_assessment
FROM ML.PREDICT(
    MODEL GeminiPro,
    (SELECT Name_A, Name_B, prompt FROM PairData)
);

הפלט המצופה:

Name_A          | Name_B            | ai_assessment
----------------|-------------------|----------------
"David Chen"    | "Dr. Elena Frost" | "**Score: 9/10** Their compatibility is extremely high as David's practical, hands-on scavenging skills are perfectly complemented by Dr. Frost's specialized knowledge to identify critical medical supplies and avoid biological hazards."

איך זה עובד:

1. יצירת הנחיות מנתונים:

CONCAT("Assess compatibility...", "Survivor 1: ", s1.name, ...)

תוצאה: "Assess compatibility of these two survivors for a resource-gathering mission. Survivor 1: David Chen. Survivor 2: Dr. Elena Frost. Give a score from 1-10 and a 1-sentence reason."

2. שליחה אל Gemini:

ML.PREDICT(MODEL GeminiPro, (SELECT prompt FROM PairData))

‫Spanner שולח את ההנחיה ל-Gemini API.

3. ‫Gemini יוצר תשובה:

"**Score: 9/10** Their compatibility is extremely high as David's practical, 
hands-on scavenging skills are perfectly complemented by Dr. Frost's specialized 
knowledge to identify critical medical supplies and avoid biological hazards."

4. החזרה כעמודה: הטקסט שנוצר מוחזר כעמודה content.

למה כדאי להשתמש בקריאות ל-LLM בתוך מסד הנתונים?

אין צורך לייצא נתונים ל-Python
עיבוד הנתונים במקום שבו הם נמצאים
אפשר להגדיל את מספר השורות למיליונים (עיבוד באצווה)

6. Building Your Graph RAG Agent with Hybrid Search

1. סקירה כללית של ארכיטקטורת המערכת

בקטע הזה נבנה מערכת חיפוש מרובת שיטות שמאפשרת לסוכן לטפל בגמישות בסוגים שונים של שאילתות. למערכת יש שלוש שכבות: שכבת הסוכן, שכבת הכלים ושכבת השירות.

architecture_hybrid_search

למה שלוש שכבות?

הפרדה בין תחומים: הסוכן מתמקד בכוונות, כלי העבודה מתמקדים בממשק והשירות מתמקד בהטמעה
גמישות: הסוכן יכול להפעיל שיטות ספציפיות או לאפשר ל-AI לבחור את הנתיב באופן אוטומטי
אופטימיזציה: אפשר לדלג על ניתוח יקר של AI כשהשיטה ידועה

בקטע הזה, תטמיעו בעיקר חיפוש סמנטי (RAG) – חיפוש תוצאות לפי משמעות ולא רק לפי מילות מפתח. בהמשך נסביר איך חיפוש היברידי משלב כמה שיטות.

2. הטמעה של שירות RAG

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/services/hybrid_search_service.py

איתור התגובה # TODO: REPLACE_SQL

מחליפים את כל השורה הזו בקוד הבא:

        # This is your working query from the successful run!
        sql = """
            WITH query_embedding AS (
                SELECT embeddings.values AS val
                FROM ML.PREDICT(
                    MODEL TextEmbeddings,
                    (SELECT @query AS content)
                )
            )
            SELECT
                s.survivor_id,
                s.name AS survivor_name,
                s.biome,
                sk.skill_id,
                sk.name AS skill_name,
                sk.category,
                COSINE_DISTANCE(
                    sk.skill_embedding, 
                    (SELECT val FROM query_embedding)
                ) AS distance
            FROM Survivors s
            JOIN SurvivorHasSkill shs ON s.survivor_id = shs.survivor_id
            JOIN Skills sk ON shs.skill_id = sk.skill_id
            WHERE sk.skill_embedding IS NOT NULL
            ORDER BY distance ASC
            LIMIT @limit
        """

3. הגדרה של כלי לחיפוש סמנטי

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/agent/tools/hybrid_search_tools.py

ב-hybrid_search_tools.py, מאתרים את התגובה # TODO: REPLACE_SEMANTIC_SEARCH_TOOL

‫👈Replace this whole line with the following code:

async def semantic_search(query: str, limit: int = 10) -> str:
    """
    Force semantic (RAG) search using embeddings.
    
    Use this when you specifically want to find things by MEANING,
    not just matching keywords. Great for:
    - Finding conceptually similar items
    - Handling vague or abstract queries
    - When exact terms are unknown
    
    Example: "healing abilities" will find "first aid", "surgery", 
    "herbalism" even though no keywords match exactly.
    
    Args:
        query: What you're looking for (describe the concept)
        limit: Maximum results
        
    Returns:
        Semantically similar results ranked by relevance
    """
    try:
        service = _get_service()
        result = service.smart_search(
            query, 
            force_method=SearchMethod.RAG,
            limit=limit
        )
        
        return _format_results(
            result["results"],
            result["analysis"],
            show_analysis=True
        )
        
    except Exception as e:
        return f"Error in semantic search: {str(e)}"

מתי הסוכן משתמש:

שאילתות שבהן מבקשים למצוא דברים דומים ("find similar to X")
שאילתות מושגיות ("יכולות ריפוי")
מתי חשוב להבין את המשמעות

4. מדריך לקבלת החלטות (הוראות)

בהגדרת הסוכן, מעתיקים ומדביקים את החלק שקשור לחיפוש סמנטי בהוראה.

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/agent/agent.py

הסוכן משתמש בהוראה הזו כדי לבחור את הכלי המתאים:

‫👈 בקובץ agent.py, מאתרים את התגובה # TODO: REPLACE_SEARCH_LOGIC, Replace this whole line ומחליפים אותה בקוד הבא:

- `semantic_search`: Force RAG/embedding search
  Use for: "Find similar to X", conceptual queries, unknown terminology
  Example: "Find skills related to healing"

‫👈 מאתרים את התגובה # TODO: ADD_SEARCH_TOOLReplace this whole line ומחליפים אותה בקוד הבא:

    semantic_search,         # Force RAG

5. הסבר על אופן הפעולה של חיפוש היברידי (לקריאה בלבד, לא נדרשת פעולה)

בשלבים 2-4, הטמעתם חיפוש סמנטי (RAG), שיטת החיפוש העיקרית שמוצאת תוצאות לפי משמעות. אבל יכול להיות ששמתם לב שהמערכת נקראת 'חיפוש היברידי'. כך הכל מתחבר:

שלוש שיטות החיפוש שזמינות:

חיפוש סמנטי (RAG) – מה שהטמעתם עכשיו

שימוש בהטמעות + COSINE_DISTANCE
הכי מתאים ל: שאילתות מושגיות, חיפוש של "דומה ל-X"
דוגמה: החיפוש של 'יכולות ריפוי' ימצא את 'עזרה ראשונה', 'ניתוח', 'רפואה טבעית'

חיפוש באמצעות מילת מפתח – סינון SQL מסורתי

משתמש בסעיפי LIKE ובהתאמות מדויקות של קטגוריות
הכי מתאים ל: מסננים ספציפיים כמו ביומה, קטגוריה
דוגמה: 'medical skills in forest' (מיומנויות רפואיות ביער) מסנן לפי קטגוריה ומיקום

חיפוש היברידי – שילוב של שתי השיטות

מריץ את שני החיפושים וממזג את התוצאות עם ציונים משוקללים
הכי מתאים ל: שאילתות מורכבות עם מושגים ומסננים
דוגמה: "מי יכול לעזור לי להירגע בהרים?"

איך מיזוג היברידי עובד:

בקובץ way-back-home/level_2/backend/services/hybrid_search_service.py, כשקוראים ל-hybrid_search(), השירות מריץ את שני החיפושים וממזג את התוצאות:

# Location: backend/services/hybrid_search_service.py

    rank_kw = keyword_ranks.get(surv_id, float('inf'))
    rank_rag = rag_ranks.get(surv_id, float('inf'))

    rrf_score = 0.0
    if rank_kw != float('inf'):
        rrf_score += 1.0 / (K + rank_kw)
    if rank_rag != float('inf'):
        rrf_score += 1.0 / (K + rank_rag)

    combined_score = rrf_score

כשקוראים ל-hybrid_search(), השירות מריץ את שני החיפושים וממזג את התוצאות באמצעות Reciprocal Rank Fusion (RRF).

מה זה RRF? RRF הוא אלגוריתם סטנדרטי למיזוג רשימות מדורגות ממנועי חיפוש שונים, בלי הצורך לנרמל את הציונים שלהן. השיטה הזו פועלת על ידי מתן ציון שמבוסס על מיקום הדירוג (מקום ראשון, שני, שלישי) ולא על ציון הדמיון הגולמי.

מתי משתמשים בכל שיטה?

הסוכן (backend/agent/agent.py) מחליט על סמך השאילתה:

סוג שאילתה	הנציג בוחר	סיבה
‫"Find survivors in forest" ‏(מצא ניצולים ביער)	`keyword_search`	מסנן פשוט, לא נדרש מסנן סמנטי
"מי יכול לטפל בפציעות?"	`semantic_search`	מושגי, צריך משמעות
‫"Medical help in mountains" (עזרה רפואית בהרים)	`hybrid_search`	מכיל גם קונספט וגם מסנן

ב-codelab הזה הטמעתם את הרכיב semantic search (RAG), שהוא הבסיס. השיטות של מילות המפתח והשיטה ההיברידית כבר מוטמעות בשירות – הנציג שלכם יכול להשתמש בכל שלוש השיטות.

מעולה! סיימתם בהצלחה את הסוכן שלכם עם חיפוש היברידי של Graph RAG!

7. בדיקת הנציג באמצעות ADK Web

הדרך הקלה ביותר לבדוק את הסוכן היא באמצעות הפקודה adk web, שמפעילה את הסוכן עם ממשק צ'אט מובנה.

1. הרצת הסוכן

‫👈💻 עוברים לספריית ה-Backend (שבה מוגדר הנציג) ומפעילים את ממשק האינטרנט::

cd ~/way-back-home/level_2/backend
uv run adk web

הפקודה הזו מפעילה את הסוכן שמוגדר ב-

agent/agent.py

ונפתח ממשק אינטרנט לבדיקה.

‫👉 פותחים את כתובת ה-URL:

הפקודה תחזיר כתובת URL מקומית (בדרך כלל http://127.0.0.1:8000 או דומה). פותחים את הקובץ בדפדפן.

adk web

אחרי שתלחצו על כתובת ה-URL, תראו את ממשק האינטרנט של ADK. חשוב לוודא שבוחרים את הסוכן בפינה הימנית העליונה.

adk_ui

2. בדיקת יכולות החיפוש

הסוכן הדיגיטלי מתוכנן להפנות את השאילתות שלכם בצורה חכמה. כדי לראות שיטות חיפוש שונות בפעולה, נסו להזין את הקלט הבא בחלון הצ'אט.

🧬 א. Graph RAG (חיפוש סמנטי)

החיפוש מתבצע על סמך משמעות ומושג, גם אם מילות המפתח לא תואמות.

שאילתות לבדיקה: (בוחרים אחת מהאפשרויות הבאות)

Who can help with injuries?

What abilities are related to survival?

מה צריך לחפש:

ההסבר צריך לכלול את המילים סמנטי או RAG.
אמורות להופיע תוצאות שקשורות מבחינה רעיונית (למשל, 'ניתוח' כשמבקשים 'עזרה ראשונה').
התוצאות יכללו את הסמל 🧬.

🔀 ב. חיפוש היברידי

משלב בין מסנני מילות מפתח לבין הבנה סמנטית של שאילתות מורכבות.

שאילתות לבדיקה:(בוחרים אחת מהאפשרויות הבאות)

Find someone who can ply a plane in the volcanic area

Who has healing abilities in the FOSSILIZED?

Who has healing abilities in the mountains?

מה צריך לחפש:

בנימוק צריך להזכיר חיפוש היברידי.
התוצאות צריכות להתאים לשני הקריטריונים (הקונספט + המיקום או הקטגוריה).
לתוצאות שנמצאו בשתי השיטות יופיע הסמל 🔀 והן ידורגו במקום הגבוה ביותר.

‫👈💻 כשמסיימים את הבדיקה, מקישים על Ctrl+C בשורת הפקודה כדי לסיים את התהליך.

8. הרצת האפליקציה המלאה

סקירה כללית על ארכיטקטורת Full Stack

architecture_fullstack

הוספת SessionService ו-Runner

‫👈💻 בטרמינל, פותחים את הקובץ chat.py ב-Cloud Shell Editor על ידי הפעלת הפקודה (חשוב לוודא שלחצתם על Ctrl+C כדי לסיים את התהליך הקודם לפני שתמשיכו):

cloudshell edit ~/way-back-home/level_2/backend/api/routes/chat.py

‫👈בקובץ chat.py, מאתרים את התגובה # TODO: REPLACE_INMEMORY_SERVICES, Replace this whole line ומחליפים אותה בקוד הבא:

    session_service = InMemorySessionService()
    memory_service = InMemoryMemoryService()

‫👈בקובץ chat.py, מאתרים את התגובה # TODO: REPLACE_RUNNER, Replace this whole line ומחליפים אותה בקוד הבא:

runner = Runner(
    agent=root_agent, 
    session_service=session_service,
    memory_service=memory_service,
    app_name="survivor-network"
)

1. הגשת בקשה

אם הטרמינל הקודם עדיין פועל, צריך לסיים את הפעולה שלו על ידי לחיצה על Ctrl+C.

‫👉💻 הפעלת האפליקציה:

cd ~/way-back-home/level_2/
./start_app.sh

כשהקצה העורפי יופעל בהצלחה, תופיע ההודעה Local: http://localhost:5173/" כמו בדוגמה הבאה: fronted

‫👈 לוחצים על Local: http://localhost:5173/‎ במסוף.

שיחה

2. בדיקת חיפוש סמנטי

שאילתה:

Find skills similar to healing

צ'אט, צ'ט, צאט, צט

מה קורה:

הסוכן מזהה בקשה לחיפוש דמיון
יוצר הטמעה של המילה healing
משתמשת במרחק קוסינוס כדי למצוא מיומנויות דומות מבחינה סמנטית
התוצאה: עזרה ראשונה (למרות שהשמות לא תואמים ל'ריפוי')

3. בדיקת חיפוש היברידי

שאילתה:

Find medical skills in the mountains

מה קורה:

רכיב מילות מפתח: סינון לפי category='medical'
רכיב סמנטי: הטמעה של 'רפואי' ודירוג לפי דמיון
מיזוג: שילוב התוצאות, עם עדיפות לתוצאות שנמצאו בשתי השיטות 🔀

שאילתה(אופציונלי):

Who is good at survival and in the forest?

מה קורה:

מילות מפתח שנמצאו: biome='forest'
חיפוש סמנטי: מיומנויות דומות ל'הישרדות'
השיטה ההיברידית משלבת בין שתי השיטות כדי להשיג את התוצאות הטובות ביותר

‫👈💻 כשמסיימים את הבדיקה, מקישים על Ctrl+C במסוף כדי לסיים אותה.

9. צינור מרובה מצבים – שכבת כלי הפיתוח

למה צריך צינור עיבוד נתונים מולטימודאלי?

הרשת לתמיכה בניצולי אלימות היא לא רק טקסט. ניצולים בשטח שולחים נתונים לא מובנים ישירות דרך הצ'אט:

📸 תמונות: תמונות של משאבים, סיכונים או ציוד
‫🎥 סרטונים: דוחות סטטוס או שידורי SOS
‫📄 Text: הערות או יומנים מהשטח

אילו קבצים אנחנו מעבדים?

בניגוד לשלב הקודם שבו חיפשנו נתונים קיימים, כאן אנחנו מעבדים קבצים שהמשתמש העלה. הממשק של chat.py מטפל בקבצים מצורפים באופן דינמי:

מקור	תוכן	יעד
User Attachment	תמונה/סרטון/טקסט	מידע להוספה לתרשים
הקשר של הצ'אט	"Here is a photo of the supplies"	כוונה ופרטים נוספים

הגישה המתוכננת: צינור סוכנים עוקב

אנחנו משתמשים בסוכן רציף (multimedia_agent.py) שמשלב בין סוכנים מומחים:

architecture_uploading

ההגדרה הזו מופיעה ב-backend/agent/multimedia_agent.py כSequentialAgent.

שכבת כלי הפיתוח מספקת את היכולות שהסוכנים יכולים להפעיל. הכלים מטפלים ב'איך' – העלאת קבצים, חילוץ ישויות ושמירה במסד הנתונים.

1. פתיחת קובץ הכלים

‫👉💻 פותחים טרמינל חדש. בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor:

cloudshell edit ~/way-back-home/level_2/backend/agent/tools/extraction_tools.py

2. הטמעה של הכלי `upload_media`

הכלי הזה מעלה קובץ מקומי ל-Google Cloud Storage.

‫👉 ב-extraction_tools.py, מאתרים את התגובה pass # TODO: REPLACE_UPLOAD_MEDIA_FUNCTION.

מחליפים את כל השורה הזו בקוד הבא:

    """
    Upload media file to GCS and detect its type.
    
    Args:
        file_path: Path to the local file
        survivor_id: Optional survivor ID to associate with upload
        
    Returns:
        Dict with gcs_uri, media_type, and status
    """
    try:
        if not file_path:
            return {"status": "error", "error": "No file path provided"}
        
        # Strip quotes if present
        file_path = file_path.strip().strip("'").strip('"')
        
        if not os.path.exists(file_path):
            return {"status": "error", "error": f"File not found: {file_path}"}
        
        gcs_uri, media_type, signed_url = gcs_service.upload_file(file_path, survivor_id)
        
        return {
            "status": "success",
            "gcs_uri": gcs_uri,
            "signed_url": signed_url,
            "media_type": media_type.value,
            "file_name": os.path.basename(file_path),
            "survivor_id": survivor_id
        }
    except Exception as e:
        logger.error(f"Upload failed: {e}")
        return {"status": "error", "error": str(e)}

3. הטמעה של הכלי `extract_from_media`

הכלי הזה הוא נתב – הוא בודק את media_type ושולח את הנתונים לחילוץ הנכון (טקסט, תמונה או סרטון).

‫👉ב-extraction_tools.py, מאתרים את התגובה pass # TODO: REPLACE_EXTRACT_FROM_MEDIA.

מחליפים את כל השורה הזו בקוד הבא:

    """
    Extract entities and relationships from uploaded media.
    
    Args:
        gcs_uri: GCS URI of the uploaded file
        media_type: Type of media (text/image/video)
        signed_url: Optional signed URL for public/temporary access
        
    Returns:
        Dict with extraction results
    """
    try:
        if not gcs_uri:
             return {"status": "error", "error": "No GCS URI provided"}

        # Select appropriate extractor
        if media_type == MediaType.TEXT.value or media_type == "text":
            result = await text_extractor.extract(gcs_uri)
        elif media_type == MediaType.IMAGE.value or media_type == "image":
            result = await image_extractor.extract(gcs_uri)
        elif media_type == MediaType.VIDEO.value or media_type == "video":
            result = await video_extractor.extract(gcs_uri)
        else:
            return {"status": "error", "error": f"Unsupported media type: {media_type}"}
            
        # Inject signed URL into broadcast info if present
        if signed_url:
            if not result.broadcast_info:
                result.broadcast_info = {}
            result.broadcast_info['thumbnail_url'] = signed_url
        
        return {
            "status": "success",
            "extraction_result": result.to_dict(), # Return valid JSON dict instead of object
            "summary": result.summary,
            "entities_count": len(result.entities),
            "relationships_count": len(result.relationships),
            "entities": [e.to_dict() for e in result.entities],
            "relationships": [r.to_dict() for r in result.relationships]
        }
    except Exception as e:
        logger.error(f"Extraction failed: {e}")
        return {"status": "error", "error": str(e)}

פרטי הטמעה חשובים:

קלט מולטימודאלי: אנחנו מעבירים את הנחיית הטקסט (_get_extraction_prompt()) ואת אובייקט התמונה אל generate_content.
פלט מובנה: response_mime_type="application/json" מוודא שמודל ה-LLM מחזיר JSON תקין, וזה חיוני לצינור.
קישור חזותי לישויות: ההנחיה כוללת ישויות מוכרות כדי ש-Gemini יוכל לזהות דמויות ספציפיות.

4. הטמעה של הכלי `save_to_spanner`

הכלי הזה שומר את הישויות והקשרים שחולצו במסד הנתונים של Spanner Graph.

‫👉ב-extraction_tools.py, מאתרים את התגובה pass # TODO: REPLACE_SPANNER_AGENT.

מחליפים את כל השורה הזו בקוד הבא:

    """
    Save extracted entities and relationships to Spanner Graph DB.
    
    Args:
        extraction_result: ExtractionResult object (or dict from previous step if passed as dict)
        survivor_id: Optional survivor ID to associate with the broadcast
        
    Returns:
        Dict with save statistics
    """
    try:
        # Handle if extraction_result is passed as the wrapper dict from extract_from_media
        result_obj = extraction_result
        if isinstance(extraction_result, dict) and 'extraction_result' in extraction_result:
             result_obj = extraction_result['extraction_result']
        
        # If result_obj is a dict (from to_dict()), reconstruct it
        if isinstance(result_obj, dict):
            from extractors.base_extractor import ExtractionResult
            result_obj = ExtractionResult.from_dict(result_obj)
        
        if not result_obj:
            return {"status": "error", "error": "No extraction result provided"}
            
        stats = spanner_service.save_extraction_result(result_obj, survivor_id)
        
        return {
            "status": "success",
            "entities_created": stats['entities_created'],
            "entities_existing": stats['entities_found_existing'],
            "relationships_created": stats['relationships_created'],
            "broadcast_id": stats['broadcast_id'],
            "errors": stats['errors'] if stats['errors'] else None
        }
    except Exception as e:
        logger.error(f"Spanner save failed: {e}")
        return {"status": "error", "error": str(e)}

אנחנו מספקים לסוכנים כלים ברמה גבוהה כדי להבטיח שלמות נתונים, תוך ניצול יכולות ההסקה של הסוכן.

5. עדכון שירות GCS

הכלי GCSService מטפל בהעלאה בפועל של הקובץ ל-Google Cloud Storage.

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor:

cloudshell edit ~/way-back-home/level_2/backend/services/gcs_service.py

‫👈 בקובץ gcs_service.py, מאתרים את התגובה # TODO: REPLACE_SAVE_TO_GCS בתוך הפונקציה upload_file.

מחליפים את כל השורה הזו בקוד הבא:

        blob = self.bucket.blob(blob_name)
        blob.upload_from_filename(file_path)

ההפשטה הזו לשירות מאפשרת לסוכן לא לדעת על דלי GCS, על שמות של אובייקטים בינאריים גדולים או על יצירה של כתובות URL חתומות. הוא רק מבקש "להעלות".

6. (לקריאה בלבד) למה תהליך עבודה מבוסס-סוכן עדיף על גישות מסורתיות?

יש שתי דרכים מסורתיות לבניית צינור כזה. לשתי הגישות האלה יש חסרונות משמעותיים, שתהליך העבודה מבוסס-הסוכן פותר.

‫❌ גישה 1: צינור עיבוד נתונים של נתונים מצטברים (פשוטה אבל שבירה)

סקריפט אופייני לעיבוד קבוצת קבצים באופן עקבי:

# Traditional batch pipeline
for file in ["broadcast_1.txt", "broadcast_2.png", "broadcast_3.mp4"]:
   gcs_uri = upload_to_gcs(file)        # Fails if file corrupted → CRASH
   entities = extract_entities(gcs_uri) # No error handling
   save_to_db(entities)                 # Saves even if extraction empty → WASTE
   # How do you tell the user progress? Print to console?

בעיות:

‫❌ No Adaptability: If one file fails, the whole script crashes
‫❌ No Context: Can't adjust behavior based on user intent ("This is urgent!")
‫❌ כשלים שקטים: שגיאות שמוסתרות ביומנים, למשתמש אין מושג מה קרה
‫❌ No User Feedback: Script runs in background, user waits blindly

‫❌ גישה 2: ארכיטקטורה מבוססת-אירועים (Cloud-Native אבל מורכבת)

הגדרה מסורתית של הענן:

העלאות של משתמשים ל-GCS
אירוע ב-GCS מפעיל פונקציה ב-Cloud Functions
קריאות לפונקציות Vision API
הפונקציה כותבת למסד הנתונים
…איך אנחנו מודיעים למשתמש שהפעולה הסתיימה? (Need WebSockets/Polling)

בעיות:

‫❌ מורכבות גבוהה: ניהול של 5 שירותים ומעלה (GCS, ‏ Eventarc, ‏ Cloud Functions, ‏ Pub/Sub...)
‫❌ Decoupled State: קשה להעביר נתונים בין הגורמים שמטפלים באירועים
‫❌ Debugging Nightmare: Logs scattered across multiple services
‫❌ Disconnected from User: Events run in background, no conversation context

‫✅ הגישה שלנו: צינור אג'נטי רציף

‫multimedia_agent.py משתמש ב-SequentialAgent שמארגן את צינור עיבוד הנתונים בצורה חכמה:

# Agentic pipeline (simplified conceptual view)
Agent: "I'll upload your file..."
Tool: upload_media → Success ✅
Agent: "Great! Now extracting entities..."
Tool: extract_from_media → Found 3 survivors, 2 resources ✅
Agent: "Perfect! Saving to database..."
Tool: save_to_spanner → Saved as broadcast #456 ✅
Agent: "Done! I found 3 survivors and 2 resources in your image. Saved to the graph."

היתרון של סוכנים:

תכונה	צינור עיבוד נתונים באצווה	מבוסס על אירועים	תהליך עבודה אג'נטי
מורכבות	נמוכה (סקריפט אחד)	גבוהה (5 שירותים ומעלה)	נמוך (קובץ Python אחד: `multimedia_agent.py`)
State Management	משתנים גלובליים	קשה (מנותק)	מאוחד (מצב הנציג)
טיפול בשגיאות	קריסות	יומנים שקטים	אינטראקטיבי ("לא הצלחתי לקרוא את הקובץ הזה")
משוב ממשתמשים	הדפסה של תמונות מהקונסולה	צריך להוסיף סקר	מיידי (חלק מהצ'אט)
גמישות	לוגיקה קבועה	פונקציות קשיחות	חכם (מודל LLM מחליט מה השלב הבא)
Context Awareness	ללא	ללא	מלאה (מזהה את כוונת המשתמש)

דוגמה מהעולם האמיתי:

Batch Script:

Processing file 1... Done.
Processing file 2... ERROR: Corrupted image
[CRASH - User has to restart entire batch]

תהליך עבודה אג'נטי:

User: "Here are 3 images of our supply cache"
Agent: "Processing image 1... Found medical supplies ✅"
Agent: "Processing image 2... This file seems corrupted. Skipping. ⚠️"
Agent: "Processing image 3... Found food supplies ✅"
Agent: "Summary: I successfully processed 2 of 3 images. Would you like to re-upload image 2?"

למה זה חשוב: באמצעות multimedia_agent.py (SequentialAgent עם 4 סוכני משנה: העלאה ← חילוץ ← שמירה ← סיכום), אנחנו מחליפים תשתית מורכבת ותסריטים שבירים בלוגיקה חכמה של אפליקציה שיכולה לנהל שיחה.

10. צינור נתונים מרובה מצבים – שכבת סוכן

שכבת ה-Agent מגדירה את האינטליגנציה – סוכנים שמשתמשים בכלים כדי להשלים משימות. לכל סוכן יש תפקיד ספציפי, והוא מעביר את ההקשר לסוכן הבא. בהמשך מופיע תרשים ארכיטקטורה של מערכת מרובת סוכנים.

agent_diagram

1. פתיחת קובץ הסוכן

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor:

cloudshell edit ~/way-back-home/level_2/backend/agent/multimedia_agent.py

2. הגדרת סוכן ההעלאה

הסוכן הזה מחלץ נתיב קובץ מההודעה של המשתמש ומעלה אותו ל-GCS.

‫👉 בקובץ multimedia_agent.py, מאתרים את התגובה # TODO: REPLACE_UPLOAD_AGENT.

מחליפים את כל השורה הזו בקוד הבא:

upload_agent = LlmAgent(
    name="UploadAgent",
    model="gemini-2.5-flash",
    instruction="""Extract the file path from the user's message and upload it.

Use `upload_media(file_path, survivor_id)` to upload the file.
The survivor_id is optional - include it if the user mentions a specific survivor (e.g., "survivor Sarah" -> "Sarah").
If the user provides a path like "/path/to/file", use that.

Return the upload result with gcs_uri and media_type.""",
    tools=[upload_media],
    output_key="upload_result"
)

3. הגדרת סוכן החילוץ

הסוכן הזה 'רואה' את המדיה שהועלתה ומחלץ נתונים מובְנים באמצעות Gemini Vision.

‫👉 בקובץ multimedia_agent.py, מאתרים את התגובה # TODO: REPLACE_EXTRACT_AGENT.

מחליפים את כל השורה הזו בקוד הבא:

extraction_agent = LlmAgent(
    name="ExtractionAgent", 
    model="gemini-2.5-flash",
    instruction="""Extract information from the uploaded media.

Previous step result: {upload_result}

Use `extract_from_media(gcs_uri, media_type, signed_url)` with the values from the upload result.
The gcs_uri is in upload_result['gcs_uri'], media_type in upload_result['media_type'], and signed_url in upload_result['signed_url'].

Return the extraction results including entities and relationships found.""",
    tools=[extract_from_media],
    output_key="extraction_result"
)

שימו לב לאופן שבו instruction מפנה אל {upload_result} – כך הסטטוס מועבר בין סוכנים ב-ADK.

4. הגדרת סוכן Spanner

הסוכן הזה שומר את הישויות והקשרים שחולצו במסד הנתונים הגרפי.

‫👉 בקובץ multimedia_agent.py, מאתרים את התגובה # TODO: REPLACE_SPANNER_AGENT.

מחליפים את כל השורה הזו בקוד הבא:

spanner_agent = LlmAgent(
    name="SpannerAgent",
    model="gemini-2.5-flash", 
    instruction="""Save the extracted information to the database.

Upload result: {upload_result}
Extraction result: {extraction_result}

Use `save_to_spanner(extraction_result, survivor_id)` to save to Spanner.
Pass the WHOLE `extraction_result` object/dict from the previous step.
Include survivor_id if it was provided in the upload step.

Return the save statistics.""",
    tools=[save_to_spanner],
    output_key="spanner_result"
)

הנציג הזה מקבל הקשר משני השלבים הקודמים (upload_result ו-extraction_result).

5. הגדרת סוכן הסיכום

הסוכן הזה מסכם את התוצאות מכל השלבים הקודמים לתשובה ידידותית למשתמש.

‫👉 בקובץ multimedia_agent.py, מאתרים את התגובה summary_instruction="" # TODO: REPLACE_SUMMARY_AGENT_PROMPT.

מחליפים את כל השורה הזו בקוד הבא:

USE_MEMORY_BANK = os.getenv("USE_MEMORY_BANK", "false").lower() == "true"
save_msg = "6. Mention that the data is also being synced to the memory bank." if USE_MEMORY_BANK else ""

summary_instruction = f"""Provide a user-friendly summary of the media processing.

Upload: {{upload_result}}
Extraction: {{extraction_result}}
Database: {{spanner_result}}

Summarize:
1. What file was processed (name and type)
2. Key information extracted (survivors, skills, needs, resources found) - list names and counts
3. Relationships identified
4. What was saved to the database (broadcast ID, number of entities)
5. Any issues encountered
{save_msg}

Be concise but informative."""

הסוכן הזה לא צריך כלים – הוא רק קורא את ההקשר המשותף ומפיק סיכום ברור למשתמש.

🧠 סיכום הארכיטקטורה

שכבה	קובץ	אחריות
כלים	`extraction_tools.py` + `gcs_service.py`	איך — העלאה, חילוץ ושמירה
Agent	`multimedia_agent.py`	מה – תזמור של צינור עיבוד הנתונים

11. צינור נתונים מולטימודאלי – תזמור

הליבה של המערכת החדשה שלנו היא MultimediaExtractionPipeline שמוגדר ב-backend/agent/multimedia_agent.py. הוא משתמש בתבנית Sequential Agent מ-ADK (ערכת פיתוח סוכנים).

1. למה כדאי להשתמש בשיטה עוקבת?

עיבוד של העלאה הוא שרשרת של תלות לינארית:

אי אפשר לחלץ נתונים עד שהקובץ (ההעלאה) יהיה זמין.
אי אפשר לשמור נתונים לפני שמחלצים אותם (חילוץ).
אי אפשר לסכם לפני שמקבלים את התוצאות (שמירה).

SequentialAgent הוא הפתרון המושלם לכך. הפלט של סוכן אחד מועבר כהקשר או כקלט לסוכן הבא.

2. הגדרת הסוכן

בואו נראה איך הצינור מורכב בחלק התחתון של multimedia_agent.py: 👉💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הרצת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/agent/multimedia_agent.py

הוא מקבל קלט משני השלבים הקודמים. מחפשים את התגובה # TODO: REPLACE_ORCHESTRATION. מחליפים את כל השורה הזו בקוד הבא:

    sub_agents=[upload_agent, extraction_agent, spanner_agent, summary_agent]

3. יצירת קשר עם נציג

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/agent/agent.py

מחפשים את התגובה # TODO: REPLACE_ADD_SUBAGENT. מחליפים את כל השורה הזו בקוד הבא:

    sub_agents=[multimedia_agent],

האובייקט היחיד הזה מאגד למעשה ארבעה "מומחים" בישות אחת שאפשר להפעיל.

4. זרימת נתונים בין סוכנים

כל סוכן שומר את הפלט שלו בהקשר משותף שסוכנים עוקבים יכולים לגשת אליו:

architecture_uploading

5. פתיחת האפליקציה (אפשר לדלג אם האפליקציה עדיין פועלת)

‫👉💻 הפעלת האפליקציה:

cd ~/way-back-home/level_2/
./start_app.sh

‫👈 לוחצים על Local: http://localhost:5173/‎ במסוף.

6. בדיקת העלאת תמונה

‫👈 בממשק הצ'אט, בוחרים תמונה ומעלים אותה לממשק:

בממשק הצ'אט, מסבירים לסוכן את ההקשר הספציפי:

Here is the survivor note

ואז לצרף את התמונה כאן.

upload_input

upload_result

‫👈💻 במסוף, כשמסיימים את הבדיקה, מקישים על Ctrl+C כדי לסיים את התהליך.

מה קורה מאחורי הקלעים:

‫UploadAgent:

העלאת קובץ ל-Google Cloud Storage
מזהה את סוג המדיה (תמונה/טקסט/סרטון)
יצירת כתובת URL חתומה לגישה

‫ExtractionAgent:

הורדת תמונה מ-GCS
שליחה אל Gemini Vision עם הנחיית חילוץ
‫AI מנתח את התמונה כדי:
- ניצולים (שמות, תנאים, תפקידים)
- משאבים (ציוד רפואי, כלים)
- מיקומים (ביומים, קואורדינטות)
- קשרים (מי נמצא איפה, מי קשור למי)

‫SpannerAgent:

יצירת צמתי ישויות חדשים ב-Spanner
יצירת קצוות של קשרים
יצירת הקלטה של השידור עם תמונה ממוזערת

‫SummaryAgent:

יצירת סיכום ידידותי למשתמש
דוח מובנה של החזרות

6. אימות העלאה מרובת-אופנים בדלי GCS

פותחים את האחסון במסוף Google Cloud.
בוחרים באפשרות 'קטגוריה' באחסון בענן

gcs

בוחרים את הקטגוריה ולוחצים על media.

מדיה

כאן אפשר לראות את התמונה שהעליתם.

7. אימות ההעלאה של נתונים מרובי-אופנים ב-Spanner (אופציונלי)

למטה מוצגת דוגמה של פלט בממשק המשתמש עבור test_photo1.

אחרי שמעלים את test_photo1 עם הערה Here is the survivor note. אתם יכולים לראות את ההודעה

**Summary:** A field report written on a clipboard details the discovery of an 'Energy Crystal' by David Chen in a 'Bioluminescent Forest', with the status marked as 'Critical'. The scene also includes a lit lantern, a pen, and a compass.

**Entities Found:**
*   **David Chen** (Survivor): The agent who filed this field report. His known role is Engineer.
*   **Engineer** (Skill): David Chen's known role or skill.
*   **Energy Crystal** (Resource): A newly discovered resource, depicted as a glowing blue crystal in a sketch on the report. Its purpose is implied to be energy-related.
*   **Bioluminescent Forest** (Biome): The location where the energy crystal was found. This matches the known biome description of a dark forest with glowing purple/neon plants and mushrooms.
*   **Critical Situation** (Need): The overall status of the situation is critical, indicating an urgent need for attention, response, or resource allocation.

**Relationships Found:**
*   **David Chen** (Survivor) found **Energy Crystal** (Resource).
*   **David Chen** (Survivor) is in **Bioluminescent Forest** (Biome).
*   **David Chen** (Survivor) has the skill **Engineer**.I have successfully saved the extracted information to the Spanner database.

Here are the save statistics:
*   **Broadcast ID:** `5892fb58-a120-46ca-80c2-0e04da7d6ea7`
*   **Entities Created:** 4
*   **Existing Entities:** 1
*   **Relationships Created:** 3
*   **Status:** successHere's a summary of the media processing:

במקרה הזה, אנחנו צריכים לאמת אם spanner עדכן בהצלחה את המידע של:

*   **David Chen** (Survivor) found **Energy Crystal** (Resource).
*   **David Chen** (Survivor) is in **Bioluminescent Forest** (Biome).
*   **David Chen** (Survivor) has the skill **Engineer**.I have

פותחים את מסוף Google Cloud Spanner.
בוחרים את המופע: Survivor Network
בוחרים את מסד הנתונים: graph-db
בסרגל הצדדי הימני, לוחצים על Spanner Studio.

‫👈 ב-Spanner Studio, מריצים שאילתה על הנתונים החדשים:

SELECT 
  s.name AS Survivor,
  s.role AS Role,
  b.name AS Biome,
  r.name AS FoundResource,
  s.created_at
FROM Survivors s
LEFT JOIN SurvivorInBiome sib ON s.survivor_id = sib.survivor_id
LEFT JOIN Biomes b ON sib.biome_id = b.biome_id
LEFT JOIN SurvivorFoundResource sfr ON s.survivor_id = sfr.survivor_id
LEFT JOIN Resources r ON sfr.resource_id = r.resource_id
ORDER BY s.created_at DESC;

אנחנו יכולים לאמת את זה באמצעות התוצאה שמופיעה למטה:

spanner_verify

12. Memory Bank עם Agent Engine

1. איך הזיכרון פועל

המערכת משתמשת בגישה של זיכרון כפול כדי לטפל בהקשר מיידי וגם בלמידה לטווח ארוך.

memory_bank

2. מהם נושאי זיכרון?

נושאי הזיכרון מגדירים את הקטגוריות של המידע שהנציג צריך לזכור לאורך השיחות. אפשר לחשוב עליהם כמו ארונות תיוק להעדפות משתמשים מסוגים שונים.

שני הנושאים שלנו:

‫search_preferences: איך המשתמש אוהב לחפש
- האם הם מעדיפים חיפוש לפי מילות מפתח או חיפוש סמנטי?
- אילו מיומנויות או ביומים הם מחפשים לעיתים קרובות?
- דוגמה לזיכרון: "המשתמש מעדיף חיפוש סמנטי כדי למצוא מידע על כישורים רפואיים"
‫urgent_needs_context: אילו משברים הם עוקבים
- אילו משאבים הם מנטרים?
- אילו שורדים מעוררים בהם דאגה?
- דוגמה לזיכרון: "המשתמש עוקב אחרי מחסור בתרופות במחנה הצפוני"

למה 2 נושאים?

דיוק: מודל ה-LLM יכול לחלץ עובדות לקטגוריה הנכונה
אחזור: כשהמשתמש מבקש "למצוא ניצולים עם כישורים רפואיים", הסוכן שולף נתונים מ-search_preferences, ולא מנתונים לא קשורים של צרכים דחופים
יכולת הרחבה: אפשר להוסיף עוד נושאים בהמשך (למשל, favorite_survivors, alliance_tracking)

איך זה עובד: כשמנהלים שיחה עם הסוכן, מאגר הזיכרון מחלץ באופן אוטומטי עובדות שתואמות לתיאורי הנושאים האלה ושומר אותן. בפעם הבאה שתתחילו סשן חדש, הנציג יאחזר זיכרונות רלוונטיים כדי להתאים אישית את התשובות.

3. הגדרת נושאי זיכרון

נושאי זיכרון בהתאמה אישית מגדירים מה הסוכן צריך לזכור. ההגדרות האלה נקבעות כשפורסים את Agent Engine.

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/deploy_agent.py

כדי לפתוח את ~/way-back-home/level_2/backend/deploy_agent.py בכלי העריכה.

אנחנו מגדירים אובייקטים של מבנה MemoryTopic כדי להנחות את מודל ה-LLM לגבי המידע שצריך לחלץ ולשמור.

‫👉 בקובץ deploy_agent.py, מחליפים את # TODO: SET_UP_TOPIC בטקסט הבא:

# backend/deploy_agent.py

    custom_topics = [
        # Topic 1: Survivor Search Preferences
        MemoryTopic(
            custom_memory_topic=CustomMemoryTopic(
                label="search_preferences",
                description="""Extract the user's preferences for how they search for survivors. Include:
                - Preferred search methods (keyword, semantic, direct lookup)
                - Common filters used (biome, role, status)
                - Specific skills they value or frequently look for
                - Geographic areas of interest (e.g., "forest biome", "mountain outpost")
                
                Example: "User prefers semantic search for finding similar skills."
                Example: "User frequently checks for survivors in the Swamp Biome."
                """,
            )
        ),
        # Topic 2: Urgent Needs Context
        MemoryTopic(
            custom_memory_topic=CustomMemoryTopic(
                label="urgent_needs_context",
                description="""Track the user's focus on urgent needs and resource shortages. Include:
                - Specific resources they are monitoring (food, medicine, ammo)
                - Critical situations they are tracking
                - Survivors they are particularly concerned about
                
                Example: "User is monitoring the medicine shortage in the Northern Camp."
                Example: "User is looking for a doctor for the injured survivors."
                """,
            )
        )
    ]

4. שילוב של סוכן

קוד הסוכן צריך לדעת על Memory Bank כדי לשמור ולאחזר מידע.

‫👈💻 בטרמינל, פותחים את הקובץ ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/agent/agent.py

כדי לפתוח את ~/way-back-home/level_2/backend/agent/agent.py בכלי העריכה.

יצירת סוכן

כשיוצרים את הסוכן, מעבירים את after_agent_callback כדי לוודא שהסשנים נשמרים בזיכרון אחרי האינטראקציות. הפונקציה add_session_to_memory פועלת באופן אסינכרוני כדי למנוע האטה בתשובות של הצ'אט.

‫👈 בקובץ agent.py, מאתרים את התגובה # TODO: REPLACE_ADD_SESSION_MEMORY, מחליפים את כל השורה הזו בקוד הבא:

async def add_session_to_memory(
        callback_context: CallbackContext
) -> Optional[types.Content]:
    """Automatically save completed sessions to memory bank in the background"""
    if hasattr(callback_context, "_invocation_context"):
        invocation_context = callback_context._invocation_context
        if invocation_context.memory_service:
            # Use create_task to run this in the background without blocking the response
            asyncio.create_task(
                invocation_context.memory_service.add_session_to_memory(
                    invocation_context.session
                )
            )
            logger.info("Scheduled session save to memory bank in background")

שמירה ברקע

‫👈 בקובץ agent.py, מאתרים את התגובה # TODO: REPLACE_ADD_MEMORY_BANK_TOOL, מחליפים את כל השורה הזו בקוד הבא:

if USE_MEMORY_BANK:
    agent_tools.append(PreloadMemoryTool())

‫👈 בקובץ agent.py, מאתרים את התגובה # TODO: REPLACE_ADD_CALLBACK, מחליפים את כל השורה הזו בקוד הבא:

    after_agent_callback=add_session_to_memory if USE_MEMORY_BANK else None

הגדרה של שירות הפעלות ב-Vertex AI

‫👈💻 בטרמינל, פותחים את הקובץ chat.py ב-Cloud Shell Editor על ידי הפעלת הפקודה:

cloudshell edit ~/way-back-home/level_2/backend/api/routes/chat.py

‫👈בקובץ chat.py, מאתרים את התגובה # TODO: REPLACE_VERTEXAI_SERVICES, Replace this whole line ומחליפים אותה בקוד הבא:

    session_service = VertexAiSessionService(
        project=project_id,
        location=location,
        agent_engine_id=agent_engine_id
    )
    memory_service = VertexAiMemoryBankService(
        project=project_id,
        location=location,
        agent_engine_id=agent_engine_id
    )

4. הגדרה ופריסה

לפני שבודקים את תכונות הזיכרון, צריך לפרוס את הנציג עם נושאי הזיכרון החדשים ולוודא שהסביבה מוגדרת בצורה נכונה.

לנוחותכם, סיפקנו סקריפט שיטפל בתהליך הזה.

הפעלת סקריפט הפריסה

‫👈💻 בטרמינל, מריצים את סקריפט הפריסה:

cd ~/way-back-home/level_2
./deploy_and_update_env.sh

הסקריפט הזה מבצע את הפעולות הבאות:

מריצים את הפקודה backend/deploy_agent.py כדי לרשום את הסוכן ואת נושאי הזיכרון ב-Vertex AI.
מזהה את מזהה מנוע הסוכן החדש.
עדכון אוטומטי של קובץ .env באמצעות AGENT_ENGINE_ID.
מוודאים שהערך USE_MEMORY_BANK=TRUE מוגדר בקובץ .env.

[!IMPORTANT] אם מבצעים שינויים ב-custom_topics ב-deploy_agent.py, צריך להריץ מחדש את הסקריפט הזה כדי לעדכן את Agent Engine.

13. אימות של Memory Bank באמצעות נתונים מרובי-מוֹדָלִים

כדי לוודא שהמאגר פועל, אפשר ללמד את הסוכן העדפה ולבדוק אם היא נשמרת בין סשנים.

1. פותחים את האפליקציה (אם האפליקציה כבר פועלת, אפשר לדלג על השלב הזה).

פותחים שוב את האפליקציה לפי ההוראות הבאות: אם הטרמינל הקודם עדיין פועל, מסיימים אותו בלחיצה על Ctrls+C.

‫👉💻 הפעלת האפליקציה:

cd ~/way-back-home/level_2/
./start_app.sh

‫👈 לוחצים על Local: http://localhost:5173/‎ במסוף.

2. בדיקת Memory Bank עם טקסט

בממשק הצ'אט, מסבירים לסוכן את ההקשר הספציפי:

"I'm planning a medical rescue mission in the mountains. I need survivors with first aid and climbing skills."

‫👈 מחכים כ-30 שניות עד שהזיכרון יעובד ברקע.

2. התחלת סשן חדש

כדי לנקות את היסטוריית השיחות הנוכחית (זיכרון לטווח קצר), צריך לרענן את הדף.

לשאול שאלה שמסתמכת על ההקשר שסיפקתם קודם:

"What kind of missions am I interested in?"

התשובה הצפויה:

"על סמך השיחות הקודמות שלך, נראה שאתה מתעניין בנושאים הבאים:

משימות חילוץ רפואיות
פעולות בהרים או בגובה רב
מיומנויות נדרשות: עזרה ראשונה, טיפוס

רוצה שאמצא ניצולים שעומדים בקריטריונים האלה?"

3. בדיקה באמצעות העלאת תמונה

מעלים תמונה ושואלים:

remember this

אתם יכולים לבחור כל תמונה שמופיעה כאן או תמונה משלכם ולהעלות אותה לממשק המשתמש:

4. אימות ב-Vertex AI Agent Engine

כניסה אל Agent Engine במסוף Google Cloud

חשוב לבחור את הפרויקט מהתפריט לבחירת הפרויקט בפינה הימנית העליונה:
מאמתים את מנוע הנציג שפרסתם זה עתה מהפקודה הקודמת use_memory_bank.sh:לוחצים על מנוע הנציג שיצרתם זה עתה.
לוחצים על הכרטיסייה Memories בסוכן שהופעל כדי לראות את כל הזיכרון.

‫👉💻 בסיום הבדיקה, במסוף, לוחצים על Ctrl + C כדי לסיים את התהליך.

‫🎉 מזל טוב! הרגע צירפת את מאגר הזיכרון לסוכן!

14. פריסה ב-Cloud Run

1. הפעלת סקריפט הפריסה

‫👉💻 מריצים את סקריפט הפריסה:

cd ~/way-back-home/level_2
./deploy_cloud_run.sh

אחרי שהפריסה תתבצע בהצלחה, תקבלו את כתובת ה-URL. זו כתובת ה-URL של הפריסה שלכם. פרוס

‫👈💻 לפני שמעתיקים את כתובת ה-URL, מריצים את הפקודה הבאה כדי להעניק את ההרשאה:

source .env && gcloud run services add-iam-policy-binding survivor-frontend --region $REGION --member=allUsers --role=roles/run.invoker && gcloud run services add-iam-policy-binding survivor-backend --region $REGION --member=allUsers --role=roles/run.invoker

עוברים לכתובת ה-URL של הפריסה, והאפליקציה תופיע שם בשידור חי.

2. הסבר על צינור העיבוד לבנייה

בקובץ cloudbuild.yaml מוגדרים השלבים הבאים:

‫Backend Build: יוצר את קובץ האימג' של Docker מ-backend/Dockerfile.
פריסת קצה עורפי: פריסת הקונטיינר של הקצה העורפי ב-Cloud Run.
Capture URL (תפיסת כתובת URL): מקבל את כתובת ה-URL החדשה של ה-Backend.
Frontend Build:
- התקנת יחסי תלות.
- יוצר את אפליקציית React, ומזריק את VITE_API_URL=.
‫Frontend Image: יוצר את קובץ האימג' של Docker מ-frontend/Dockerfile (אריזת הנכסים הסטטיים).
Frontend Deploy: פריסה של קונטיינר הקצה הקדמי.

3. אימות הפריסה

אחרי שהבנייה מסתיימת (אפשר לבדוק את הקישור ליומנים שסופק על ידי הסקריפט), אפשר לאמת:

עוברים אל Cloud Run Console.
מאתרים את השירות survivor-frontend.
לוחצים על כתובת ה-URL כדי לפתוח את האפליקציה.
מריצים שאילתת חיפוש כדי לוודא שהחלק הקדמי של האתר יכול לתקשר עם החלק האחורי.

4. (רק למשתתפי הסדנה) עדכון המיקום

‫👈💻 מריצים את סקריפט ההשלמה:

cd ~/way-back-home/level_2
./set_level_2.sh

עכשיו פותחים את waybackhome.dev ורואים שהמיקום עודכן. כל הכבוד, סיימת את רמה 2!

תוצאה סופית

(אופציונלי) 5. פריסה ידנית

אם אתם מעדיפים להריץ את הפקודות באופן ידני או להבין טוב יותר את התהליך, הנה הסבר איך להשתמש ב-cloudbuild.yaml ישירות.

כתיבה של `cloudbuild.yaml`

קובץ cloudbuild.yaml מציין ל-Google Cloud Build אילו שלבים לבצע.

steps: רשימה של פעולות עוקבות. כל שלב מופעל בקונטיינר (למשל, ‫docker, gcloud, node, bash).
‫substitutions: משתנים שאפשר להעביר בזמן ה-build (לדוגמה, $_REGION).
סביבת עבודה: ספרייה משותפת שבה שלבים יכולים לשתף קבצים (בדומה לשיתוף backend_url.txt).

הפעלת הפריסה

כדי לבצע פריסה ידנית בלי הסקריפט, משתמשים בפקודה gcloud builds submit. חובה להעביר את משתני ההחלפה הנדרשים.

# Load your env vars first or replace these values manually
export PROJECT_ID=your-project-id
export REGION=us-central1

gcloud builds submit --config cloudbuild.yaml \
    --project "$PROJECT_ID" \
    --substitutions _REGION="us-central1",_GOOGLE_API_KEY="",_AGENT_ENGINE_ID="your-agent-id",_USE_MEMORY_BANK="TRUE",_GOOGLE_GENAI_USE_VERTEXAI="TRUE"

15. סיכום

1. מה יצרתם

‫✅ Graph Database: Spanner with nodes (survivors, skills) and edges (relationships)
✅ AI Search: Keyword, semantic, and hybrid search with embeddings
✅ Multimodal Pipeline: Extract entities from images/video with Gemini
✅ Multi-Agent System: Coordinated workflow with ADK
✅ Memory Bank: Long-term personalization with Vertex AI
✅ Production Deployment: Cloud Run + Agent Engine

2. סיכום הארכיטקטורה

architecture_fullstack

3. תובנות מרכזיות

‫Graph RAG: שילוב של מבנה מסד נתונים גרפי עם הטבעות סמנטיות לחיפוש חכם
תבניות של כמה סוכנים: צינורות עיבוד נתונים רציפים לתהליכי עבודה מורכבים עם כמה שלבים
AI מולטימודאלי: חילוץ נתונים מובְנים ממדיה לא מובְנית (תמונות או סרטונים)
סוכנים עם מצב: Memory Bank מאפשר התאמה אישית בין סשנים

4. תוכן הסדנה

‫Level0: Identify Yourself
‫Level1: מיקום מדויק
‫Level2 This One: Build a Multimodal AI Agent with Graph RAG, ADK & Memory Bank
Level3: יצירת סוכן ADK לסטרימינג דו-כיווני
Level4: מערכת רב-סוכנים דו-כיוונית בזמן אמת
‫Level5: Event-Driven Architecture with Google ADK, A2A, and Kafka

🤖 יצירת סוכן AI מולטימודאלי באמצעות Graph RAG, ‏ ADK ו-Memory Bank

1. מבוא

1. האתגר

2. מה תפַתחו

3. טכנולוגיות ליבה

2. הכנת הסביבה (אפשר לדלג אם אתם משתתפים בסדנה)

חלק ראשון: הפעלת החשבון לחיוב

חלק שני: סביבה פתוחה

3. הגדרת הסביבה

1. התחלה

2. הגדרת הפרויקט

3. הרצת סקריפט ההגדרה

4. טעינת נתונים לדוגמה

4. המחשה חזותית של נתוני גרף ב-Spanner Studio

1. גישה ל-Spanner Studio

2. הסבר על מבנה הגרף (התמונה הגדולה)

3. שאילתות בגרף

🔎 מתקדם: שידוך – מי יכול לעזור למי?

5. הטמעות מבוססות-AI ב-Spanner

1. למה כדאי להשתמש בהטמעות? (ללא פעולה, קריאה בלבד)

2. יצירת מודל הטמעה

3. הוספת עמודה של הטמעה

4. יצירת הטמעות

5. אימות ההטמעות

6. בדיקת חיפוש סמנטי

7. יצירת מודל Gemini לניתוח

8. שימוש ב-Gemini לניתוח תאימות

6. Building Your Graph RAG Agent with Hybrid Search

1. סקירה כללית של ארכיטקטורת המערכת

2. הטמעה של שירות RAG

3. הגדרה של כלי לחיפוש סמנטי

4. מדריך לקבלת החלטות (הוראות)

5. הסבר על אופן הפעולה של חיפוש היברידי (לקריאה בלבד, לא נדרשת פעולה)

7. בדיקת הנציג באמצעות ADK Web

1. הרצת הסוכן

2. בדיקת יכולות החיפוש

🧬 א. Graph RAG (חיפוש סמנטי)

🔀 ב. חיפוש היברידי

8. הרצת האפליקציה המלאה

הוספת SessionService ו-Runner

1. הגשת בקשה

2. בדיקת חיפוש סמנטי

3. בדיקת חיפוש היברידי

9. צינור מרובה מצבים – שכבת כלי הפיתוח

למה צריך צינור עיבוד נתונים מולטימודאלי?

אילו קבצים אנחנו מעבדים?

הגישה המתוכננת: צינור סוכנים עוקב

1. פתיחת קובץ הכלים

2. הטמעה של הכלי upload_media

3. הטמעה של הכלי extract_from_media

4. הטמעה של הכלי save_to_spanner

5. עדכון שירות GCS

6. (לקריאה בלבד) למה תהליך עבודה מבוסס-סוכן עדיף על גישות מסורתיות?

10. צינור נתונים מרובה מצבים – שכבת סוכן

1. פתיחת קובץ הסוכן

2. הגדרת סוכן ההעלאה

3. הגדרת סוכן החילוץ

4. הגדרת סוכן Spanner

5. הגדרת סוכן הסיכום

🧠 סיכום הארכיטקטורה

11. צינור נתונים מולטימודאלי – תזמור

1. למה כדאי להשתמש בשיטה עוקבת?

2. הגדרת הסוכן

3. יצירת קשר עם נציג

4. זרימת נתונים בין סוכנים

5. פתיחת האפליקציה (אפשר לדלג אם האפליקציה עדיין פועלת)

6. בדיקת העלאת תמונה

6. אימות העלאה מרובת-אופנים בדלי GCS

7. אימות ההעלאה של נתונים מרובי-אופנים ב-Spanner (אופציונלי)

12. Memory Bank עם Agent Engine

1. איך הזיכרון פועל

2. מהם נושאי זיכרון?

3. הגדרת נושאי זיכרון

4. שילוב של סוכן

יצירת סוכן

שמירה ברקע

הגדרה של שירות הפעלות ב-Vertex AI

4. הגדרה ופריסה

הפעלת סקריפט הפריסה

13. אימות של Memory Bank באמצעות נתונים מרובי-מוֹדָלִים

2. הטמעה של הכלי `upload_media`

3. הטמעה של הכלי `extract_from_media`

4. הטמעה של הכלי `save_to_spanner`

כתיבה של `cloudbuild.yaml`