قاعدة البيانات كأداة: التوليد المعزّز بالاسترجاع المستند إلى الوكيل باستخدام "حزمة تطوير التطبيقات" و"مجموعة أدوات MCP" وCloud SQL

1. مقدمة

تعتمد فائدة وكلاء الذكاء الاصطناعي على البيانات التي يمكنهم الوصول إليها. تتوفّر معظم البيانات الواقعية في قواعد البيانات، وعادةً ما يعني ربط الوكلاء بقواعد البيانات كتابة إدارة الاتصال ومنطق طلب البحث وتضمين خطوط الأنابيب داخل رمز الوكيل. ويكرّر كل وكيل يحتاج إلى الوصول إلى قاعدة البيانات هذه العملية، ويتطلّب كل تغيير في طلب البحث إعادة نشر الوكيل.

يوضّح هذا الدرس التطبيقي العملي أسلوبًا مختلفًا. يمكنك تعريف أدوات قاعدة البيانات في ملف YAML، مثل طلبات البحث بلغة الاستعلامات البنيوية (SQL) العادية، والبحث عن التشابه بين المتّجهات، وحتى إنشاء عمليات تضمين تلقائية، ويتولّى MCP Toolbox for Databases جميع عمليات قاعدة البيانات كخادم MCP. يبقى رمز الوكيل بسيطًا: حمِّل الأدوات، ودَع Gemini يقرّر الأداة التي سيستخدمها.

ما ستنشئه

مساعد لوحة وظائف ذكي لـ "TechJobs": هو وكيل ADK يستند إلى Gemini ويساعد المطوّرين في تصفّح قوائم الوظائف في مجال التكنولوجيا باستخدام فلاتر عادية (الدور، مجموعة التكنولوجيا) واكتشاف الوظائف من خلال أوصاف مكتوبة بلغة طبيعية، مثل "أريد وظيفة عن بُعد في تطوير برامج الدردشة المستندة إلى الذكاء الاصطناعي". يقرأ الوكيل من قاعدة بيانات Cloud SQL PostgreSQL ويكتب فيها بالكامل من خلال MCP Toolbox for Databases، الذي يتعامل مع جميع عمليات الوصول إلى قاعدة البيانات، بما في ذلك إنشاء عمليات تضمين تلقائية للبحث عن المتّجهات. وبنهاية هذه العملية، سيتم تشغيل كلّ من Toolbox والوكيل على Cloud Run.

ما ستتعلمه

كيف يوحّد بروتوكول سياق النموذج (MCP) إمكانية الوصول إلى الأدوات لوكلاء الذكاء الاصطناعي، وكيف تطبّق أداة MCP Toolbox for Databases ذلك على عمليات قواعد البيانات
إعداد MCP Toolbox for Databases كبرنامج وسيط بين وكيل ADK وCloud SQL PostgreSQL
تحديد أدوات قاعدة البيانات بشكل تعريفي في tools.yaml - ما مِن رمز قاعدة بيانات في الوكيل
إنشاء وكيل ADK يحمّل الأدوات من خادم Toolbox قيد التشغيل باستخدام ToolboxToolset
إنشاء تضمينات متجهة باستخدام الدالة المضمّنة embedding() في Cloud SQL وتفعيل البحث الدلالي باستخدام pgvector
استخدِم ميزة valueFromParam لإدخال المتجهات تلقائيًا في عمليات الكتابة
نشر كلّ من خادم Toolbox ووكيل ADK على Cloud Run

المتطلبات الأساسية

حساب Google Cloud يتضمّن حساب فوترة تجريبيًا
معرفة أساسية بلغة Python وSQL
ستكون الخبرة السابقة في استخدام Cloud Database وADK مفيدة

2. إعداد البيئة

تجهّز هذه الخطوة بيئة Cloud Shell وتضبط مشروعك على السحابة الإلكترونية وتستنسخ مستودع الرموز المرجعي.

فتح Cloud Shell

افتح Cloud Shell في المتصفّح. توفّر Cloud Shell بيئة تم ضبطها مسبقًا تتضمّن جميع الأدوات التي تحتاج إليها لإكمال هذا الدرس التطبيقي حول الترميز. انقر على تفويض عندما يُطلب منك ذلك

بعد ذلك، انقر على "عرض" -> "وحدة طرفية" لفتح الوحدة الطرفية.يجب أن تبدو واجهتك مشابهة لما يلي

ستكون هذه واجهتنا الرئيسية، مع وضع بيئة التطوير المتكاملة في الأعلى والوحدة الطرفية في الأسفل.

إعداد دليل العمل

أنشئ دليل العمل. يتم تخزين جميع الرموز التي تكتبها في هذا الدرس التطبيقي حول الترميز هنا:

mkdir -p ~/build-agent-adk-toolbox-cloudsql
cloudshell workspace ~/build-agent-adk-toolbox-cloudsql && cd ~/build-agent-adk-toolbox-cloudsql

بعد ذلك، لنجهّز عدة أدلة لإدارة أمور مثل نصوص البرامج الأولية والسجلات

mkdir -p ~/build-agent-adk-toolbox-cloudsql/scripts
mkdir -p ~/build-agent-adk-toolbox-cloudsql/logs

إعداد مشروعك على Google Cloud

أنشئ ملف .env يحتوي على متغيّرات الموقع الجغرافي:

# For Vertex AI / Gemini API calls
echo "GOOGLE_CLOUD_LOCATION=global" > .env
# For Cloud SQL, Cloud Run, Artifact Registry
echo "REGION=us-central1" >> .env

ملاحظة مهمة: يتم توفير الخطوة أدناه للمساعدة في إعداد مشروع Google Cloud المرتبط بحساب فوترة تجريبي (إلزامي) بسرعة. إذا كنت تفضّل استخدام مشروعك السابق، يمكنك تخطّي الخطوة التالية وتنفيذ الخطوة التالية بدلاً منها:

إضافة اسم مشروعك كمتغيّر GOOGLE_CLOUD_PROJECT في الملف .env
تفعيل مشروعك في نافذة الجهاز باستخدام gcloud config set project your-project-id

بعد ذلك، يمكنك الانتقال مباشرةً إلى قسم تفعيل واجهة برمجة التطبيقات.

إذا لم تكن متأكدًا من ذلك، يمكنك مواصلة قراءة القسم أدناه.

لتبسيط عملية إعداد المشاريع في الوحدة الطرفية، نزِّل نص برمجي لإعداد المشاريع في دليل العمل:

curl -sL https://raw.githubusercontent.com/alphinside/cloud-trial-project-setup/main/setup_verify_trial_project.sh -o setup_verify_trial_project.sh

شغِّل النص البرمجي. يتحقّق من حساب الفوترة التجريبي، وينشئ مشروعًا جديدًا (أو يتحقّق من صحة مشروع حالي)، ويحفظ رقم تعريف مشروعك في ملف .env في الدليل الحالي، ويضبط المشروع النشط في gcloud.

bash setup_verify_trial_project.sh && source .env

سيؤدي النص البرمجي إلى ما يلي:

التأكّد من أنّ لديك حساب فوترة تجريبيًا نشطًا
التحقّق من وجود مشروع حالي في .env (إن وُجد)
إنشاء مشروع جديد أو إعادة استخدام المشروع الحالي
ربط حساب الفوترة التجريبي بمشروعك
احفظ رقم تعريف المشروع في .env
ضبط المشروع كمشروع gcloud نشط

تأكَّد من ضبط المشروع بشكل صحيح من خلال التحقّق من النص الأصفر بجانب دليل العمل في موجّه أوامر Cloud Shell. يجب أن يعرض رقم تعريف مشروعك.

تفعيل واجهة برمجة التطبيقات المطلوبة

بعد ذلك، علينا تفعيل عدة واجهات برمجة تطبيقات للمنتج الذي سنتفاعل معه:

gcloud services enable \
  aiplatform.googleapis.com \
  sqladmin.googleapis.com \
  compute.googleapis.com \
  run.googleapis.com \
  cloudbuild.googleapis.com \
  artifactregistry.googleapis.com

Vertex AI API (aiplatform.googleapis.com): يستخدم الوكيل نماذج Gemini، وتستخدم "مجموعة الأدوات" واجهة برمجة التطبيقات الخاصة بالتضمين للبحث المتّجه.
واجهة برمجة التطبيقات Cloud SQL Admin (sqladmin.googleapis.com): يمكنك توفير مثيل PostgreSQL وإدارته.
Compute Engine API (compute.googleapis.com): مطلوب لإنشاء مثيلات Cloud SQL.
‫Cloud Run وCloud Build وArtifact Registry: يتم استخدامها في خطوة النشر لاحقًا في هذا الدرس التطبيقي حول الترميز

3- تجهيز النصوص البرمجية لإعداد قاعدة البيانات

تبدأ هذه الخطوة بإنشاء مثيل Cloud SQL وتشغيل نص برمجي مُبرمَج للإعداد ينتظر إلى أن يصبح المثيل جاهزًا، ثم ينشئ قاعدة البيانات ويملأها ببيانات الوظائف الشاغرة وينشئ عمليات التضمين، وكل ذلك في عملية واحدة.

أولاً، لنضِف كلمة مرور قاعدة البيانات إلى ملف .env ثم نعيد تحميله:

echo "DB_PASSWORD=techjobs-pwd" >> .env
echo "DB_INSTANCE=jobs-instance" >> .env
echo "DB_NAME=jobs_db" >> .env
source .env

إنشاء نص برمجي Bash لإنشاء المثيل وقاعدة البيانات

بعد ذلك، أنشئ النص البرمجي scripts/setup_database.sh باستخدام الأمر التالي

mkdir -p ~/build-agent-adk-toolbox-cloudsql/scripts
cloudshell edit scripts/setup_database.sh

بعد ذلك، انسخ الرمز التالي في ملف scripts/setup_database.sh

#!/bin/bash
set -e
source .env

echo "================================================"
echo "Database Setup"
echo "================================================"
echo ""

# Step 1: Create Cloud SQL instance
echo "[1/5] Creating Cloud SQL instance..."

# Check if instance already exists
if gcloud sql instances describe "$DB_INSTANCE" --quiet >/dev/null 2>&1; then
    echo "      Instance already exists"
else
    echo "      Creating instance (takes 5-10 minutes)..."
    gcloud sql instances create "$DB_INSTANCE" \
        --database-version=POSTGRES_17 \
        --tier=db-custom-1-3840 \
        --edition=ENTERPRISE \
        --region="$REGION" \
        --root-password="$DB_PASSWORD" \
        --enable-google-ml-integration \
        --database-flags cloudsql.enable_google_ml_integration=on \
        --quiet
fi
echo "      ✓ Instance ready"
echo ""

# Step 2: Verify instance is ready
echo "[2/5] Verifying instance state..."

STATE=$(gcloud sql instances describe "$DB_INSTANCE" --format='value(state)')

if [ "$STATE" != "RUNNABLE" ]; then
    echo "ERROR: Instance not ready (state: $STATE)"
    exit 1
fi
echo "      ✓ Instance is RUNNABLE"
echo ""

# Step 3: Grant IAM permissions
echo "[3/5] Granting Vertex AI permissions..."

SERVICE_ACCOUNT=$(gcloud sql instances describe "$DB_INSTANCE" \
    --format='value(serviceAccountEmailAddress)')

if [ -z "$SERVICE_ACCOUNT" ]; then
    echo "ERROR: Could not retrieve service account"
    exit 1
fi

gcloud projects add-iam-policy-binding "$GOOGLE_CLOUD_PROJECT" \
    --member="serviceAccount:$SERVICE_ACCOUNT" \
    --role="roles/aiplatform.user" \
    --quiet

echo "      ✓ Permissions granted"
echo ""

# Step 4: Create database
echo "[4/5] Creating database..."

# Check if database already exists
if gcloud sql databases describe "$DB_NAME" \
    --instance="$DB_INSTANCE" --quiet >/dev/null 2>&1; then
    echo "      Database already exists"
else
    gcloud sql databases create "$DB_NAME" \
        --instance="$DB_INSTANCE" \
        --quiet
fi

echo "      ✓ Database '$DB_NAME' ready"
echo ""

# Step 5: Seed database and generate embeddings
echo "[5/5] Seeding database and generating embeddings..."

SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
SETUP_SCRIPT="${SCRIPT_DIR}/setup_jobs_db.py"

if [ ! -f "$SETUP_SCRIPT" ]; then
    echo "ERROR: Setup script not found: $SETUP_SCRIPT"
    exit 1
fi

uv run "$SETUP_SCRIPT"

echo ""
echo "================================================"
echo "Setup complete!"
echo "================================================"
echo ""

إنشاء نص برمجي بلغة Python لإنشاء بيانات أولية

بعد ذلك، أنشئ ملف Python الخاص بنص التعبئة scripts/setup_jobs_db.py باستخدام الأمر أدناه

cloudshell edit scripts/setup_jobs_db.py

بعد ذلك، انسخ الرمز التالي والصِقه في ملف scripts/setup_jobs_db.py

import os
import sys
from pathlib import Path
from dotenv import load_dotenv
from google.cloud.sql.connector import Connector
import pg8000
import time

# Load environment variables from .env file
env_path = Path(__file__).parent.parent / '.env'
load_dotenv(env_path)
EMBEDDING_MODEL='gemini-embedding-001'

# Verify required environment variables
required_vars = ['GOOGLE_CLOUD_PROJECT', 'REGION', 'DB_PASSWORD']
missing_vars = [var for var in required_vars if not os.environ.get(var)]

if missing_vars:
    print(f"ERROR: Missing required environment variables: {', '.join(missing_vars)}", file=sys.stderr)
    print(f"", file=sys.stderr)
    print(f"Expected .env file location: {env_path}", file=sys.stderr)
    if not env_path.exists():
        print(f"✗ File not found at that location", file=sys.stderr)
    else:
        print(f"✓ File exists but is missing the variables above", file=sys.stderr)
    print(f"", file=sys.stderr)
    print(f"Make sure your .env file contains:", file=sys.stderr)
    for var in missing_vars:
        print(f"  {var}=<value>", file=sys.stderr)
    sys.exit(1)

# Job listings data (fictional, for tutorial purposes only)
JOBS = [
    ("Senior Backend Engineer", "Stripe", "Backend", "Go, PostgreSQL, gRPC, Kubernetes", "$180-250K/year", "San Francisco, Hybrid", 3,
     "Design and build high-throughput microservices powering payment infrastructure for millions of businesses. Optimize Go services for sub-100ms latency at scale, work with PostgreSQL and Redis for data persistence, and deploy on Kubernetes clusters handling billions of API calls."),
    ("Machine Learning Engineer", "Spotify", "Data/AI", "Python, TensorFlow, BigQuery, Vertex AI", "$170-230K/year", "Stockholm, Remote", 2,
     "Build and deploy ML models for music recommendation and personalization systems serving hundreds of millions of listeners. Design feature pipelines in BigQuery, train models using distributed computing, and serve predictions through real-time APIs processing thousands of requests per second."),
    ("Frontend Engineer", "Vercel", "Frontend", "React, TypeScript, Next.js", "$140-190K/year", "Remote", 4,
     "Build developer-facing dashboard interfaces and deployment tools used by millions of developers worldwide. Create responsive, accessible React components for project management, analytics, and real-time deployment monitoring with a focus on developer experience."),
    ("DevOps Engineer", "Datadog", "DevOps", "Terraform, GCP, Docker, Kubernetes, ArgoCD", "$160-220K/year", "New York, Hybrid", 2,
     "Manage cloud infrastructure powering an observability platform used by thousands of engineering teams. Automate deployment pipelines with ArgoCD, manage multi-cloud Kubernetes clusters, and implement infrastructure-as-code with Terraform across production environments."),
    ("Mobile Engineer (Android)", "Grab", "Mobile", "Kotlin, Jetpack Compose, GraphQL", "$120-170K/year", "Singapore, Hybrid", 3,
     "Develop features for a super-app serving millions of users across Southeast Asia. Build modern Android UIs with Jetpack Compose, integrate GraphQL APIs, and optimize app performance for diverse device capabilities and network conditions."),
    ("Data Engineer", "Airbnb", "Data", "Python, Apache Spark, Airflow, BigQuery", "$160-210K/year", "San Francisco, Hybrid", 2,
     "Build data pipelines that process booking, search, and pricing data for a global travel marketplace. Design ETL workflows with Apache Spark and Airflow, maintain data warehouses in BigQuery, and ensure data quality for analytics and machine learning teams."),
    ("Full Stack Engineer", "Revolut", "Full Stack", "TypeScript, Node.js, React, PostgreSQL", "$130-180K/year", "London, Remote", 5,
     "Build the next generation of financial products making banking accessible to millions of users across 35 countries. Develop real-time trading interfaces with React and WebSockets, build Node.js APIs handling market data streams, and design PostgreSQL schemas for financial transactions."),
    ("Site Reliability Engineer", "Cloudflare", "SRE", "Go, Prometheus, Grafana, GCP, Terraform", "$170-230K/year", "Austin, Hybrid", 2,
     "Ensure 99.99% uptime for a global network handling millions of requests per second. Define SLOs, build monitoring dashboards with Prometheus and Grafana, manage incident response, and automate infrastructure scaling across 300+ data centers worldwide."),
    ("Cloud Architect", "Google Cloud", "Cloud", "GCP, Terraform, Kubernetes, Python", "$200-280K/year", "Seattle, Hybrid", 1,
     "Help enterprises modernize their infrastructure on Google Cloud. Design multi-region architectures, lead migration projects from on-premises to GKE, and build reference implementations using Terraform and Cloud Foundation Toolkit."),
    ("Backend Engineer (Payments)", "Square", "Backend", "Java, Spring Boot, PostgreSQL, Kafka", "$160-220K/year", "San Francisco, Hybrid", 3,
     "Build payment processing systems handling millions of transactions for businesses of all sizes. Design event-driven architectures using Kafka, implement idempotent payment flows with Spring Boot, and ensure PCI-DSS compliance across all services."),
    ("AI Engineer", "Hugging Face", "Data/AI", "Python, LangChain, Vertex AI, FastAPI, PostgreSQL", "$150-210K/year", "Paris, Remote", 2,
     "Build AI-powered tools for the largest open-source ML community. Develop RAG pipelines that index and search model documentation, create conversational agents using LangChain, and deploy AI services with FastAPI on cloud infrastructure."),
    ("Platform Engineer", "Coinbase", "Platform", "Rust, Kubernetes, AWS, Terraform", "$180-250K/year", "Remote", 0,
     "Build the infrastructure platform for a leading cryptocurrency exchange. Develop high-performance matching engines in Rust, manage Kubernetes clusters for microservices, and design CI/CD pipelines that enable rapid feature deployment with zero downtime."),
    ("QA Automation Engineer", "Shopify", "QA", "Python, Selenium, Cypress, Jenkins", "$110-160K/year", "Toronto, Hybrid", 3,
     "Design and maintain automated test suites for a commerce platform powering millions of merchants. Build end-to-end test frameworks with Cypress and Selenium, integrate tests into Jenkins CI pipelines, and establish quality gates that prevent regressions in checkout and payment flows."),
    ("Security Engineer", "CrowdStrike", "Security", "Python, SIEM, Kubernetes, Penetration Testing", "$170-240K/year", "Austin, On-site", 1,
     "Protect enterprise customers from cyber threats on a leading endpoint security platform. Conduct penetration testing, design security monitoring with SIEM tools, implement zero-trust networking in Kubernetes environments, and lead incident response for security events."),
    ("Product Engineer", "GitLab", "Full Stack", "Go, React, PostgreSQL, Redis, GCP", "$140-200K/year", "Remote", 4,
     "Own features end-to-end for an all-in-one DevSecOps platform used by millions of developers. Build Go microservices for CI/CD pipelines, create React frontends for code review and project management, and collaborate with product managers to iterate on user-facing features using data-driven development."),
]


def get_connection():
    """Create a connection to Cloud SQL using the connector."""
    project = os.environ['GOOGLE_CLOUD_PROJECT']
    region = os.environ['REGION']
    password = os.environ['DB_PASSWORD']
    instance = os.environ['DB_INSTANCE']
    database = os.environ['DB_NAME']

    connector = Connector()
    conn = connector.connect(
        f"{project}:{region}:{instance}",
        "pg8000",
        user="postgres",
        password=password,
        db=database
    )
    return conn, connector


def create_schema(cursor):
    """Create extensions and jobs table."""
    cursor.execute("CREATE EXTENSION IF NOT EXISTS google_ml_integration")
    cursor.execute("CREATE EXTENSION IF NOT EXISTS vector")
    cursor.execute("""
        CREATE TABLE IF NOT EXISTS jobs (
            id SERIAL PRIMARY KEY,
            title VARCHAR NOT NULL,
            company VARCHAR NOT NULL,
            role VARCHAR NOT NULL,
            tech_stack VARCHAR NOT NULL,
            salary_range VARCHAR NOT NULL,
            location VARCHAR NOT NULL,
            openings INTEGER NOT NULL,
            description TEXT NOT NULL,
            description_embedding vector(3072)
        )
    """)


def seed_jobs(cursor, conn):
    """Insert job listings."""
    cursor.execute("SELECT COUNT(*) FROM jobs")
    existing_count = cursor.fetchone()[0]

    if existing_count > 0:
        print(f"      {existing_count} jobs already exist, skipping seed")
        return 0

    cursor.executemany("""
        INSERT INTO jobs (title, company, role, tech_stack, salary_range, location, openings, description)
        VALUES (%s, %s, %s, %s, %s, %s, %s, %s)
    """, JOBS)
    conn.commit()
    return len(JOBS)


def generate_embeddings(cursor, conn):
    """Generate embeddings using Cloud SQL's embedding() function."""
    cursor.execute("SELECT COUNT(*) FROM jobs WHERE description_embedding IS NULL")
    null_count = cursor.fetchone()[0]

    if null_count == 0:
        print("      All jobs already have embeddings")
        return 0

    cursor.execute(f"""
        UPDATE jobs
        SET description_embedding = embedding('{EMBEDDING_MODEL}', description)::vector
        WHERE description_embedding IS NULL
    """)
    rows_updated = cursor.rowcount
    conn.commit()
    return rows_updated


def main():
    conn, connector = get_connection()
    cursor = conn.cursor()

    try:
        create_schema(cursor)
        conn.commit()

        seeded = seed_jobs(cursor, conn)
        if seeded > 0:
            print(f"      ✓ Inserted {seeded} jobs")

        # Waiting for vertex role propagation
        time.sleep(60)
        embedded = generate_embeddings(cursor, conn)
        if embedded > 0:
            print(f"      ✓ Generated {embedded} embeddings")

    except Exception as e:
        print(f"ERROR: {e}", file=sys.stderr)
        sys.exit(1)
    finally:
        cursor.close()
        conn.close()
        connector.close()


if __name__ == "__main__":
    main()

لننتقل الآن إلى الخطوة التالية

4. إنشاء قاعدة البيانات وتهيئتها

أصبحت النصوص البرمجية جاهزة الآن للتنفيذ. سنحتاج إلى Python لتنفيذ النص البرمجي الذي أعددناه، لذا لنبدأ بإعداد Python أولاً

إعداد مشروع Python

‫uv هي حزمة Python سريعة ومدير مشاريع مكتوب بلغة Rust ( مستندات uv). تستخدمها ورشة العمل هذه لتحقيق السرعة والبساطة في الحفاظ على مشروع Python.

ابدأ مشروع Python وأضِف التبعيات المطلوبة:

uv init
uv add cloud-sql-python-connector --extra pg8000
uv add python-dotenv

يُرجى العِلم أنّنا نستخدم حزمة تطوير البرامج (SDK) cloud-sql-python-connector Python هنا لإنشاء اتصال آمن بنسخة قاعدة البيانات التي يتمّ إثبات ملكيتها باستخدام بيانات الاعتماد التلقائية للتطبيق.

تنفيذ نص الإعداد البرمجي

يمكننا الآن تشغيل نص الإعداد في الخلفية وفحص ناتج وحدة التحكّم الذي سيتمّ كتابته في الملف logs/atabase_setup.log باستخدام الأمر التالي. يمكنك الانتقال إلى القسم التالي أثناء انتظار اكتمال هذه العملية

mkdir -p ~/build-agent-adk-toolbox-cloudsql/logs
bash scripts/setup_database.sh > logs/database_setup.log 2>&1 &

تنزيل ملف Toolbox الثنائي

سنستخدم MCP Toolbox في هذا البرنامج التعليمي، ولحسن الحظ، يتضمّن ثنائيًا مسبق الإنشاء وجاهزًا للاستخدام في بيئة Linux. والآن، لننزّله في الخلفية لأنّ العملية تستغرق بعض الوقت. نفِّذ الأمر التالي لتنزيل الملف الثنائي وفحص سجلّ الإخراج على logs/toolbox_dl.log . يمكنك الانتقال إلى القسم التالي أثناء انتظار اكتمال هذه العملية

cd ~/build-agent-adk-toolbox-cloudsql
curl -O https://storage.googleapis.com/mcp-toolbox-for-databases/v1.0.0/linux/amd64/toolbox > logs/toolbox_dl.log 2>&1 &

فهم نص الإعداد `scripts/setup_database.sh`

لنحاول الآن فهم نص الإعداد البرمجي الذي سبق أن ضبطناه. تتضمّن هذه العملية الخطوات التالية:

أول أمر ننفّذه هو الأمر gcloud sql instances create مع العلامة التالية

‫db-custom-1-3840 هو أصغر مستوى مخصّص لوحدة المعالجة المركزية في Cloud SQL (وحدة معالجة مركزية افتراضية واحدة، وذاكرة وصول عشوائي سعتها 3.75 غيغابايت) في إصدار ENTERPRISE. يمكنك الاطّلاع على مزيد من التفاصيل هنا. يجب توفّر نواة مخصّصة لدمج Vertex AI ML، ولا تتوافق معها فئات النواة المشتركة (db-f1-micro وdb-g1-small).
يضبط --root-password كلمة المرور للمستخدم التلقائي postgres.
تتيح --enable-google-ml-integration إمكانية الدمج المضمّن في Cloud SQL مع Vertex AI، ما يتيح لك استدعاء نماذج التضمين مباشرةً من SQL باستخدام الدالة embedding().

التحقّق ممّا إذا كانت الآلة الافتراضية في الحالة RUNNABLE
امنح حساب خدمة مثيل Cloud SQL الإذن باستدعاء Vertex AI باستخدام الأمر gcloud projects add-iam-policy-binding. هذا الإعداد مطلوب لدالة embedding() المضمّنة التي سنستخدمها عند إنشاء قاعدة البيانات
إنشاء قاعدة البيانات
تنفيذ النص البرمجي setup_jobs_db.py الخاص بإنشاء البيانات الأولية

فهم النص البرمجي الأوّلي `scripts/setup_jobs_db.py`

بالانتقال الآن إلى نص التعبئة، ينفّذ هذا النص الإجراءات التالية:

تهيئة عملية الربط بمثيل قاعدة البيانات
تثبِّت هذه الحزمة إضافتَين إلى PostgreSQL:

‫google_ml_integration: توفّر دالة embedding() SQL التي تستدعي نماذج التضمين في Vertex AI مباشرةً من SQL. هذه إضافة على مستوى قاعدة البيانات تتيح استخدام وظائف تعلُّم الآلة داخل jobs_db. تتيح العلامة على مستوى المثيل (--enable-google-ml-integration) التي تضبطها أثناء إنشاء المثيل لجهاز Cloud SQL الظاهري الوصول إلى Vertex AI، ويجعل هذا الامتداد دوال SQL متاحةً في قاعدة البيانات المحدّدة هذه.
vector (pgvector): يضيف نوع البيانات vector وعوامل تشغيل المسافة لتخزين عمليات التضمين والاستعلام عنها.

أنشئ الجدول، مع العلم أنّ العمود description_embedding هو vector(3072)، أي عمود pgvector يخزّن متجهات ثلاثية الأبعاد.
تعبئة بيانات الوظائف الأولية
إنشاء بيانات التضمين من الحقل description وملء description_embedding باستخدام عملية التكامل المضمّنة في Vertex من خلال الدالة embedding()

embedding('gemini-embedding-001', description): تستدعي نموذج التضمين Gemini في Vertex AI مباشرةً من SQL، مع تمرير نص description لكل وظيفة. هذه هي الإضافة google_ml_integration التي ثبَّتها في النص البرمجي الأوّلي.
::vector: تحويل مصفوفة الأرقام العشرية التي تم إرجاعها إلى نوع vector في pgvector حتى يمكن تخزينها والاستعلام عنها باستخدام عوامل تشغيل المسافة
يتم تشغيل UPDATE على جميع الصفوف الـ 15، ما يؤدي إلى إنشاء تضمين واحد ذي 3072 بُعدًا لكل وصف وظيفي.

سيؤدي ذلك إلى إعداد البيانات الأولية التي سيصل إليها الموظف

5- ضبط إعدادات MCP Toolbox for Databases

تقدّم هذه الخطوة MCP Toolbox for Databases، وتضبطها للاتصال بمثيل Cloud SQL، وتحدّد أداتَي استعلام SQL عاديتَين.

ما هي "برنامج شركاء المحتوى" ولماذا يجب استخدام "أدوات الناشرين"؟

بروتوكول سياق النموذج (MCP) هو بروتوكول مفتوح يوحّد طريقة عثور وكلاء الذكاء الاصطناعي على الأدوات الخارجية والتفاعل معها. يحدّد هذا النموذج نموذجًا للعميل والخادم: يستضيف الوكيل عميل MCP، وتوفّر خوادم MCP الأدوات. يمكن لأي عميل متوافق مع MCP استخدام أي خادم متوافق مع MCP، ولا يحتاج الوكيل إلى رمز دمج مخصّص لكل أداة.

MCP Toolbox for Databases هو خادم MCP مفتوح المصدر تم إنشاؤه خصيصًا للوصول إلى قواعد البيانات. وبدونها، عليك كتابة دوال Python تفتح اتصالات بقاعدة البيانات، وتدير مجموعات الاتصالات، وتنشئ استعلامات ذات مَعلمات لمنع اختراق SQL، وتتعامل مع الأخطاء، وتضمّن كل هذا الرمز البرمجي داخل برنامجك. ويكرّر كل وكيل يحتاج إلى الوصول إلى قاعدة البيانات هذه العملية. يعني تغيير الاستعلام إعادة نشر الوكيل.

باستخدام Toolbox، يمكنك كتابة ملف YAML. ترتبط كل أداة بعبارة SQL ذات معلَمات. تتعامل مجموعة الأدوات مع تجميع الاتصالات، والاستعلامات التي تتضمّن مَعلمات، والمصادقة، وإمكانية المراقبة. يتم فصل الأدوات عن الوكيل، ويمكنك تعديل طلب بحث من خلال تعديل tools.yaml وإعادة تشغيل Toolbox بدون تعديل رمز الوكيل. تعمل الأدوات نفسها على جميع إطارات العمل المتوافقة مع MCP، مثل ADK أو LangGraph أو LlamaIndex.

كتابة إعدادات الأدوات

الآن، علينا إنشاء ملف باسم tools.yaml في "محرّر Cloud Shell" لإعداد ضبط الأدوات.

cloudshell edit tools.yaml

يستخدم الملف YAML متعدد المستندات، وكلّ كتلة مفصولة بـ --- هي مورد مستقل. يحتوي كل مصدر على kind يوضّح نوعه (sources لعمليات ربط قواعد البيانات، وtools للإجراءات التي يمكن أن يستدعيها الوكيل) وtype يحدّد الخلفية (cloud-sql-postgres للمصدر، وpostgres-sql للأدوات المستندة إلى SQL). تشير الأداة إلى مصدرها باستخدام name، وهي الطريقة التي تعرف بها "مجموعة الأدوات" مجموعة الاتصال التي سيتم تنفيذها. تستخدم متغيرات البيئة بنية ${VAR_NAME} ويتم تحديدها عند بدء التشغيل.

لننسخ الآن البرامج النصية التالية أولاً في ملف tools.yaml

# tools.yaml

# --- Data Source ---
kind: source
name: jobs-db
type: cloud-sql-postgres
project: ${GOOGLE_CLOUD_PROJECT}
region: ${REGION}
instance: ${DB_INSTANCE}
database: ${DB_NAME}
user: postgres
password: ${DB_PASSWORD}

---