วิธีสร้างทักษะของเอเจนต์สำหรับ Gemini CLI

1. บทนำ

ในห้องทดลองนี้ คุณจะได้เรียนรู้วิธีสร้างทักษะของเอเจนต์เพื่อให้ LLM เข้าถึงความรู้และเวิร์กโฟลว์ที่กำหนดเองได้ คุณจะสร้างเป็นทักษะในเครื่องที่เข้าถึงได้จาก Gemini CLI

สิ่งที่คุณต้องดำเนินการ

  • สร้างทักษะของ Agent สำหรับสิ่งที่คุณชื่นชอบ
  • ใช้ Gemini CLI เพื่อค้นหาสกิล
  • ติดตั้ง Agent Skills อย่างเป็นทางการสำหรับ Firebase และใช้เพื่อสร้างและติดตั้งใช้งานแอป

สิ่งที่คุณจะได้เรียนรู้

  • วิธีจัดโครงสร้างสกิล
  • วิธีเขียนไฟล์ SKILL.md
  • วิธีใช้ทักษะในเครื่องกับ Gemini CLI

2. การตั้งค่าโปรเจ็กต์

  1. หากยังไม่มีบัญชี Google คุณต้องสร้างบัญชี Google
    • ใช้บัญชีส่วนตัวแทนบัญชีงานหรือบัญชีโรงเรียน บัญชีงานและบัญชีโรงเรียนอาจมีข้อจำกัดที่ทำให้คุณเปิดใช้ API ที่จำเป็นสำหรับ Lab นี้ไม่ได้
  2. ลงชื่อเข้าใช้ Google Cloud Console
  3. เปิดใช้การเรียกเก็บเงินใน Cloud Console
    • การทำแล็บนี้ควรมีค่าใช้จ่ายน้อยกว่า $1 USD ในทรัพยากรระบบคลาวด์
    • คุณสามารถทำตามขั้นตอนที่ส่วนท้ายของแล็บนี้เพื่อลบทรัพยากรเพื่อหลีกเลี่ยงการเรียกเก็บเงินเพิ่มเติม
    • ผู้ใช้ใหม่มีสิทธิ์ใช้ช่วงทดลองใช้ฟรีมูลค่า$300 USD
  4. สร้างโปรเจ็กต์ใหม่หรือเลือกใช้โปรเจ็กต์ที่มีอยู่ซ้ำ
    • หากเห็นข้อผิดพลาดเกี่ยวกับโควต้าโปรเจ็กต์ ให้ใช้โปรเจ็กต์ที่มีอยู่ซ้ำหรือลบโปรเจ็กต์ที่มีอยู่เพื่อสร้างโปรเจ็กต์ใหม่

3. เปิดเครื่องมือแก้ไข Cloud Shell

  1. คลิกลิงก์นี้เพื่อไปยัง Cloud Shell Editor โดยตรง
  2. หากระบบแจ้งให้ให้สิทธิ์ในวันนี้ ให้คลิกให้สิทธิ์เพื่อดำเนินการต่อ คลิกเพื่อให้สิทธิ์ Cloud Shell
  3. หากเทอร์มินัลไม่ปรากฏที่ด้านล่างของหน้าจอ ให้เปิดโดยทำดังนี้
    • คลิกดู
    • คลิก Terminalเปิดเทอร์มินัลใหม่ใน Cloud Shell Editor
  4. ในเทอร์มินัล ให้ตั้งค่าโปรเจ็กต์ด้วยคำสั่งนี้
    • รูปแบบ:
      gcloud config set project [PROJECT_ID]
      
    • ตัวอย่าง
      gcloud config set project lab-project-id-example
      
    • หากจำรหัสโปรเจ็กต์ไม่ได้ ให้ทำดังนี้
      • คุณแสดงรหัสโปรเจ็กต์ทั้งหมดได้โดยใช้คำสั่งต่อไปนี้
        gcloud projects list | awk '/PROJECT_ID/{print $2}'
        
      ตั้งค่ารหัสโปรเจ็กต์ในเทอร์มินัลของ Cloud Shell Editor
  5. คุณควรเห็นข้อความต่อไปนี้
    Updated property [core/project].
    
    หากเห็น WARNING และระบบขอให้คุณ Do you want to continue (Y/n)? แสดงว่าคุณอาจป้อนรหัสโปรเจ็กต์ไม่ถูกต้อง กด n กด Enter แล้วลองเรียกใช้คำสั่ง gcloud config set project อีกครั้ง

4. สร้างทักษะ "สิ่งที่ฉันชอบ"

ทักษะของเอเจนต์คือไดเรกทอรีที่มีไฟล์ SKILL.md อย่างน้อย 1 ไฟล์ซึ่งมีคำสั่งและความรู้สำหรับเอเจนต์ AI ในส่วนนี้ คุณจะสร้างทักษะที่สอน Gemini CLI เกี่ยวกับสิ่งที่คุณชื่นชอบ

  1. สร้างไดเรกทอรีเพื่อจัดเก็บทักษะของคุณ
    mkdir -p ~/.gemini/skills/my-favorite-things
    
  2. สร้างและเปิดไฟล์ SKILL.md ใหม่สำหรับทักษะของคุณ
    cloudshell edit ~/.gemini/skills/my-favorite-things/SKILL.md
    
    คำสั่ง cloudshell edit จะเปิดไฟล์ SKILL.md ในเครื่องมือแก้ไขเหนือเทอร์มินัล
  3. เพิ่มเนื้อหาต่อไปนี้ลงในไฟล์ SKILL.md
    ---
    name: my-favorite-things
    description: Information about my favorite things. Use this skill to answer questions about my favorite color, food, or programming language.
    ---
    
    My favorite color is blue.
    My favorite food is pizza.
    My favorite programming language is Python.
    
    If asked about one of my favorite things, please respond with the information provided above.
    

คุณสร้างทักษะแรกได้ด้วยไฟล์ SKILL.md เพียงไฟล์เดียว ถึงเวลาใช้ทักษะนี้ใน Gemini CLI แล้ว

5. ใช้ทักษะจาก Gemini CLI

เมื่อสร้างทักษะเรียบร้อยแล้ว คุณจะใช้ทักษะดังกล่าวกับ Gemini CLI ได้ Gemini CLI จะค้นพบทักษะที่อยู่ใน ~/.gemini/skills โดยอัตโนมัติ

  1. เริ่มใช้ Gemini CLI ใน Cloud Shell
    gemini
    
    คุณอาจต้องกด Enter เพื่อยอมรับการตั้งค่าเริ่มต้นบางอย่าง
  2. ให้ Gemini แสดงรายการทักษะที่พร้อมใช้งานในบริบทของตัวเอง
    /skills
    
    คุณควรเห็น my-favorite-things ในรายการทักษะที่พร้อมใช้งาน
  3. ถาม Gemini เกี่ยวกับสีโปรดของคุณ
    What is my favorite color?
    
    Gemini CLI ควรใช้ทักษะ my-favorite-things เพื่อตอบคำถามของคุณ หากได้รับข้อความแจ้ง ให้อนุญาตให้ Gemini CLI ใช้ทักษะ

เอาต์พุตควรแสดงว่า Gemini CLI ใช้ทักษะของคุณและตอบกลับด้วย "สีน้ำเงิน"

คุณทำได้แล้ว คุณสร้างทักษะและทดสอบโดยใช้ Gemini CLI เรียบร้อยแล้ว

เมื่อพร้อมสิ้นสุดเซสชัน ให้พิมพ์ /quit แล้วกด Enter เพื่อออกจาก Gemini CLI

6. ติดตั้งทักษะของเอเจนต์สำหรับ Firebase

นอกจากจะสร้างทักษะของคุณเองแล้ว คุณยังติดตั้งทักษะที่ผู้อื่นสร้างขึ้นได้ด้วย ทักษะของเอเจนต์สำหรับ Firebase (GitHub) เป็นโมดูลแบบพกพาที่ทำงานได้ด้วยตัวเองซึ่งประกอบด้วยความรู้ คำสั่ง และเวิร์กโฟลว์เฉพาะของ Firebase โดยออกแบบมาเพื่อช่วยให้ผู้ช่วย AI เข้าใจแนวทางปฏิบัติแนะนำของ Firebase และทำงานที่ซับซ้อนได้อย่างแม่นยำมากขึ้นและมีต้นทุนโทเค็นต่ำลง

คุณติดตั้งทักษะของเอเจนต์ทั้งหมดสำหรับ Firebase ได้ด้วย CLI ของทักษะในเทอร์มินัล โดยทำดังนี้

npx skills add firebase/agent-skills

คำสั่งนี้จะดาวน์โหลดและติดตั้งทักษะต่างๆ รวมถึง firebase-basics, firebase-auth-basics, firebase-firestore-basics และ firebase-app-hosting-basics ทำให้พร้อมใช้งานใน Gemini CLI ควบคู่ไปกับทักษะ my-favorite-things

ดูข้อมูลเพิ่มเติมเกี่ยวกับทักษะของเอเจนต์สำหรับ Firebase ได้ที่ทักษะที่พร้อมใช้งาน

7. สำรวจทักษะของเอเจนต์สำหรับ Firebase

ตอนนี้ติดตั้งทักษะของ Agent สำหรับ Firebase แล้วและพร้อมใช้งานใน Gemini CLI คุณดูได้โดยเรียกใช้ Gemini CLI แล้วพิมพ์ /skills firebase

gemini

จากนั้นใน Gemini CLI ให้ทำดังนี้

/skills firebase

คุณจะเห็นรายการทักษะ Firebase ที่ติดตั้ง เช่น firebase-basics, firebase-auth-basics, firebase-firestore-basics และ firebase-app-hosting-basics

8. (ไม่บังคับ) ใช้ทักษะของ Agent สำหรับ Firebase เพื่อสร้างและติดตั้งใช้งานแอปพลิเคชัน

ตอนนี้ให้ใช้ Agent Skills สำหรับ Firebase ที่ติดตั้งไว้เพื่อสร้างเว็บแอปพลิเคชัน "สิ่งที่ต้องทำ" พร้อมการตรวจสอบสิทธิ์ผู้ใช้และฐานข้อมูล แล้วนำไปใช้งานใน Firebase App Hosting

  1. หากยังอยู่ใน Gemini CLI ให้พิมพ์ /quit เพื่อออก
  2. สร้างไดเรกทอรีใหม่สำหรับโปรเจ็กต์และไปยังไดเรกทอรีนั้น
    mkdir todo-app && cd todo-app
    
  3. เข้าสู่ระบบ Firebase โดยใช้บัญชี Google หากอยู่ใน Cloud Shell หรือสภาพแวดล้อมอื่นที่ไม่มีเบราว์เซอร์ ให้ใช้แฟล็ก --no-localhost
    firebase login --no-localhost
    
    ทำตามวิธีการเพื่อให้สิทธิ์ Firebase CLI
  4. เริ่มใช้ Gemini CLI
    gemini
    
  5. ตอนนี้ขอให้ Gemini สร้างโค้ดแอปพลิเคชัน
    Generate HTML, CSS, and Javascript for a single page  application. It should use Google Sign-in with Firebase Authentication, and save tasks in Cloud Firestore for the signed-in user. A user should be able to add new tasks and see a list of their tasks.
    
    Gemini อาจขอสร้างไฟล์ เช่น index.html, style.css และ script.js อนุญาตให้ดำเนินการดังกล่าว
  6. สุดท้าย ให้ทำให้แอปพลิเคชันใช้งานได้กับ App Hosting ของ Firebase โดยใช้คำสั่งต่อไปนี้
    /firebase-app-hosting-basics deploy my web app to Firebase App Hosting.
    
    ทำตามข้อความแจ้งเพื่อกำหนดค่า App Hosting และทำการติดตั้งใช้งานให้เสร็จสมบูรณ์ เมื่อติดตั้งใช้งานแล้ว คุณจะได้รับ URL สำหรับแอปพลิเคชันที่ใช้งานจริง

9. บทสรุป

ยินดีด้วย คุณสร้างทักษะเรียบร้อยแล้ว และได้เรียนรู้วิธีติดตั้งทักษะเพิ่มเติมสำหรับ Gemini CLI

(ไม่บังคับ) ล้างข้อมูล

หากต้องการล้างข้อมูล คุณสามารถลบโปรเจ็กต์ Cloud เพื่อหลีกเลี่ยงการเรียกเก็บเงินเพิ่มเติม

หากต้องการ ให้ลบโปรเจ็กต์โดยทำดังนี้

gcloud projects delete $GOOGLE_CLOUD_PROJECT

นอกจากนี้ คุณอาจต้องการลบทรัพยากรที่ไม่จำเป็นออกจากดิสก์ Cloud Shell ด้วย ดังนี้

  1. ลบไดเรกทอรีทักษะ
    rm -rf ~/.gemini/skills/my-favorite-things
    
  2. คำเตือน! การดำเนินการถัดไปนี้จะยกเลิกไม่ได้ หากต้องการลบทุกอย่างใน Cloud Shell เพื่อเพิ่มพื้นที่ว่าง คุณสามารถลบไดเรกทอรีหน้าแรกทั้งหมดได้ โปรดระมัดระวังและตรวจสอบว่าได้บันทึกทุกอย่างที่คุณต้องการเก็บไว้ที่อื่นแล้ว
    sudo rm -rf $HOME