Google Cloud의 Gemini 2.5 Pro 소개

Google Cloud의 Gemini 2.5 Pro 소개

이 Codelab 정보

subject최종 업데이트: 4월 23, 2025
account_circle작성자: Prashanth Subrahmanyam

1. 개요

소개

Gemini 2.5 Pro는 코딩 및 세상 지식에 관한 Google의 가장 강력한 모델입니다.

2.5 시리즈를 통해 Gemini 모델은 이제 하이브리드 추론 모델이 되었습니다. Gemini 2.5 Pro는 여러 작업에 확장된 사고를 적용하고 도구를 사용하여 응답 정확성을 극대화할 수 있습니다.

Gemini 2.5 Pro는 다음과 같습니다.

  • 코딩, 추론, 멀티모달을 비롯한 기능 전반에서 이전 모델에 비해 크게 개선되었습니다.
  • 수학 및 STEM 벤치마크에서 최신 성능을 통해 추론 분야에서 업계를 선도합니다.
  • 특히 웹 개발에 강한 코드용 놀라운 모델입니다.
  • LMSys의 1번을 포함하여 다재다능하면서도 복잡한 프롬프트에 특히 적합합니다.

학습할 내용

이 튜토리얼에서는 Gemini API와 Python용 Google 생성형 AI SDK를 Gemini 2.5 Pro 모델과 함께 사용하는 방법을 알아봅니다.

완료할 작업은 다음과 같습니다.

  • 텍스트 프롬프트에서 텍스트 생성
    • 텍스트 스트리밍 생성
    • 멀티턴 채팅 시작
    • 비동기 메서드 사용
  • 모델 파라미터 구성
  • 시스템 요청 사항 설정
  • 안전 필터 사용
  • 제어 생성 사용
  • 토큰 집계
  • 멀티모달 (오디오, 코드, 문서, 이미지, 동영상) 데이터 처리
  • 자동 및 수동 함수 호출 사용
  • 코드 실행
  • 사고 모드 예시

2. 시작하기 전에

기본 요건

시작하려면 유효한 결제 계정이 있는 Google Cloud 프로젝트가 필요합니다. 사용할 Google Cloud 프로젝트를 선택하세요.

이 Codelab을 실행하려면 Google Cloud의 보안 및 규정 준수 기능이 포함된 공동작업을 위한 관리형 노트북 환경인 Colab Enterprise를 사용합니다.

필요한 API 사용 설정

아래 버튼을 클릭하여 Google Cloud 프로젝트에서 이 Codelab에 필요한 API(Vertex AI, Dataform, Compute Engine)를 사용 설정합니다.

Colab 노트북을 Google Cloud에 복사

아래 버튼을 클릭하여 Colab Enterprise에서 튜토리얼 노트북을 엽니다. 이렇게 하면 현재 Google Cloud 프로젝트에 Colab 노트북의 사본이 생성되며, 이를 통해 노트북을 실행할 수 있습니다.

시작하기

3. 환경 초기화

이제 Colab 노트북이 생성되었으므로 노트북 내에 제공된 코드를 실행할 수 있습니다. 처음 몇 단계에서는 종속 항목을 설치하고 필요한 라이브러리를 가져옵니다.

시작하기의 단계 실행

먼저 시작하기 섹션의 셀을 차례로 실행합니다.

시작하기 섹션의 코드 셀

참고: 실행하려는 코드 셀 위로 마우스 포인터를 가져간 다음 셀 실행 아이콘 셀 실행 아이콘을 클릭하여 셀을 실행할 수 있습니다.

셀 실행

이 섹션을 마치면 다음을 수행할 수 있습니다.

  • Python용 Google Gen AI SDK 설치
  • 실습에 필요한 라이브러리 가져오기
  • Vertex AI를 사용하도록 Google Cloud 프로젝트 설정

이제 Gemini 2.5 Pro를 사용하여 텍스트를 생성해 보겠습니다

4. Gemini로 텍스트 생성

이 노트북 섹션에서는 Gemini 2.5 Pro를 사용하여 텍스트 자동 완성을 생성합니다.

노트북에서 다음 셀 세트를 실행하고 시간을 내어 코드를 읽고 Google GenAI SDK를 사용하는 방법을 알아봅니다.

텍스트 프롬프트에서 텍스트 생성

이 섹션을 마치면 다음을 학습하게 됩니다.

  • 사용할 모델을 지정하는 방법
  • 비스트리밍 출력 생성 및 스트리밍 출력 생성 비교
  • SDK의 멀티턴 채팅 기능을 사용합니다.
  • SDK를 비동기식으로 호출합니다.
  • 모델 매개변수를 구성합니다.
  • 모델 동작을 맞춤설정하기 위한 시스템 안내 설정
  • 콘텐츠 안전 필터 구성

다음으로 Gemini에 멀티모달 프롬프트를 전송하는 방법을 알아봅니다

5. 멀티모달 프롬프트

이 노트북 섹션에서는 Gemini 2.5 Pro를 사용하여 이미지와 동영상을 처리합니다.

노트북에서 다음 셀을 실행합니다. 멀티모달 프롬프트용 코드 셀

이 섹션을 마치면 다음을 학습하게 됩니다.

  • 이미지와 텍스트로 구성된 프롬프트를 전송합니다.
  • URL의 동영상 처리

다음으로 잘 정의되고 구조화된 출력을 생성합니다.

6. 구조화된 출력

코드에서 모델의 응답을 사용할 때는 모델에서 일관되고 안정적인 출력을 가져오는 것이 중요합니다. 제어 생성을 사용하면 대답 스키마를 정의하여 모델 출력의 구조, 필드 이름, 각 필드의 예상 데이터 유형을 지정할 수 있습니다.

노트북에서 다음 셀을 실행합니다. 제어된 출력을 위한 코드 셀

다음으로 모델 출력을 접지하는 방법을 알아보겠습니다

7. 그라운딩

기존 지식 베이스를 사용하거나 모델에 실시간 정보를 제공하려면 모델의 출력 그라운딩을 살펴봐야 합니다.

Gemini와 Vertex AI를 사용하면 Google 검색, 함수 응답의 출력, 마지막으로 코드 자체에서 출력을 그라운딩할 수 있습니다. 코드 실행을 통해 모델은 코드를 생성하고 실행하여 결과를 학습하고 반복하여 최종 출력을 얻을 수 있습니다.

노트북에서 다음 셀을 실행합니다. 접지 테스트를 위한 코드 셀

다음으로 Gemini 2.5 Pro의 사고 기능을 살펴보겠습니다.

8. 생각하는 중입니다.

사고 모드는 여러 차례 전략을 세우고 반복적으로 해결해야 하는 복잡한 작업에 특히 유용합니다. Gemini 2.5 모델은 대답하기 전에 생각을 통해 추론할 수 있기 때문에 성능과 정확도가 개선된 사고 모델입니다.

노트북에서 다음 셀을 실행합니다. 이렇게 하면 모델이 실제 출력을 표시하기 전에 생각 출력이 표시됩니다. 생각 중인 출력을 보여주는 코드 셀

9. 결론

수고하셨습니다. 텍스트 생성, 다중 모달, 기반 지식, 구조화된 출력, 고급 사고 기능을 다루는 Python용 Google 생성형 AI SDK를 사용하여 Gemini 2.5 Pro의 기능을 활용하는 방법을 알아봤습니다. 이제 SDK를 사용하여 혁신적인 자체 애플리케이션을 빌드하기 위한 기본 지식을 갖추었습니다. 강력한 사고 및 추론 모드를 갖춘 Gemini 2.5 Pro는 새로운 가능성을 열어주고 다양한 사용 사례에서 혁신을 도모합니다.

추가 참조

이 Codelab은 어땠나요?