모델 조정은 더 높은 정밀도와 정확성으로 특정 태스크를 수행하도록 Gemini를 조정하는 데 중요한 프로세스입니다. 모델 조정은 모델에 특정 다운스트림 태스크의 여러 예시가 포함된 학습 데이터 세트를 제공하는 방식으로 작동합니다.
이 페이지에서는 Gemini 모델 조정을 간략하게 설명하고 Gemini에서 사용할 수 있는 조정 옵션을 설명하며 이 페이지를 통해 각 조정 옵션을 사용해야 하는 시기를 결정할 수 있습니다.
모델 조정 이점
모델 조정은 대규모 모델을 태스크에 맞게 맞춤설정할 수 있는 효과적인 방법입니다. 이는 모델의 품질과 효율성을 개선하기 위한 핵심 단계입니다. 모델 조정 이점은 다음과 같습니다.
- 특정 태스크의 품질 개선
- 모델 안정성 향상
- 짧아진 프롬프트로 인한 추론 지연 시간 단축 및 비용 절감
프롬프트 설계와 조정 비교
- 사전 학습된 Gemini 모델을 사용한 프롬프팅: 프롬프팅은 Gemini와 같은 AI 모델이 원하는 출력을 생성하도록 안내하는 효과적인 지침을 작성하는 기술입니다.
여기에는 태스크, 원하는 형식, 관련 맥락을 명확하게 전달하는 프롬프트 설계가 포함됩니다. 최소한의 설정으로 Gemini 기능을 사용할 수 있습니다.
다음과 같은 경우에 적합합니다.
- 제한된 라벨이 지정된 데이터: 라벨이 지정된 데이터 양이 적거나 긴 미세 조정 프로세스를 감당할 수 없는 경우입니다.
- 신속한 프로토타입 제작: 미세 조정에 ���은 투자를 하지 않고도 개념을 신속하게 테스트하거나 기준 성능을 얻어야 하는 경우
- 맞춤설정된 Gemini 모델 미세 조정: 보다 맞춤화된 결과를 얻기 위해 Gemini를 사용하면 특정 데이터 세트에서 모델을 미세 조정할 수 있습니다. 특정 영역에서 뛰어난 AI 모델을 만들려면 미세 조정하는 것이 좋습니다. 여기에는 자체 라벨이 지정된 데이터 세트에서 기본 모델을 재학습하여 태스크와 데이터에 맞게 가중치 조정이 포함됩니다. 사용 사례에 맞게 Gemini를 조정할 수 있습니다. 미세 조정은 다음과 같은 경우에 가장 효과적입니다.
- 라벨이 지정된 데이터가 있음: 학습에 사용할 수 있는 상당한 양의 데이터 세트 (100개 이상의 예시)로, 이를 통해 모델에서 태스크의 세부정보를 심층적으로 학습할 수 있습니다.
- 복잡하거나 고유한 태스크: 고급 프롬프팅 전략이 충분하지 않고 데이터에 맞춤설정된 모델이 필수적인 시나리오에 적합합니다.
최적의 프롬프트를 찾으려면 프롬프팅을 시작하는 것이 좋습니다. 그런 다음 미세 조정 (필요한 경우)으로 이동하여 성능을 강화하거나 반복 오류를 수정합니다. 예시를 더 추가하는 것이 유용할 수 있지만 데이터를 더 추가하기 전에 모델에서 실수하는 부분을 평가하는 것이 중요합니다. 우수한 성능과 양보다는 더 나은 결과를 얻으려면 라벨이 잘 지정된 고품질 데이터가 중요합니다. 또한 미세 조정에 사용하는 데이터는 모델이 프로덕션에서 접하게 될 프롬프트 분포, 형식, 컨텍스트를 반영해야 합니다.
조정은 프롬프트 설계에 비해 다음과 같은 이점을 제공합니다.
- 모델을 세부적으로 맞춤설정할 수 있고 특정 태스크의 성능을 개선할 수 있습니다.
- 맞춤 문법, 안내, 도메인별 시맨틱 규칙에 맞게 모델을 조정합니다.
- 더 일관되고 신뢰할 수 있는 결과를 제공합니다.
- 더 많은 예시를 한 번에 처리할 수 있습니다.
- 프롬프트에서 퓨샷 예시, 긴 안내를 삭제하여 추론 시 비용 절감
조정 방식
매개변수 효율적 조정과 전체 미세 조정은 대규모 모델을 맞춤설정하는 두 가지 방법입니다. 두 방법 모두 모델 품질과 리소스 효율성 측면에 장점이 있으며 영향을 미칩니다.
매개변수 효율적인 조정은
어댑터 조정이라고도 하는 매개변수 효율적 조정을 통해 대규모 모델을 효율적으로 특정 태스크나 도메인에 맞게 조정할 수 있습니다. 매개변수 효율적 조정은 조정 프로세스 중에 비교적 적은 모델 매개변수 하위 집합을 업데이트합니다.
Vertex AI에서 어댑터 조정과 서빙을 지원하는 방법을 이해하려면 대규모 파운데이션 모델 조정 백서에서 자세한 내용을 확인하세요.
전체 미세 조정
전체 미세 조정은 모델의 모든 매개변수를 업데이트하므로, 매우 복잡한 태스크에 맞게 모델을 조정하기에 적합하고 더 높은 품질을 달성할 가능성이 있습니다. 그러나 전체 미세 조정에는 조정 및 서빙을 위해 더 높은 컴퓨팅 리소스가 필요하므로 전체 비용이 증가합니다.
전체 미세 조정과 매개변수 효율적인 미세 조정 비교
매개변수 효율적인 조정은 전체 미세 조정에 비해 리소스 효율과 비용 효율성이 높습니다. 이 조정은 학습에 상당히 낮은 컴퓨팅 리소스를 사용합니다. 더 작은 데이터 세트로 모델을 더 빠르게 조정할 수 있습니다. 매개변수 효율적인 조정의 유연성 덕분에 광범위한 재학습 없이도 멀티태스크 학습을 위한 솔루션을 제공합니다.
지원되는 조정 방법
Vertex AI는 감독 기반 미세 조정을 지원하여 기반 모델을 맞춤설정합니다.
감독 기반 미세 조정
지도 미세 조정은 새로운 기술을 학습시켜 모델의 성능을 향상시킵니다. 라벨이 있는 수백 개의 예가 포함된 데이터가 원하는 행동 또는 태스크를 모방하도록 모델을 학습시키는 데 사용됩니다. 라벨이 있는 각 예는 추론 중에 모델이 출력할 대상을 보여줍니다.
지도 미세 조정 작업을 실행하면 모델은 원하는 태스크를 수행하거나 원하는 동작을 학습하는 데 필요한 정보를 인코딩할 수 있게 해주는 추가 매개변수를 학습합니다. 이러한 매개변수는 추론 중에 사용됩니다. 조정 작업의 결과는 새로 학습된 매개변수와 원래 모델이 조합된 새로운 모델입니다.
텍스트 모델의 지도 미세 조정은 모델 출력이 복잡하지 않고 비교적 정의하기 쉬운 경우 적합한 옵션입니다. 지도 조정은 분류, 감정 분석, 항목 추출, 복잡하지 않은 콘텐츠 요약, 도메인별 쿼리 작성에 권장됩니다. 코드 모델에서는 지도 조정만 사용할 수 있습니다.
감독 기반 미세 조정을 지원하는 모델
gemini-1.5-pro-002
(GA)gemini-1.5-flash-002
(GA)gemini-1.0-pro-002
(미리보기에서는 텍스트 조정만 지원)
각 모델에서 지도 학습 미세 조정을 사용하는 방법에 관한 자세한 내용은 텍스트, 이미지, 오디오, 문서 데이터 유형 조정 페이지를 참고하세요.
다음 단계
- Gemini 모델의 문서 이해 기능에 대한 자세한 내용은 문서 이해 개요를 참조하세요.
- 조정을 시작하려면 지도 미세 조정을 사용하여 Gemini 모델 조정을 참조하세요.
- 생성형 AI 기술 자료를 구축하는 솔루션에서 지도 미세 조정을 사용하는 방법을 알아보려면 점프 스타트 솔루션: 생성형 AI 기술 자료를 참조하세요.