문서 조정

이 페이지에서는 지도 학습을 사용하여 문서 데이터에서 Gemini 미세 조정에 필요한 기본 요건과 자세한 안내를 제공합니다.

사용 사례

미세 조정을 통해 특정 요구에 맞게 강력한 언어 모델을 맞춤설정할 수 있습니다. 자체 PDF 집합을 미세 조정하여 모델 성능을 크게 향상시킬 수 있는 주요 사용 사례는 다음과 같습니다.

  • 내부 기술 자료: 내부 문서를 즉각적인 답변 및 인사이트를 제공하는 AI 기반의 기술 자료로 전환합니다. 예를 들어 영업 담당자가 이전 교육 자료로부터 제품 사양 및 가격 책정 세부정보에 즉시 액세스할 수 있습니다.
  • 연구 어시스턴트: 연구 논문, 문서, 도서 모음을 분석할 수 있는 연구 어시스턴트를 만듭니다. 기후 변화를 연구하는 연구자가 과학 논문을 빠르게 분석하여 해수면 상승 추세를 식별하거나 여러 완화 전략의 효율성을 평가할 수 있습니다.
  • 법률 또는 규제 준수: 법률 문서에 대한 미세 조정을 통해 계약 검토를 자동화하고 잠재적 불일치 또는 위험 영역을 식별할 수 있습니다. 결과적으로 법률 전문가가 규정 준수를 보장하면서 더 높은 수준의 태스크에 집중할 수 있습니다.
  • 자동 보고서 생성: 복잡한 재무 보고서 분석을 자동화하고 핵심 성과 지표를 추출하고 이해관계자를 위한 요약 보고서를 생성합니다. 이렇게 하면 수동 분석에 비해 오류 위험을 줄이고 시간을 절약할 수 있습니다.
  • 콘텐츠 요약 및 분석: 긴 PDF 문서를 요약하고, 주요 정보를 추출하고, 추세를 분석합니다. 예를 들어 시장 연구팀이 고객 설문조사 모음을 분석하여 주요 테마와 의견을 식별할 수 있습니다.
  • 문서 비교 및 버전 제어: 문서의 여러 버전을 비교하여 변경사항을 식별하고 수정 내역을 추적합니다. 이 기능은 여러 작성자가 하나의 문서를 공동으로 작업하는 협업 환경에서 특히 유용할 수 있습니다.

제한사항

Gemini 2.5 모델

사양
예당 최대 PDF 페이지 수 300
예당 최대 PDF 파일 수 4
최대 PDF 파일 크기 20MB

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

사양
예당 최대 PDF 페이지 수 300
예당 최대 PDF 파일 수 4
최대 PDF 파일 크기 20MB

문서 이해 요구사항에 대한 자세한 내용은 문서 이해를 참조하세요.

데이터 세트 형식

데이터 세트의 fileUri는 Cloud Storage 버킷의 파일 URI이거나 공개적으로 사용 가능한 HTTP 또는 HTTPS URL일 수 있습니다.

일반적인 형식 예시는 Gemini용 데이터 세트 예시를 참조하세요.

다음은 문서 데이터 세트 예시입니다.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

다음 단계