Esta página fornece pré-requisitos e instruções detalhadas para ajustar o Gemini em dados de documentos usando o aprendizado supervisionado.
Casos de uso
Com o ajuste fino, você pode personalizar modelos de linguagem poderosos para suas necessidades específicas. Confira alguns casos de uso em que o ajuste fino com seu próprio conjunto de PDFs pode melhorar significativamente a performance de um modelo:
- Base de conhecimento interna: converta seus documentos internos em uma base de conhecimento com tecnologia de IA que fornece respostas e insights instantâneos. Por exemplo, um representante de vendas pode acessar instantaneamente as especificações do produto e os detalhes de preços dos materiais de treinamento anteriores.
- Assistente de pesquisa: crie um assistente de pesquisa capaz de analisar uma coleção de artigos, livros e documentos de pesquisa. Um pesquisador que estuda a mudança climática pode analisar rapidamente artigos científicos para identificar tendências no aumento do nível do mar ou avaliar a eficácia de diferentes estratégias de mitigação.
- Compliance legal ou regulatória: o ajuste fino de documentos legais pode ajudar a automatizar a análise de contratos, sinalizando possíveis inconsistências ou áreas de risco. Isso permite que os profissionais jurídicos se concentrem em tarefas de nível mais alto, garantindo a conformidade.
- Geração de relatórios automatizados: automatize a análise de relatórios financeiros complexos, extraindo indicadores principais de desempenho e gerando resumos para as partes interessadas. Isso pode economizar tempo e reduzir o risco de erros em comparação com a análise manual.
- Resumo e análise de conteúdo: resuma documentos PDF longos, extraia insights importantes e analise tendências. Por exemplo, uma equipe de pesquisa de mercado pode analisar uma coleção de pesquisas com clientes para identificar os principais temas e sentimentos.
- Document comparison and version control: compare diferentes versões de um documento para identificar mudanças e acompanhar revisões. Isso pode ser útil em ambientes colaborativos em que vários autores contribuem para um documento.
Limitações
- Máximo de páginas por exemplo: 16
- Número máximo de arquivos PDF por exemplo: 4
- Tamanho máximo do arquivo PDF: 20 MB
Para saber mais sobre os requisitos de compreensão de documentos, consulte Compreensão de documentos.
Formato do conjunto de dados
Confira a seguir um exemplo de conjunto de dados de documentos.
Para conferir o exemplo de formato genérico, consulte Exemplo de conjunto de dados para o Gemini 1.5 Pro e o Gemini 1.5 Flash.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist.Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 1.5 Pro, a multimodal AI model developed by Google DeepMind. The report positions Gemini 1.5 Pro as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
A seguir
- Para saber mais sobre a capacidade de compreensão de documentos dos modelos do Gemini, consulte a Visão geral da compreensão de documentos.
- Para começar a ajustar, consulte Ajustar modelos do Gemini usando ajuste supervisionado de detalhes.
- Para saber como o ajuste supervisionado de detalhes pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.