A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina fornisce i prerequisiti e istruzioni dettagliate per il perfezionamento di
Gemini sui dati dei documenti utilizzando l'apprendimento supervisionato.
Casi d'uso
L'ottimizzazione ti consente di personalizzare potenti modelli linguistici in base alle tue esigenze specifiche.
Ecco alcuni casi d'uso chiave in cui il perfezionamento con il tuo set di PDF può
migliorare significativamente le prestazioni di un modello:
Knowledge base interna: converti i tuoi documenti interni in una knowledge base basata sull'AI che fornisce risposte e approfondimenti immediati. Ad esempio, un rappresentante di vendita potrebbe accedere immediatamente alle specifiche del prodotto e ai dettagli sui prezzi dai materiali di formazione precedenti.
Assistente di ricerca: crea un assistente di ricerca in grado di analizzare una raccolta di articoli, libri e documenti di ricerca. Un ricercatore che studia i cambiamenti climatici potrebbe analizzare rapidamente articoli scientifici per identificare le tendenze dell'innalzamento del livello del mare o valutare l'efficacia di diverse strategie di mitigazione.
Conformità legale o normativa: il perfezionamento dei documenti legali può contribuire ad automatizzare la revisione dei contratti, segnalando potenziali incongruenze o aree di rischio. Ciò consente ai professionisti legali di concentrarsi su attività di livello superiore, garantendo al contempo la conformità.
Generazione automatica di report: automatizza l'analisi di report finanziari complessi, estraendo gli indicatori chiave di prestazione e generando riepiloghi per gli stakeholder. In questo modo, puoi risparmiare tempo e ridurre il rischio di errori rispetto all'analisi manuale.
Riepilogo e analisi dei contenuti: riassumi documenti PDF lunghi, estrai informazioni chiave e analizza le tendenze. Ad esempio, un team di ricerche di mercato potrebbe analizzare una raccolta di sondaggi tra i clienti per identificare i temi e il sentiment principali.
Confronto di documenti e controllo della versione: confronta diverse versioni di un documento per identificare le modifiche e monitorare le revisioni. Ciò può essere particolarmente utile in ambienti collaborativi in cui più autori contribuiscono a un documento.
Di seguito è riportato un esempio di set di dati di documenti.
{"contents":[{"role":"user","parts":[{"fileData":{"mimeType":"application/pdf","fileUri":"gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"}},{"text":"You are a very professional document summarization specialist. Please summarize the given document."}]},{"role":"model","parts":[{"text":"The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."}]}]}
Passaggi successivi
Per scoprire di più sulla funzionalità di comprensione dei documenti dei modelli Gemini, consulta la panoramica della comprensione dei documenti.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Document tuning\n\nThis page provides prerequisites and detailed instructions for fine-tuning\nGemini on document data using supervised learning.\n\nUse cases\n---------\n\nFine-tuning lets you customize powerful language models for your specific needs.\nHere are some key use cases where fine-tuning with your own set of PDFs can\nsignificantly enhance a model's performance:\n\n- **Internal knowledge base**: Convert your internal documents into an AI-powered knowledge base that provides instant answers and insights. For example, a sales representative could instantly access product specifications and pricing details from past training materials.\n- **Research assistant**: Create a research assistant capable of analyzing a collection of research papers, articles, and books. A researcher studying climate change could quickly analyze scientific papers to identify trends in sea level rise or assess the effectiveness of different mitigation strategies.\n- **Legal or regulatory compliance**: Fine-tuning on legal documents can help automate contract review, flagging potential inconsistencies or areas of risk. This allows legal professionals to focus on higher-level tasks while ensuring compliance.\n- **Automated report generation**: Automate the analysis of complex financial reports, extracting key performance indicators and generating summaries for stakeholders. This can save time and reduce the risk of errors compared to manual analysis.\n- **Content summarization and analysis**: Summarize lengthy PDF documents, extract key insights, and analyze trends. For example, a market research team could analyze a collection of customer surveys to identify key themes and sentiment.\n- **Document comparison and version control**: Compare different versions of a document to identify changes and track revisions. This can be particularly useful in collaborative environments where multiple authors contribute to a document.\n\nLimitations\n-----------\n\n### Gemini 2.5 models\n\n### Gemini 2.0 Flash\nGemini 2.0 Flash-Lite\n\nTo learn more about document understanding requirements, see [Document understanding](/vertex-ai/generative-ai/docs/multimodal/document-understanding#document-requirements).\n\nDataset format\n--------------\n\nThe `fileUri` for your dataset can be the URI for a file in a Cloud Storage\nbucket, or it can be a publicly available HTTP or HTTPS URL.\n\nTo see the generic format example, see\n[Dataset example for Gemini](/vertex-ai/generative-ai/docs/models/gemini-supervised-tuning-prepare#dataset-example).\n\nThe following is an example of a document dataset. \n\n {\n \"contents\": [\n {\n \"role\": \"user\",\n \"parts\": [\n {\n \"fileData\": {\n \"mimeType\": \"application/pdf\",\n \"fileUri\": \"gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf\"\n }\n },\n {\n \"text\": \"You are a very professional document summarization specialist. Please summarize the given document.\"\n }\n ]\n },\n {\n \"role\": \"model\",\n \"parts\": [\n {\n \"text\": \"The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications.\"\n }\n ]\n }\n ]\n }\n\nWhat's next\n-----------\n\n- To learn more about the document understanding capability of Gemini models, see the [Document understanding](/vertex-ai/generative-ai/docs/multimodal/document-understanding) overview.\n- To start tuning, see [Tune Gemini models by using supervised fine-tuning](/vertex-ai/generative-ai/docs/models/gemini-use-supervised-tuning)\n- To learn how supervised fine-tuning can be used in a solution that builds a generative AI knowledge base, see [Jump Start Solution: Generative AI\n knowledge base](/architecture/ai-ml/generative-ai-knowledge-base)."]]