Cette page fournit les conditions préalables et des instructions détaillées pour affiner Gemini sur les données de documents à l'aide de l'apprentissage supervisé.
Cas d'utilisation
Le réglage fin vous permet de personnaliser des modèles de langage puissants en fonction de vos besoins spécifiques. Voici quelques cas d'utilisation clés dans lesquels l'affinage avec votre propre ensemble de PDF peut améliorer considérablement les performances d'un modèle:
- Base de connaissances interne: convertissez vos documents internes en une base de connaissances alimentée par l'IA qui fournit des réponses et des insights instantanés. Par exemple, un représentant commercial peut accéder instantanément aux spécifications et aux détails de tarification d'un produit à partir de documents de formation précédents.
- Assistant de recherche: créez un assistant de recherche capable d'analyser une collection de documents de recherche, d'articles et de livres. Un chercheur étudiant le changement climatique peut rapidement analyser des articles scientifiques pour identifier les tendances de la montée du niveau de la mer ou évaluer l'efficacité de différentes stratégies d'atténuation.
- Conformité juridique ou réglementaire: le raffinement des documents juridiques peut aider à automatiser l'examen des contrats, en signalant les incohérences ou les zones à risque potentielles. Les professionnels du droit peuvent ainsi se concentrer sur des tâches de niveau supérieur tout en assurant la conformité.
- Génération automatisée de rapports: automatisez l'analyse de rapports financiers complexes, en extrayant les indicateurs clés de performance et en générant des résumés pour les parties prenantes. Cela peut vous faire gagner du temps et réduire le risque d'erreurs par rapport à une analyse manuelle.
- Synthèse et analyse du contenu: résumez de longs documents PDF, extrayez des insights clés et analysez les tendances. Par exemple, une équipe d'études de marché peut analyser un ensemble d'enquêtes auprès des clients pour identifier les principaux thèmes et sentiments.
- Comparaison de documents et contrôle des versions: comparez différentes versions d'un document pour identifier les modifications et suivre les révisions. Cela peut s'avérer particulièrement utile dans les environnements collaboratifs où plusieurs auteurs contribuent à un document.
Limites
- Nombre maximal de pages par exemple: 16
- Nombre maximal de fichiers PDF par exemple: 4
- Taille maximale du fichier PDF: 20 Mo
Pour en savoir plus sur les exigences de compréhension des documents, consultez la section Comprendre les documents.
Format de l'ensemble de données
Voici un exemple d'ensemble de données de documents.
Pour voir l'exemple de format générique, consultez Exemple d'ensemble de données pour Gemini 1.5 Pro et Gemini 1.5 Flash.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist.Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 1.5 Pro, a multimodal AI model developed by Google DeepMind. The report positions Gemini 1.5 Pro as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
Étape suivante
- Pour en savoir plus sur la capacité de compréhension des documents des modèles Gemini, consultez la présentation de la compréhension des documents.
- Pour commencer à régler vos modèles, consultez Régler des modèles Gemini à l'aide des réglages supervisés.
- Pour savoir comment utiliser le réglage supervisé dans une solution qui crée une base de connaissances d'IA générative, consultez la page Solution de démarrage rapide : base de connaissances d'IA générative.