A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina fornisce i prerequisiti e le istruzioni dettagliate per perfezionare Gemini sui dati delle immagini utilizzando l'apprendimento supervisionato.
Casi d'uso
La messa a punto fine ti consente di adattare i modelli di base di Gemini per attività specializzate.
Ecco alcuni casi d'uso delle immagini:
Miglioramento del catalogo dei prodotti: estrae gli attributi chiave dalle immagini (ad es. marchio, colore, taglia) per creare ed arricchire automaticamente il tuo catalogo dei prodotti.
Moderazione delle immagini: perfeziona un modello per rilevare e segnalare contenuti inappropriati o dannosi nelle immagini, garantendo un'esperienza online più sicura.
Ispezione visiva: addestra un modello per identificare oggetti o difetti specifici all'interno delle immagini, automatizzando i processi di controllo qualità o ispezione.
Classificazione delle immagini: migliora l'accuratezza della classificazione delle immagini per ambiti specifici, come l'imaging medico o l'analisi di immagini satellitari.
Consigli basati sulle immagini: analizza le immagini per fornire consigli personalizzati, ad esempio su prodotti simili o articoli complementari.
Estrazione dei contenuti delle tabelle: estrae i dati dalle tabelle all'interno delle immagini e li converte in formati strutturati come fogli di lavoro o database.
Di seguito è riportato un esempio di set di dati di immagini.
{"contents":[{"role":"user","parts":[{"fileData":{"mimeType":"image/jpeg","fileUri":"gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/image/longcap100/100.jpeg"}},{"text":"Describe this image in detail that captures the essence of it."}]},{"role":"model","parts":[{"text":"A man stands on a road, wearing a blue denim jacket, tan pants, and white sneakers. He has his hands in his pockets and is wearing a white t-shirt under his jacket. The man's pants are cuffed, and his shoes are white. The road is dark grey, and the leaves are green. The man is standing in the shade, and the light is shining on the ground."}]}]}
Set di dati di esempio
Puoi utilizzare i seguenti set di dati di esempio per scoprire come ottimizzare un
modello Gemini. Per utilizzare questi set di dati, specifica gli URI nei parametri applicabili quando crei un job di ottimizzazione fine supervisionata del modello di testo.
Per utilizzare il set di dati di ottimizzazione di esempio, specifica la relativa posizione come segue:
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Image tuning\n\nThis page provides prerequisites and detailed instructions for fine-tuning\nGemini on image data using supervised learning.\n\nUse cases\n---------\n\nFine-tuning lets you adapt base Gemini models for specialized tasks.\nHere are some image use cases:\n\n- **Product catalog enhancement**: Extract key attributes from images (e.g., brand, color, size) to automatically build and enrich your product catalog.\n- **Image moderation**: Fine-tune a model to detect and flag inappropriate or harmful content in images, ensuring a safer online experience.\n- **Visual inspection**: Train a model to identify specific objects or defects within images, automating quality control or inspection processes.\n- **Image classification**: Improve the accuracy of image classification for specific domains, such as medical imaging or satellite imagery analysis.\n- **Image-based recommendations**: Analyze images to provide personalized recommendations, such as suggesting similar products or complementary items.\n- **Table content extraction**: Extract data from tables within images and convert it into structured formats like spreadsheets or databases.\n\nLimitations\n-----------\n\n- Maximum images per example: 30\n- Maximum image file size: 20MB\n\nTo learn more about image sample requirements, see the [Image understanding](/vertex-ai/generative-ai/docs/multimodal/image-understanding#image-requirements) page.\n\nDataset format\n--------------\n\nThe `fileUri` for your dataset can be the URI for a file in a Cloud Storage\nbucket, or it can be a publicly available HTTP or HTTPS URL.\n\nTo see the generic format example, see\n[Dataset example for Gemini](/vertex-ai/generative-ai/docs/models/gemini-supervised-tuning-prepare#dataset-example).\n\nThe following is an example of an image dataset. \n\n {\n \"contents\": [\n {\n \"role\": \"user\",\n \"parts\": [\n {\n \"fileData\": {\n \"mimeType\": \"image/jpeg\",\n \"fileUri\": \"gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/image/longcap100/100.jpeg\"\n }\n }, \n {\n \"text\": \"Describe this image in detail that captures the essence of it.\"\n }\n ]\n }, \n {\n \"role\": \"model\",\n \"parts\": [\n {\n \"text\": \"A man stands on a road, wearing a blue denim jacket, tan pants, and white sneakers. He has his hands in his pockets and is wearing a white t-shirt under his jacket. The man's pants are cuffed, and his shoes are white. The road is dark grey, and the leaves are green. The man is standing in the shade, and the light is shining on the ground.\"\n }\n ]\n }\n ]\n }\n\n### Sample datasets\n\nYou can use the following sample datasets to learn how to tune a\nGemini model. To use these datasets, specify the URIs in the\napplicable parameters when creating a text model supervised fine-tuning job.\n\nTo use the sample tuning dataset, specify its location as follows: \n\n \"training_dataset_uri\": \"gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl\",\n\nTo use the sample validation dataset, specify its location as follows: \n\n \"validation_dataset_uri\": \"gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl\",\n\nWhat's next\n-----------\n\n- To learn more about the image understanding capability of Gemini, see our [Image understanding](/vertex-ai/generative-ai/docs/multimodal/image-understanding) documentation.\n- To start tuning, see [Tune Gemini models by using supervised fine-tuning](/vertex-ai/generative-ai/docs/models/gemini-use-supervised-tuning)\n- To learn how supervised fine-tuning can be used in a solution that builds a generative AI knowledge base, see [Jump Start Solution: Generative AI\n knowledge base](/architecture/ai-ml/generative-ai-knowledge-base)."]]