Penyesuaian gambar

Halaman ini memberikan prasyarat dan petunjuk mendetail untuk meningkatkan kualitas Gemini pada data gambar menggunakan pembelajaran dengan pengawasan.

Kasus penggunaan

Penyesuaian memungkinkan Anda menyesuaikan model gambar terlatih untuk tugas khusus, sehingga meningkatkan performanya secara signifikan. Berikut beberapa kasus penggunaan gambar:

  • Peningkatan kualitas katalog produk: Mengekstrak atribut utama dari gambar (misalnya, merek, warna, ukuran) untuk membuat dan memperkaya katalog produk Anda secara otomatis.
  • Moderasi gambar: Menyesuaikan model untuk mendeteksi dan melaporkan konten yang tidak pantas atau berbahaya dalam gambar, sehingga memastikan pengalaman online yang lebih aman.
  • Pemeriksaan visual: Melatih model untuk mengidentifikasi objek atau kerusakan tertentu dalam gambar, yang mengotomatiskan proses pemeriksaan atau kontrol kualitas.
  • Klasifikasi gambar: Meningkatkan akurasi klasifikasi gambar untuk domain tertentu, seperti pencitraan medis atau analisis citra satelit.
  • Rekomendasi berbasis gambar: Menganalisis gambar untuk memberikan rekomendasi yang dipersonalisasi, seperti menyarankan produk serupa atau item pelengkap.
  • Ekstraksi konten tabel: Mengekstrak data dari tabel dalam gambar dan mengonversinya menjadi format terstruktur seperti spreadsheet atau database.

Batasan

  • Gambar maksimum per contoh: 16
  • Ukuran file gambar maksimum: 20 MB

Untuk mempelajari persyaratan sampel gambar lebih lanjut, lihat halaman Pemahaman gambar.

Format set data

Berikut adalah contoh set data gambar.

Untuk melihat contoh format generik, lihat Contoh set data untuk Gemini 1.5 pro dan Gemini 1.5 flash.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "image/jpeg",
            "fileUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-1_5/image/longcap100/100.jpeg"
            }
        }, 
        {
          "text": "Describe this image in detail that captures the essence of it."
        }
      ]
    }, 
    {
      "role": "model",
      "parts": [
        {
          "text": "A man stands on a road, wearing a blue denim jacket, tan pants, and white sneakers. He has his hands in his pockets and is wearing a white t-shirt under his jacket. The man's pants are cuffed, and his shoes are white. The road is dark grey, and the leaves are green. The man is standing in the shade, and the light is shining on the ground."
        }
      ]
    }
  ]
}

Contoh set data

Anda dapat menggunakan set data sampel untuk mempelajari cara menyesuaikan model gemini-1.5-pro atau gemini-1.5-flash.

Untuk menggunakan set data ini, tentukan URI dalam parameter yang berlaku saat membuat tugas penyesuaian yang diawasi model teks.

Contoh:

...
"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_train_data.jsonl",
...
"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_validation_data.jsonl",
...

Langkah selanjutnya