Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

MedLM API

Pernyataan Penyangkalan: MedLM di Vertex AI tersedia secara umum (GA) di Amerika Serikat, Brasil, dan Singapura untuk sekelompok pelanggan terbatas, dan tersedia dalam Pratinjau untuk sekelompok pelanggan terbatas di luar Amerika Serikat. Rilis ini berfokus pada penggunaan Tanya Jawab Medis dan Ringkasan Medis. Dengan menggunakan MedLM API, Anda menyetujui Kebijakan Penggunaan Terlarang untuk AI Generatif dan Persyaratan Spesifik Per Layanan Google Cloud Platform, dan Anda setuju untuk memberi tahu dan berkoordinasi dengan Google secara tepercaya untuk menanggapi pertanyaan peraturan terkait penggunaan MedLM oleh Anda. Untuk produk ini, Anda dapat memproses data pribadi sebagaimana diuraikan dalam Persyaratan Keamanan Pemrosesan Data, dengan tunduk pada batasan yang dijelaskan dalam Persyaratan Layanan Google Cloud Platform. Untuk mengetahui informasi selengkapnya, lihat deskripsi tahap peluncuran. Asalkan Anda membuat Perjanjian Rekanan Bisnis dengan Google yang mencakup penggunaan Layanan Google Cloud Platform oleh Anda, MedLM API dapat digunakan untuk memproses Informasi Kesehatan Terlindungi yang tunduk pada Health Insurance Portability and Accountability Act (HIPAA) tahun 1996 dan/atau setiap amandemen atau peraturan berdasarkan HIPAA.

Perhatian:

Sebelum mengaktifkan penggunaan Produksi untuk MedLM, pelanggan harus menghubungi Tim Produk Google untuk mendiskusikan penggunaannya.
MedLM tidak dirancang atau dikembangkan untuk digunakan sebagai perangkat medis. Setiap output harus diverifikasi oleh Tenaga Kesehatan Profesional (HCP), dan tidak boleh ada klaim diagnosis langsung.
Output yang dihasilkan mungkin tidak selalu sepenuhnya dapat diandalkan. Karena sifat LLM dan AI Generatif, output mungkin berisi informasi yang salah atau bias (misalnya, stereotipe atau konten berbahaya lainnya) dan harus ditinjau. Semua ringkasan atau jawaban harus dianggap sebagai draf dan bukan final.
Jika Vertex AI mendeteksi konten yang melanggar kebijakan kami, termasuk Kebijakan Penggunaan yang Dapat Diterima untuk Google Cloud Platform dan Kebijakan Penggunaan Terlarang untuk AI Generatif, respons tidak akan ditampilkan.
Saat digunakan oleh profesional kesehatan untuk tujuan tanya jawab, MedLM hanya ditujukan untuk digunakan sebagai alat pendidikan untuk pelatihan medis atau untuk memperkuat pelatihan sebelumnya yang telah diterima oleh profesional kesehatan.
Output LLM mungkin tidak mengikuti format persis yang ditetapkan dalam perintah. Desain perintah untuk mengekstrak informasi untuk setiap kolom harus mempertimbangkan bahwa formatnya mungkin berbeda dari aslinya (misalnya, tanda hubung dalam nama kolom, kapitalisasi huruf yang tepat).

MedLM adalah serangkaian model dasar yang disesuaikan untuk industri perawatan kesehatan. Med-PaLM 2 adalah salah satu model berbasis teks yang dikembangkan oleh Tim Riset Google yang mendukung MedLM, dan merupakan sistem AI pertama yang mencapai tingkat pakar manusia dalam menjawab pertanyaan bergaya Ujian Lisensi Medis AS (USMLE). Pengembangan model ini telah didasarkan pada kebutuhan pelanggan tertentu, seperti menjawab pertanyaan medis dan membuat draf ringkasan.

Kartu model MedLM

Kartu model MedLM menguraikan detail model, seperti penggunaan yang dimaksudkan untuk MedLM, ringkasan data, dan informasi keamanan. Klik link berikut untuk mendownload kartu model MedLM versi PDF:

Download kartu model MedLM

Kasus penggunaan

Penjawaban pertanyaan: Memberikan draf jawaban atas pertanyaan terkait medis, yang diberikan sebagai teks.
Ringkasan: Membuat draf versi dokumen yang lebih pendek (seperti Ringkasan Setelah Berkunjung atau catatan Anamnesis dan Pemeriksaan Fisik) yang menggabungkan informasi terkait dari teks asli.

Untuk mengetahui informasi selengkapnya tentang cara mendesain perintah teks, lihat Ringkasan strategi pemberian perintah.

Permintaan HTTP

MedLM-medium (medlm-medium):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large (medlm-large):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

Lihat metode predict untuk informasi selengkapnya.

Versi model

MedLM menyediakan model berikut:

MedLM-medium (medlm-medium)
MedLM-large (medlm-large)

Tabel berikut berisi versi model stabil yang tersedia:

medlm-medium model	Tanggal rilis
`medlm-medium`	13 Desember 2023

Model medlm-large	Tanggal rilis
`medlm-large`	13 Desember 2023

MedLM-medium dan MedLM-large memiliki endpoint terpisah dan memberikan fleksibilitas tambahan kepada pelanggan untuk kasus penggunaan mereka. MedLM-medium memberikan throughput yang lebih baik kepada pelanggan dan menyertakan data yang lebih baru. MedLM-large adalah model yang sama dari fase pratinjau. Kedua model akan terus diperbarui selama siklus proses produk. Di halaman ini, "MedLM" merujuk pada kedua model.

Untuk mengetahui informasi selengkapnya, baca Versi dan siklus proses model.

Filter dan atribut keamanan MedLM

Konten yang diproses melalui MedLM API dinilai berdasarkan daftar atribut keamanan, termasuk "kategori berbahaya" dan topik yang mungkin dianggap sensitif. Jika Anda melihat respons penggantian, seperti "Saya tidak dapat membantu, karena saya hanya model bahasa", artinya prompt atau respons sedang memicu filter keamanan.

Nilai minimum keamanan

Saat menggunakan Vertex AI Studio, Anda dapat menggunakan nilai minimum filter keamanan yang dapat disesuaikan untuk menentukan seberapa besar kemungkinan Anda melihat respons yang dapat berbahaya. Respons model diblokir berdasarkan probabilitas bahwa konten tersebut berisi pelecehan, ujaran kebencian, konten berbahaya, atau konten seksual vulgar. Setelan filter keamanan terletak di sisi kanan kolom perintah di Vertex AI Studio. Anda dapat memilih dari tiga opsi: block most, block some, dan block few.

Gambar konsol

Menguji nilai minimum keyakinan dan tingkat keparahan

Anda dapat menguji filter keamanan Google dan menentukan nilai minimum keyakinan yang tepat untuk bisnis Anda. Dengan menggunakan nilai minimum ini, Anda dapat mengambil tindakan yang komprehensif untuk mendeteksi konten yang melanggar kebijakan penggunaan atau persyaratan layanan Google dan mengambil tindakan yang sesuai.

Skor keyakinan hanyalah prediksi, dan Anda tidak boleh bergantung pada skor tersebut dalam hal keandalan atau akurasi. Google tidak bertanggung jawab untuk menafsirkan atau menggunakan skor ini untuk keputusan bisnis.

Praktik yang direkomendasikan

Untuk memanfaatkan teknologi ini dengan aman dan bertanggung jawab, penting untuk mempertimbangkan risiko lain yang spesifik untuk kasus penggunaan, pengguna, dan konteks bisnis Anda, selain memanfaatkan perlindungan teknis bawaan.

Anda sebaiknya melakukan langkah-langkah berikut ini:

Menilai risiko keamanan aplikasi Anda.
Mempertimbangkan penyesuaian untuk mengurangi risiko keselamatan.
Melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda.
Meminta masukan pengguna dan memantau konten.

Untuk mempelajari lebih lanjut, lihat rekomendasi Google untuk Responsible AI.

Isi permintaan

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

Gunakan parameter berikut untuk model medlm-medium dan medlm-large. Untuk mengetahui informasi selengkapnya, lihat Mendesain perintah teks.

Parameter	Deskripsi	Nilai yang dapat diterima
`content`	Input teks untuk menghasilkan respons model. Perintah dapat mencakup preamble, pertanyaan, saran, instruksi, atau contoh.	Teks
`temperature`	Suhu digunakan untuk pengambilan sampel selama pembuatan respons, yang terjadi saat `topP` dan `topK` diterapkan. Suhu mengontrol tingkat keacakan dalam pemilihan token. Suhu yang lebih rendah cocok untuk perintah yang memerlukan respons yang kurang terbuka atau kreatif, sedangkan suhu yang lebih tinggi dapat memberikan hasil yang lebih beragam atau kreatif. Suhu `0` berarti token probabilitas tertinggi selalu dipilih. Dalam hal ini, respons untuk permintaan tertentu sebagian besar deterministik, tetapi sedikit variasi masih dapat dilakukan. Jika model menampilkan respons yang terlalu umum, terlalu pendek, atau model memberikan respons pengganti, coba tingkatkan suhunya.	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	Jumlah maksimum token yang dapat dibuat dalam respons. Token terdiri dari sekitar empat karakter. 100 token setara dengan sekitar 60-80 kata. Tentukan nilai yang lebih rendah untuk respons yang lebih singkat dan nilai yang lebih tinggi untuk potensi respons yang lebih panjang.	`1–8192` untuk medlm-medium `1–1024` untuk medlm-large
`topK`	Top-K mengubah cara model memilih token untuk output. Top-K `1` berarti token yang dipilih berikutnya adalah yang paling mungkin di antara semua token dalam kosakata model (juga disebut decoding greedy), sedangkan top-K `3` berarti token berikutnya dipilih di antara tiga token yang paling mungkin dengan menggunakan suhu. Untuk setiap langkah pemilihan token, token top-K dengan probabilitas tertinggi akan diambil sampelnya. Kemudian token akan difilter lebih lanjut berdasarkan top-P dengan token akhir yang dipilih menggunakan pengambilan sampel suhu. Tentukan nilai yang lebih rendah untuk respons acak yang lebih sedikit dan nilai yang lebih tinggi untuk respons acak yang lebih banyak.	`1–40` `Default: 40`
`topP`	Top-P mengubah cara model memilih token untuk output. Token dipilih dari yang paling mungkin hingga yang paling tidak mungkin sampai jumlah probabilitasnya sama dengan nilai top-P. Misalnya, jika token A, B, dan C memiliki probabilitas 0,3, 0,2, dan 0,1 dengan nilai top-P `0.5`, model akan memilih A atau B sebagai token berikutnya dengan menggunakan suhu dan mengecualikan C sebagai kandidat. Tentukan nilai yang lebih rendah untuk respons acak yang lebih sedikit dan nilai yang lebih tinggi untuk respons acak yang lebih banyak.	`0.0–1.0` `Default: 0.8`

Permintaan sampel

Saat menggunakan MedLM API, penting untuk menerapkan teknik pembuatan perintah. Misalnya, sebaiknya berikan petunjuk yang sesuai dan khusus untuk tugas di awal setiap perintah. Untuk mengetahui informasi selengkapnya, lihat Pengantar perintah.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

PROJECT_ID: Project ID Anda.
MEDLM_MODEL: Model MedLM, baik medlm-medium maupun medlm-large.

Metode HTTP dan URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

Isi JSON permintaan:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login , atau dengan menggunakan Cloud Shell, yang secara otomatis membuat Anda login ke gcloud CLI . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json. Jalankan perintah berikut di terminal untuk membuat atau menimpa file ini di direktori saat ini:

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

Kemudian, jalankan perintah berikut untuk mengirim permintaan REST Anda:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.