Embedding untuk Teks (text-embedding-004
) adalah nama untuk model yang mendukung embedding teks.
Embedding teks adalah teknik NLP yang mengonversi data tekstual menjadi vektor
numerik yang dapat diproses oleh algoritma machine learning, terutama model
besar. Representasi vektor ini dirancang untuk menangkap makna semantik
dan konteks dari kata-kata yang direpresentasikannya.
Tersedia beberapa versi untuk embedding. text-embedding-004
adalah model penyematan stabil terbaru dengan kualitas AI yang ditingkatkan, dan text-multilingual-embedding-002
adalah model yang dioptimalkan untuk berbagai bahasa selain Inggris.
Untuk mengeksplorasi model ini di konsol, lihat kartu Embeddings untuk model Teks di Model Garden.
Buka Model Garden
Kasus penggunaan
Penelusuran Semantik: Embedding teks dapat digunakan untuk merepresentasikan kueri pengguna dan seluruh dokumen dalam ruang vektor berdimensi tinggi. Dokumen yang secara semantik lebih mirip dengan kueri pengguna akan memiliki jarak yang lebih pendek dalam ruang vektor, dan dapat diberi peringkat lebih tinggi dalam hasil penelusuran.
Klasifikasi Teks: Melatih model yang memetakan embedding teks ke label kategori yang benar (misalnya, kucing vs. anjing, spam vs. bukan spam). Setelah dilatih, model dapat digunakan untuk mengklasifikasikan input teks baru ke dalam satu atau beberapa kategori berdasarkan embedding-nya.
Permintaan HTTP
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko:predict
Versi model
Untuk menggunakan versi model stabil, tentukan nomor versi model, misalnya text-embedding-004
.
Setiap versi stabil tersedia selama enam bulan setelah tanggal rilis
versi stabil berikutnya.
Tabel berikut berisi versi model stabil yang tersedia:
model textembedding-gecko | Tanggal rilis | Tanggal penghentian |
---|---|---|
textembedding-gecko@003 | 12 Desember 2023 | 14 Mei 2025 |
textembedding-gecko@002 | 2 November 2023 | 9 Oktober 2024 |
textembedding-gecko-multilingual@001 | 2 November 2023 | 14 Mei 2025 |
textembedding-gecko@001 | 7 Juni 2023 | 9 Oktober 2024 |
penyematan-teks-004 | 14 Mei 2024 | Tidak berlaku |
text-multilingual-embedding-002 | 14 Mei 2024 | Tidak berlaku |
Untuk mengetahui informasi selengkapnya, baca Versi dan siklus proses model.
Isi permintaan
{
"instances": [
{
"task_type": "RETRIEVAL_DOCUMENT",
"title": "document title",
"content": "I would like embeddings for this text!"
},
]
}
Vertex AI PaLM Embedding API melakukan prediksi online (real-time) untuk mendapatkan embedding dari teks input.
API ini menerima maksimum 3.072 token input dan menghasilkan output embedding
vektor 768 dimensi. Gunakan parameter berikut untuk model embedding teks textembedding-gecko
.
Untuk mengetahui informasi selengkapnya, lihat Ringkasan embedding
teks.
Parameter | Deskripsi | Nilai yang dapat diterima |
---|---|---|
|
Teks yang ingin Anda buatkan embedding-nya. | Teks |
|
Parameter `task_type` ditentukan sebagai aplikasi downstream yang dimaksudkan untuk membantu model menghasilkan embedding dengan kualitas yang lebih baik. Parameter tersebut merupakan string yang dapat mengambil salah satu nilai berikut. | RETRIEVAL_QUERY , RETRIEVAL_DOCUMENT , SEMANTIC_SIMILARITY , CLASSIFICATION , CLUSTERING , QUESTION_ANSWERING , FACT_VERIFICATION .
|
|
Judul untuk embedding. | Teks |
Permintaan sampel
REST
Untuk menguji prompt teks menggunakan Vertex AI API, kirim permintaan POST ke endpoint model penayang.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID Anda.
- TEXT: Teks yang ingin Anda buatkan embedding-nya.
Metode HTTP dan URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict
Isi JSON permintaan:
{ "instances": [ { "content": "TEXT"} ], }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/textembedding-gecko@003:predict" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip seperti contoh respons.
Python
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Python API.
Node.js
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Node.js Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Java di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Java Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Isi respons
{
"predictions": [
{
"embeddings": {
"statistics": {
"truncated": boolean,
"token_count": integer
},
"values": [ number ]
}
}
]
}
Elemen respons | Deskripsi |
---|---|
embeddings |
Hasil yang dihasilkan dari teks input. |
statistics |
Statistik yang dihitung dari teks input. |
truncated |
Menunjukkan apakah teks input melebihi token maksimum yang diizinkan dan terpotong. |
tokenCount |
Jumlah token teks input. |
values |
Kolom values berisi vektor embedding yang sesuai dengan kata-kata dalam teks input. |
Contoh respons
{
"predictions": [
{
"embeddings": {
"values": [
0.0058424929156899452,
0.011848051100969315,
0.032247550785541534,
-0.031829461455345154,
-0.055369812995195389,
...
],
"statistics": {
"token_count": 4,
"truncated": false
}
}
}
]
}