Untuk menggunakan prediksi online, Anda dapat berinteraksi dengan AI Platform Training and Prediction API melalui endpoint globalnya (ml.googleapis.com
) atau melalui salah satu endpoint regionalnya (REGION-ml.googleapis.com
). Penggunaan endpoint regional untuk prediksi online akan memberikan perlindungan tambahan bagi model Anda dari gangguan di region lain karena hal ini mengisolasi resource versi dan model Anda dari region lain.
AI Platform Prediction saat ini mendukung endpoint regional berikut:
us-central1
us-east1
us-east4
us-west1
northamerica-northeast1
europe-west1
europe-west2
europe-west3
europe-west4
asia-east1
asia-northeast1
asia-southeast1
australia-southeast1
Panduan ini membandingkan manfaat dan batasan penggunaan endpoint regional dan endpoint global. Panduan ini juga membahas penggunaan endpoint regional untuk prediksi online.
Memahami endpoint regional
Endpoint regional memiliki beberapa perbedaan utama dengan endpoint global:
Endpoint regional hanya mendukung jenis mesin Compute Engine (N1). Anda tidak dapat menggunakan jenis mesin lama (MLS1) di endpoint regional. Artinya, semua manfaat dan batasan penggunaan jenis mesin Compute Engine (N1) berlaku. Misalnya, Anda dapat menggunakan GPU di endpoint regional, tetapi saat ini Anda tidak dapat mengaktifkan logging stream (konsol).
Untuk menggunakan jenis mesin Compute Engine (N1, Anda harus menggunakan endpoint regional.
Endpoint regional hanya mendukung prediksi online dan Penjelasan AI. Model yang di-deploy ke endpoint regional tidak mendukung prediksi batch.
AI Platform Prediction membagikan AI Platform Training and Prediction API dengan AI Platform Training dan AI Platform Vizier. Perlu diperhatikan bahwa endpoint regional saat ini tidak mendukung Pelatihan AI Platform. Hanya endpoint
us-central1
yang mendukung AI Platform Vizier.Lihat referensi API untuk mengetahui detail lebih lanjut tentang metode API yang tersedia di endpoint.
Nama resource Prediction AI Platform bersifat unik untuk project Google Cloud Anda di endpoint tertentu, tetapi dapat diduplikasi di berbagai endpoint. Misalnya,
Anda dapat membuat model bernama "hello-world" pada endpoint europe-west4
dan
model lain bernama "hello-world" di endpoint us-central1
.
Saat mencantumkan model di endpoint regional, Anda hanya akan melihat model yang dibuat di endpoint tersebut. Demikian pula, saat mencantumkan model di endpoint global, Anda hanya akan melihat model yang dibuat di endpoint global.
Endpoint regional versus region endpoint global
Saat membuat resource model di endpoint global, Anda dapat menentukan region untuk model Anda. Saat Anda membuat versi dalam model ini dan menampilkan prediksi, node prediksi akan berjalan di region yang ditentukan.
Saat Anda menggunakan endpoint regional, AI Platform Prediction akan menjalankan node prediksi Anda di region endpoint. Namun, dalam hal ini AI Platform Prediction memberikan isolasi tambahan dengan menjalankan semua infrastruktur Prediction AI Platform di region tersebut.
Misalnya, jika Anda menggunakan region us-east1
pada endpoint global, node prediksi Anda akan berjalan di us-east1
. Namun, infrastruktur Prediction AI Platform yang mengelola resource Anda (pemilihan rute; menangani pembuatan model dan versi, update, serta penghapusan; dll.) tidak harus berjalan di us-east1
. Di sisi lain, jika Anda menggunakan endpoint regional europe-west4
, node prediksi Anda dan semua infrastruktur Prediction AI Platform akan berjalan di europe-west4
.
Menggunakan endpoint regional
Untuk menggunakan endpoint regional, Anda harus terlebih dahulu membuat model di endpoint regional. Kemudian, lakukan semua tindakan terkait model tersebut (seperti membuat versi model dan mengirim permintaan prediksi) di endpoint yang sama.
Jika Anda menggunakan Google Cloud Console, pastikan Anda mencentang kotak Use regional endpoint saat membuat model. Lakukan semua tindakan konsol Google Cloud lainnya seperti yang Anda lakukan pada endpoint global.
Jika Anda menggunakan Google Cloud CLI, beri tanda --region
ke region endpoint Anda pada setiap perintah yang berinteraksi dengan model Anda dan resource turunannya. Ini mencakup hal-hal berikut:
- Setiap perintah dalam grup perintah
gcloud ai-platform models
. - Setiap perintah dalam grup perintah
gcloud ai-platform versions
. - Setiap perintah dalam grup perintah
gcloud ai-platform operations
saat berinteraksi dengan operasi yang berjalan lama yang terkait dengan versi model. - Perintah
gcloud ai-platform predict
. - Perintah
gcloud beta ai-platform explain
.
Selain itu, Anda dapat menetapkan properti ai_platform/region
ke region tertentu untuk memastikan gcloud CLI selalu menggunakan endpoint regional yang sesuai untuk perintah AI Platform Prediction, meskipun Anda tidak menentukan flag --region
. (Konfigurasi ini tidak berlaku untuk
perintah dalam
grup perintah
gcloud ai-platform operations
.)
Jika Anda berinteraksi langsung dengan AI Platform Training and Prediction API (misalnya, dengan menggunakan Library Klien Google API untuk Python), buat semua permintaan API seperti yang Anda lakukan ke endpoint global, tetapi gunakan endpoint regional sebagai gantinya. Lihat referensi API untuk mengetahui detail selengkapnya tentang metode API yang tersedia di endpoint regional.
Contoh berikut menunjukkan cara menggunakan endpoint regional untuk membuat model, membuat versi, dan mengirim permintaan prediksi online. Untuk menggunakan contoh tersebut, ganti REGION di mana pun muncul dengan salah satu wilayah tempat endpoint regional tersedia:
us-central1
us-east1
us-east4
us-west1
northamerica-northeast1
europe-west1
europe-west2
europe-west3
europe-west4
asia-east1
asia-northeast1
asia-southeast1
australia-southeast1
Membuat model
Konsol Google Cloud
Di konsol Google Cloud, buka halaman Create model dan pilih project Google Cloud Anda:
Beri nama model Anda, pilih kotak centang Use regional endpoint, lalu pilih region endpoint yang ingin digunakan dari menu drop-down Region.
Klik tombol Buat.
gcloud
Jalankan perintah berikut:
gcloud ai-platform models create MODEL_NAME \
--region=REGION
Dalam perintah, ganti placeholder berikut:
- MODEL_NAME: Nama yang Anda pilih untuk model Anda.
- REGION: Region endpoint yang ingin Anda gunakan.
Python
Contoh ini menggunakan Library Klien Google API untuk Python. Sebelum dapat menggunakannya, Anda harus menginstal Library Klien Google API untuk Python dan menyiapkan autentikasi di lingkungan pengembangan Anda.
Jalankan kode Python berikut:
from google.api_core.client_options import ClientOptions
from googleapiclient import discovery
endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)
request_body = { 'name': 'MODEL_NAME' }
request = ml.projects().models().create(parent='projects/PROJECT_ID',
body=request_body)
response = request.execute()
print(response)
Dalam kode, ganti placeholder berikut:
- REGION: Region endpoint yang ingin Anda gunakan.
- MODEL_NAME: Nama yang Anda pilih untuk model Anda.
- PROJECT_ID: ID project Google Cloud Anda.
Pelajari lebih lanjut cara membuat model.
Membuat versi model
Contoh ini mengasumsikan bahwa Anda telah mengupload artefak model yang kompatibel ke Cloud Storage.
Konsol Google Cloud
Dengan menggunakan model yang Anda buat di bagian sebelumnya, ikuti panduan untuk membuat versi model di Konsol Google Cloud.
gcloud
Contoh ini mengasumsikan bahwa Anda telah mengupload artefak model yang kompatibel ke Cloud Storage. Jalankan perintah berikut:
gcloud ai-platform versions create VERSION_NAME \
--region=REGION \
--model=MODEL_NAME \
--framework=FRAMEWORK \
--machine-type=MACHINE_TYPE \
--origin=MODEL_DIRECTORY \
--python-version=3.7 \
--runtime-version=2.11
Dalam perintah, ganti placeholder berikut:
- REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
- VERSION_NAME: Nama yang Anda pilih untuk versi Anda.
- MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
- FRAMEWORK: Framework yang digunakan untuk membuat artefak model.
- MACHINE_TYPE: Jenis mesin Compute Engine (N1).
- MODEL_DIRECTORY: URI Cloud Storage ke direktori model Anda (dimulai dengan "gs://").
Python
Jalankan kode Python berikut:
from google.api_core.client_options import ClientOptions
from googleapiclient import discovery
endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)
request_body = { 'name': 'VERSION_NAME',
'deploymentUri': 'MODEL_DIRECTORY',
'runtimeVersion': '2.11',
'machineType': 'MACHINE_TYPE',
'framework': 'FRAMEWORK',
'pythonVersion': '3.7'}
request = ml.projects().models().versions().create(
parent='projects/PROJECT_ID/models/MODEL_NAME',
body=request_body)
response = request.execute()
print(response)
Dalam kode, ganti placeholder berikut:
- REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
- VERSION_NAME: Nama yang Anda pilih untuk versi Anda.
- MODEL_DIRECTORY: URI Cloud Storage ke direktori model Anda (dimulai dengan "gs://").
- MACHINE_TYPE: Jenis mesin Compute Engine (N1).
- FRAMEWORK: Framework yang digunakan untuk membuat artefak model.
- PROJECT_ID: ID project Google Cloud Anda.
- MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
Pelajari cara membuat versi model lebih lanjut.
Mengirim permintaan prediksi online
Konsol Google Cloud
Di konsol Google Cloud, buka halaman Model:
Di menu drop-down Region, pilih region endpoint yang digunakan model Anda. Klik nama model yang Anda buat di bagian sebelumnya untuk membuka halaman Model Details.
Klik nama versi yang Anda buat di bagian sebelumnya untuk membuka halaman Version Details.
Klik tab Uji & gunakan. Masukkan satu atau beberapa instance data input, lalu klik tombol Test untuk mengirim permintaan prediksi online.
gcloud
Contoh ini mengasumsikan bahwa Anda telah menyimpan input prediksi di file JSON yang dibatasi baris baru di lingkungan lokal. Jalankan perintah berikut:
gcloud ai-platform predict \
--region=REGION \
--model=MODEL_NAME \
--version=VERSION_NAME \
--json-request=INPUT_PATH
Dalam perintah, ganti placeholder berikut:
- REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
- MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
- VERSION_NAME: Nama versi model yang Anda buat di bagian sebelumnya.
- INPUT_PATH: Jalur di sistem file lokal Anda ke file JSON dengan input prediksi.
Python
Jalankan kode Python berikut:
from google.api_core.client_options import ClientOptions
from googleapiclient import discovery
endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)
request_body = { 'instances': INSTANCES }
request = ml.projects().predict(
name='projects/PROJECT_ID/models/MODEL_NAME/VERSION_NAME',
body=request_body)
response = request.execute()
print(response)
Dalam kode, ganti placeholder berikut:
- REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
- INSTANCES: Daftar instance input prediksi.
- MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
- VERSION_NAME: Nama versi yang Anda buat di bagian sebelumnya.
Pelajari lebih lanjut cara mendapatkan prediksi online.
Langkah selanjutnya
- Lihat perbedaan ketersediaan regional untuk endpoint regional dan endpoint global. Hal ini mencakup perbedaan ketersediaan GPU.
- Pelajari lebih lanjut jenis mesin Compute Engine (N1), yang diperlukan untuk endpoint regional.
- Baca opsi tambahan lainnya yang dapat dikonfigurasi saat Anda membuat model dan versi.