Endpoint regional

Untuk menggunakan prediksi online, Anda dapat berinteraksi dengan AI Platform Training and Prediction API melalui endpoint globalnya (ml.googleapis.com) atau melalui salah satu endpoint regionalnya (REGION-ml.googleapis.com). Penggunaan endpoint regional untuk prediksi online akan memberikan perlindungan tambahan bagi model Anda dari gangguan di region lain karena hal ini mengisolasi resource versi dan model Anda dari region lain.

AI Platform Prediction saat ini mendukung endpoint regional berikut:

  • us-central1
  • us-east1
  • us-east4
  • us-west1
  • northamerica-northeast1
  • europe-west1
  • europe-west2
  • europe-west3
  • europe-west4
  • asia-east1
  • asia-northeast1
  • asia-southeast1
  • australia-southeast1

Panduan ini membandingkan manfaat dan batasan penggunaan endpoint regional dan endpoint global. Panduan ini juga membahas penggunaan endpoint regional untuk prediksi online.

Memahami endpoint regional

Endpoint regional memiliki beberapa perbedaan utama dengan endpoint global:

  • Endpoint regional hanya mendukung jenis mesin Compute Engine (N1). Anda tidak dapat menggunakan jenis mesin lama (MLS1) di endpoint regional. Artinya, semua manfaat dan batasan penggunaan jenis mesin Compute Engine (N1) berlaku. Misalnya, Anda dapat menggunakan GPU di endpoint regional, tetapi saat ini Anda tidak dapat mengaktifkan logging stream (konsol).

    Untuk menggunakan jenis mesin Compute Engine (N1, Anda harus menggunakan endpoint regional.

  • Endpoint regional hanya mendukung prediksi online dan Penjelasan AI. Model yang di-deploy ke endpoint regional tidak mendukung prediksi batch.

    AI Platform Prediction membagikan AI Platform Training and Prediction API dengan AI Platform Training dan AI Platform Vizier. Perlu diperhatikan bahwa endpoint regional saat ini tidak mendukung Pelatihan AI Platform. Hanya endpoint us-central1 yang mendukung AI Platform Vizier.

    Lihat referensi API untuk mengetahui detail lebih lanjut tentang metode API yang tersedia di endpoint.

Nama resource Prediction AI Platform bersifat unik untuk project Google Cloud Anda di endpoint tertentu, tetapi dapat diduplikasi di berbagai endpoint. Misalnya, Anda dapat membuat model bernama "hello-world" pada endpoint europe-west4 dan model lain bernama "hello-world" di endpoint us-central1.

Saat mencantumkan model di endpoint regional, Anda hanya akan melihat model yang dibuat di endpoint tersebut. Demikian pula, saat mencantumkan model di endpoint global, Anda hanya akan melihat model yang dibuat di endpoint global.

Endpoint regional versus region endpoint global

Saat membuat resource model di endpoint global, Anda dapat menentukan region untuk model Anda. Saat Anda membuat versi dalam model ini dan menampilkan prediksi, node prediksi akan berjalan di region yang ditentukan.

Saat Anda menggunakan endpoint regional, AI Platform Prediction akan menjalankan node prediksi Anda di region endpoint. Namun, dalam hal ini AI Platform Prediction memberikan isolasi tambahan dengan menjalankan semua infrastruktur Prediction AI Platform di region tersebut.

Misalnya, jika Anda menggunakan region us-east1 pada endpoint global, node prediksi Anda akan berjalan di us-east1. Namun, infrastruktur Prediction AI Platform yang mengelola resource Anda (pemilihan rute; menangani pembuatan model dan versi, update, serta penghapusan; dll.) tidak harus berjalan di us-east1. Di sisi lain, jika Anda menggunakan endpoint regional europe-west4, node prediksi Anda dan semua infrastruktur Prediction AI Platform akan berjalan di europe-west4.

Menggunakan endpoint regional

Untuk menggunakan endpoint regional, Anda harus terlebih dahulu membuat model di endpoint regional. Kemudian, lakukan semua tindakan terkait model tersebut (seperti membuat versi model dan mengirim permintaan prediksi) di endpoint yang sama.

Jika Anda menggunakan Google Cloud Console, pastikan Anda mencentang kotak Use regional endpoint saat membuat model. Lakukan semua tindakan konsol Google Cloud lainnya seperti yang Anda lakukan pada endpoint global.

Jika Anda menggunakan Google Cloud CLI, beri tanda --region ke region endpoint Anda pada setiap perintah yang berinteraksi dengan model Anda dan resource turunannya. Ini mencakup hal-hal berikut:

Selain itu, Anda dapat menetapkan properti ai_platform/region ke region tertentu untuk memastikan gcloud CLI selalu menggunakan endpoint regional yang sesuai untuk perintah AI Platform Prediction, meskipun Anda tidak menentukan flag --region. (Konfigurasi ini tidak berlaku untuk perintah dalam grup perintah gcloud ai-platform operations.)

Jika Anda berinteraksi langsung dengan AI Platform Training and Prediction API (misalnya, dengan menggunakan Library Klien Google API untuk Python), buat semua permintaan API seperti yang Anda lakukan ke endpoint global, tetapi gunakan endpoint regional sebagai gantinya. Lihat referensi API untuk mengetahui detail selengkapnya tentang metode API yang tersedia di endpoint regional.

Contoh berikut menunjukkan cara menggunakan endpoint regional untuk membuat model, membuat versi, dan mengirim permintaan prediksi online. Untuk menggunakan contoh tersebut, ganti REGION di mana pun muncul dengan salah satu wilayah tempat endpoint regional tersedia:

  • us-central1
  • us-east1
  • us-east4
  • us-west1
  • northamerica-northeast1
  • europe-west1
  • europe-west2
  • europe-west3
  • europe-west4
  • asia-east1
  • asia-northeast1
  • asia-southeast1
  • australia-southeast1

Membuat model

Konsol Google Cloud

  1. Di konsol Google Cloud, buka halaman Create model dan pilih project Google Cloud Anda:

    Buka halaman Buat model

  2. Beri nama model Anda, pilih kotak centang Use regional endpoint, lalu pilih region endpoint yang ingin digunakan dari menu drop-down Region.

  3. Klik tombol Buat.

gcloud

Jalankan perintah berikut:

gcloud ai-platform models create MODEL_NAME \
  --region=REGION

Dalam perintah, ganti placeholder berikut:

  • MODEL_NAME: Nama yang Anda pilih untuk model Anda.
  • REGION: Region endpoint yang ingin Anda gunakan.

Python

Contoh ini menggunakan Library Klien Google API untuk Python. Sebelum dapat menggunakannya, Anda harus menginstal Library Klien Google API untuk Python dan menyiapkan autentikasi di lingkungan pengembangan Anda.

Jalankan kode Python berikut:

from google.api_core.client_options import ClientOptions
from googleapiclient import discovery

endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)

request_body = { 'name': 'MODEL_NAME' }
request = ml.projects().models().create(parent='projects/PROJECT_ID',
    body=request_body)

response = request.execute()
print(response)

Dalam kode, ganti placeholder berikut:

  • REGION: Region endpoint yang ingin Anda gunakan.
  • MODEL_NAME: Nama yang Anda pilih untuk model Anda.
  • PROJECT_ID: ID project Google Cloud Anda.

Pelajari lebih lanjut cara membuat model.

Membuat versi model

Contoh ini mengasumsikan bahwa Anda telah mengupload artefak model yang kompatibel ke Cloud Storage.

Konsol Google Cloud

Dengan menggunakan model yang Anda buat di bagian sebelumnya, ikuti panduan untuk membuat versi model di Konsol Google Cloud.

gcloud

Contoh ini mengasumsikan bahwa Anda telah mengupload artefak model yang kompatibel ke Cloud Storage. Jalankan perintah berikut:

gcloud ai-platform versions create VERSION_NAME \
  --region=REGION \
  --model=MODEL_NAME \
  --framework=FRAMEWORK \
  --machine-type=MACHINE_TYPE \
  --origin=MODEL_DIRECTORY \
  --python-version=3.7 \
  --runtime-version=2.11

Dalam perintah, ganti placeholder berikut:

  • REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
  • VERSION_NAME: Nama yang Anda pilih untuk versi Anda.
  • MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
  • FRAMEWORK: Framework yang digunakan untuk membuat artefak model.
  • MACHINE_TYPE: Jenis mesin Compute Engine (N1).
  • MODEL_DIRECTORY: URI Cloud Storage ke direktori model Anda (dimulai dengan "gs://").

Python

Jalankan kode Python berikut:

from google.api_core.client_options import ClientOptions
from googleapiclient import discovery

endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)

request_body = { 'name': 'VERSION_NAME',
    'deploymentUri': 'MODEL_DIRECTORY',
    'runtimeVersion': '2.11',
    'machineType': 'MACHINE_TYPE',
    'framework': 'FRAMEWORK',
    'pythonVersion': '3.7'}
request = ml.projects().models().versions().create(
    parent='projects/PROJECT_ID/models/MODEL_NAME',
    body=request_body)

response = request.execute()
print(response)

Dalam kode, ganti placeholder berikut:

  • REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
  • VERSION_NAME: Nama yang Anda pilih untuk versi Anda.
  • MODEL_DIRECTORY: URI Cloud Storage ke direktori model Anda (dimulai dengan "gs://").
  • MACHINE_TYPE: Jenis mesin Compute Engine (N1).
  • FRAMEWORK: Framework yang digunakan untuk membuat artefak model.
  • PROJECT_ID: ID project Google Cloud Anda.
  • MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.

Pelajari cara membuat versi model lebih lanjut.

Mengirim permintaan prediksi online

Konsol Google Cloud

  1. Di konsol Google Cloud, buka halaman Model:

    Buka halaman Models

  2. Di menu drop-down Region, pilih region endpoint yang digunakan model Anda. Klik nama model yang Anda buat di bagian sebelumnya untuk membuka halaman Model Details.

  3. Klik nama versi yang Anda buat di bagian sebelumnya untuk membuka halaman Version Details.

  4. Klik tab Uji & gunakan. Masukkan satu atau beberapa instance data input, lalu klik tombol Test untuk mengirim permintaan prediksi online.

gcloud

Contoh ini mengasumsikan bahwa Anda telah menyimpan input prediksi di file JSON yang dibatasi baris baru di lingkungan lokal. Jalankan perintah berikut:

gcloud ai-platform predict \
  --region=REGION \
  --model=MODEL_NAME \
  --version=VERSION_NAME \
  --json-request=INPUT_PATH

Dalam perintah, ganti placeholder berikut:

  • REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
  • MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
  • VERSION_NAME: Nama versi model yang Anda buat di bagian sebelumnya.
  • INPUT_PATH: Jalur di sistem file lokal Anda ke file JSON dengan input prediksi.

Python

Jalankan kode Python berikut:

from google.api_core.client_options import ClientOptions
from googleapiclient import discovery

endpoint = 'https://REGION-ml.googleapis.com'
client_options = ClientOptions(api_endpoint=endpoint)
ml = discovery.build('ml', 'v1', client_options=client_options)

request_body = { 'instances': INSTANCES }
request = ml.projects().predict(
    name='projects/PROJECT_ID/models/MODEL_NAME/VERSION_NAME',
    body=request_body)

response = request.execute()
print(response)

Dalam kode, ganti placeholder berikut:

  • REGION: Region endpoint yang Anda gunakan di bagian sebelumnya.
  • INSTANCES: Daftar instance input prediksi.
  • MODEL_NAME: Nama model yang Anda buat di bagian sebelumnya.
  • VERSION_NAME: Nama versi yang Anda buat di bagian sebelumnya.

Pelajari lebih lanjut cara mendapatkan prediksi online.

Langkah selanjutnya