Sebagai bagian dari serangkaian teknologi yang berkontribusi pada solusi machine learning, Pelatihan AI Platform memerlukan lingkungan pengembangan dengan prasyarat dan dependensi yang dikonfigurasi dengan cermat. Halaman ini menjelaskan bagian-bagian yang membentuk lingkungan pengembangan Anda dan masalah yang menyertainya.
Dukungan versi Python
Pelatihan AI Platform dapat menjalankan Python 2.7 atau Python 3. Anda dapat menetapkan versi Python untuk tugas pelatihan di file konfigurasi atau dengan perintah gcloud.
Prediksi online dan batch berfungsi dengan model terlatih, terlepas dari apakah model dilatih menggunakan Python 2 atau Python 3.
Jika perlu mentransfer kode antara Python 2 dan Python 3, Anda dapat menggunakan library kompatibilitas seperti six untuk membantu. Enam disertakan dalam gambar runtime Pelatihan AI Platform secara default.
Akses root
Jika mengonfigurasi lingkungan pengembangan dasar, Anda mungkin perlu menggunakan
sudo
untuk menjalankan penginstalan pip
di macOS atau Linux. Namun, jika menggunakan lingkungan virtual, Anda tidak memerlukan akses root karena penginstalan terjadi di luar direktori sistem yang dilindungi OS.
Lingkungan runtime
Konfigurasi mesin virtual yang menjalankan project Google Cloud di cloud ditentukan oleh versi runtime yang Anda gunakan.
Lingkungan virtual Python
Konfigurasi Python bisa jadi rumit, terutama jika Anda mengembangkan aplikasi Python lain menggunakan teknologi yang berbeda di komputer yang sama. Anda dapat menyederhanakan pengelolaan paket dan versi dengan menggunakan lingkungan virtual untuk melakukan pengembangan Python.
Lingkungan virtual Python mengelola penafsir dan paket Python yang diisolasi dari lingkungan default komputer dan dikhususkan untuk project Anda. Anda dapat menggunakan lingkungan virtual untuk mengonfigurasi lingkungan terpisah bagi setiap project Python yang Anda kerjakan, masing-masing dengan versi Python-nya sendiri dan modul yang Anda butuhkan.
Ada beberapa opsi untuk lingkungan Python virtual. Sebaiknya gunakan Anaconda (atau versi yang lebih kecil Miniconda). Desainer tersebut termasuk pengelola lingkungan virtual mereka sendiri, yang disebut Conda. Anaconda adalah paket dan alat populer yang biasa digunakan oleh ilmuwan data.
Framework machine learning
AI Platform Training dan AI Platform Prediction mendukung framework berikut:
- TensorFlow untuk pelatihan, prediksi online, dan prediksi batch. Lihat panduan untuk pelatihan dan prediksi dengan TensorFlow Estimator di AI Platform.
- scikit-learn dan XGBoost untuk pelatihan dan prediksi online. Lihat tutorial tentang cara menggunakan scikit-learn dan XGBoost dengan AI Platform Training.
Akun Google Cloud Platform
Anda harus memiliki akun Google Cloud dengan penagihan yang diaktifkan dan project dengan AI Platform Training and Prediction API yang diaktifkan untuk menggunakan semua fungsionalitas cloud dari Pelatihan AI Platform. Jika Anda baru menggunakan Google Cloud, baca ringkasan project untuk mengetahui informasi lebih lanjut.
Region Cloud Compute
Resource pemrosesan dialokasikan berdasarkan region dan zona, yang sesuai dengan pusat data tempat resource berada secara fisik. Biasanya, Anda harus menjalankan tugas satu kali, seperti pelatihan model, di region yang paling dekat dengan lokasi fisik Anda (atau lokasi fisik pengguna yang dituju), tetapi perhatikan hal-hal berikut:
Perhatikan region yang tersedia untuk layanan Pelatihan AI Platform, termasuk pelatihan model pada GPU dan hardware lainnya, serta prediksi online/batch.
Anda harus selalu menjalankan tugas Pelatihan AI Platform di region yang sama dengan bucket Cloud Storage yang Anda gunakan untuk membaca dan menulis data untuk tugas tersebut.
Anda harus menggunakan class Standard Storage untuk bucket Cloud Storage yang digunakan guna membaca dan menulis data untuk tugas Pelatihan AI Platform.
Langkah selanjutnya
- Pelajari panduan memulai untuk TensorFlow Estimator pada Pelatihan AI Platform.
- Pelajari panduan memulai untuk scikit-learn dan XGBoost di Pelatihan AI Platform.