Sebagai bagian dari serangkaian teknologi yang berkontribusi pada solusi machine learning, Pelatihan AI Platform memerlukan lingkungan pengembangan dengan prasyarat dan dependensi yang dikonfigurasi dengan cermat. Halaman ini menjelaskan bagian-bagian yang membentuk lingkungan pengembangan Anda dan masalah yang menyertainya.
Dukungan versi Python
AI Platform Training dapat menjalankan Python 2.7 atau Python 3. Anda dapat menetapkan versi Python untuk tugas pelatihan dalam file konfigurasi atau dengan perintah gcloud.
Prediksi online dan batch berfungsi dengan model terlatih, terlepas dari apakah model tersebut dilatih menggunakan Python 2 atau Python 3.
Jika perlu memindahkan kode antara Python 2 dan Python 3, Anda dapat menggunakan library kompatibilitas seperti six untuk membantu. Enam di antaranya disertakan dalam image runtime Pelatihan AI Platform secara default.
Akses root
Jika mengonfigurasi lingkungan pengembangan dasar, Anda mungkin perlu menggunakan
sudo
untuk menjalankan penginstalan pip
di macOS atau Linux. Namun, jika menggunakan
lingkungan virtual, Anda tidak memerlukan akses root, karena penginstalan terjadi
di luar direktori sistem yang dilindungi OS.
Lingkungan runtime
Konfigurasi virtual machine yang menjalankan project Google Cloud di cloud ditentukan oleh versi runtime yang Anda gunakan.
Lingkungan virtual Python
Konfigurasi Python dapat menjadi rumit, terutama jika Anda mengembangkan aplikasi Python lain menggunakan teknologi yang berbeda di komputer yang sama. Anda dapat menyederhanakan pengelolaan paket dan versi dengan menggunakan lingkungan virtual untuk melakukan pengembangan Python.
Lingkungan virtual Python mengelola penafsir dan paket Python yang diisolasi dari lingkungan default komputer dan didedikasikan untuk project Anda. Anda dapat menggunakan lingkungan virtual untuk mengonfigurasi lingkungan terpisah untuk setiap project Python yang Anda kerjakan, masing-masing dengan versi Python-nya sendiri dan modul yang Anda perlukan.
Ada beberapa opsi untuk lingkungan Python virtual. Sebaiknya gunakan Anaconda (atau versi yang lebih kecil Miniconda). Ini termasuk pengelola lingkungan virtualnya sendiri yang disebut Conda. Anaconda adalah rangkaian paket dan alat populer yang biasa digunakan oleh ilmuwan data.
Framework machine learning
AI Platform Training dan AI Platform Prediction mendukung framework berikut:
- TensorFlow untuk pelatihan, prediksi online, dan prediksi batch. Lihat panduan untuk pelatihan dan prediksi dengan TensorFlow Estimator di AI Platform.
- scikit-learn dan XGBoost untuk pelatihan dan prediksi online. Lihat tutorial tentang menggunakan scikit-learn dan XGBoost dengan Pelatihan AI Platform.
Akun Google Cloud Platform
Anda harus memiliki akun Google Cloud dengan penagihan diaktifkan dan project dengan AI Platform Training dan Prediction API diaktifkan untuk menggunakan salah satu fungsi cloud AI Platform Training. Jika Anda baru menggunakan Google Cloud, baca ringkasan project untuk mengetahui informasi selengkapnya.
Region Cloud Compute
Resource pemrosesan dialokasikan menurut region dan zona, yang sesuai dengan pusat data tempat resource berada secara fisik. Anda biasanya harus menjalankan tugas satu kali, seperti pelatihan model, di region yang paling dekat dengan lokasi fisik Anda (atau lokasi fisik pengguna yang dituju), tetapi perhatikan poin berikut:
Perhatikan region yang tersedia untuk layanan AI Platform Training, termasuk pelatihan model di GPU dan hardware lainnya, serta prediksi online/batch.
Anda harus selalu menjalankan tugas AI Platform Training di region yang sama dengan bucket Cloud Storage yang Anda gunakan untuk membaca dan menulis data untuk tugas tersebut.
Anda harus menggunakan class Penyimpanan Standar untuk bucket Cloud Storage yang Anda gunakan untuk membaca dan menulis data untuk tugas Pelatihan AI Platform.
Langkah selanjutnya
- Pelajari panduan memulai untuk TensorFlow Estimator di Pelatihan AI Platform.
- Ikuti panduan memulai cepat untuk scikit-learn dan XGBoost di Pelatihan AI Platform.