Come parte di un insieme di tecnologie che contribuiscono a una soluzione di machine learning, AI Platform Training richiede un ambiente di sviluppo con prerequisiti e dipendenze accuratamente configurati. In questa pagina vengono descritti gli elementi che compongono l'ambiente di sviluppo e i relativi problemi.
Supporto della versione Python
AI Platform Training può eseguire Python 2.7 o Python 3. Puoi impostare la versione Python per i job di addestramento in un file di configurazione o con i comandi gcloud.
Le previsioni online e batch funzionano con i modelli addestrati, indipendentemente dal fatto che siano stati addestrati utilizzando Python 2 o Python 3.
Se devi trasferire il tuo codice tra Python 2 e Python 3, puoi utilizzare librerie di compatibilità come six. Sei sono incluse nelle immagini di runtime di AI Platform Training per impostazione predefinita.
Accesso root
Se stai configurando l'ambiente di sviluppo di base, potresti dover utilizzare sudo
per eseguire l'installazione di pip
su macOS o Linux. Tuttavia, se utilizzi un ambiente virtuale, non avrai bisogno dell'accesso root, perché l'installazione avviene al di fuori delle directory di sistema protette dal sistema operativo.
Ambiente di runtime
La configurazione delle macchine virtuali che eseguono il progetto Google Cloud nel cloud è definita dalla versione di runtime che utilizzi.
Ambienti virtuali Python
La configurazione Python può essere complicata, soprattutto se sviluppi altre applicazioni Python utilizzando tecnologie diverse sullo stesso computer. Puoi semplificare la gestione dei pacchetti e delle versioni utilizzando un ambiente virtuale per lo sviluppo in Python.
Un ambiente virtuale Python gestisce un interprete Python e pacchetti isolati dall'ambiente predefinito del computer e dedicati al tuo progetto. Puoi utilizzare gli ambienti virtuali per configurare ambienti separati per ciascun progetto Python su cui lavori, ciascuno con la propria versione di Python e i moduli di cui hai bisogno.
Esistono diverse opzioni per gli ambienti Python virtuali. Ti consigliamo Anaconda (o la versione più piccola Miniconda). tra cui il proprio gestore dell'ambiente virtuale chiamato Conda. Anaconda è una suite di pacchetti e strumenti molto utilizzata dai data scientist.
Framework di machine learning
AI Platform Training e AI Platform Prediction supportano i seguenti framework:
- TensorFlow per l'addestramento, la previsione online e la previsione batch. Consulta la guida per addestramento e previsione con TensorFlow Estimator su AI Platform.
- scikit-learn e XGBoost per l'addestramento e la previsione online. Consulta i tutorial sull'utilizzo di scikit-learn e XGBoost con AI Platform Training.
Account Google Cloud Platform
Per utilizzare le funzionalità cloud di AI Platform Training, devi avere un account Google Cloud con fatturazione abilitata e un progetto con l'API AI Platform Training and Prediction abilitata. Se non hai mai utilizzato Google Cloud, leggi la panoramica dei progetti per ulteriori informazioni.
Regioni di Cloud Compute
Le risorse di elaborazione sono allocate per regione e zona, che corrispondono ai data center in cui si trovano fisicamente le risorse. In genere, dovresti eseguire job una tantum, come l'addestramento di un modello, nella regione più vicina alla tua posizione fisica (o alla località fisica degli utenti previsti), ma tieni presente quanto segue:
Prendi nota delle regioni disponibili per i servizi di AI Platform Training, tra cui l'addestramento dei modelli su GPU e altro hardware e la previsione online/batch.
Devi sempre eseguire i job di AI Platform Training nella stessa regione del bucket Cloud Storage che utilizzi per leggere e scrivere i dati per il job.
Devi utilizzare la classe Standard Storage per tutti i bucket Cloud Storage che usi per leggere e scrivere dati per il job di AI Platform Training.
Passaggi successivi
- Consulta la guida introduttiva di TensorFlow Estimator su AI Platform Training.
- Leggi la guida rapida per scikit-learn e XGBoost su AI Platform Training.