Creazione di una pipeline di machine learning

Prima di poter eseguire il processo di machine learning (ML) su AI Platform Pipelines, devi prima definirlo come pipeline. Puoi orchestrare il tuo processo di ML come pipeline utilizzando TensorFlow Extended (TFX) o l'SDK Kubeflow Pipelines.

Questo documento fornisce indicazioni per scegliere l'opzione migliore per creare la pipeline e risorse per iniziare.

Creazione di pipeline utilizzando l'SDK TFX

TFX è un progetto open source che puoi utilizzare per definire il tuo flusso di lavoro di ML come una pipeline. Al momento, i componenti TFX possono solo addestrare modelli basati su TensorFlow. TFX fornisce componenti che puoi utilizzare per importare e trasformare i dati, addestrare e valutare un modello, eseguire il deployment di un modello addestrato per l'inferenza e così via. Con l'SDK TFX, puoi comporre una pipeline per il tuo processo di ML dai componenti TFX.

Per iniziare a creare pipeline con i modelli di pipeline TFX:

Creazione di pipeline utilizzando l'SDK Kubeflow Pipelines

L'SDK Kubeflow Pipelines è un SDK open source che puoi utilizzare per creare complesse pipeline ML personalizzate basate su container. Puoi riutilizzare i componenti predefiniti o creare componenti della pipeline personalizzati utilizzando l'SDK Kubeflow Pipelines. A livello generale, puoi creare componenti e pipeline:

  1. Sviluppo del codice per ogni passaggio del flusso di lavoro utilizzando il linguaggio e gli strumenti che preferisci
  2. Creazione di un'immagine container Docker per il codice di ogni passaggio
  3. Utilizzare Python per definire la pipeline utilizzando l'SDK Kubeflow Pipelines

Per iniziare a creare pipeline con l'SDK Kubeflow Pipelines:

Passaggi successivi