Upgrade del cluster AI Platform Pipelines

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

AI Platform Pipelines riduce le difficoltà di configurazione di Kubeflow Pipelines con TensorFlow Extended su Google Kubernetes Engine. Per eseguire l'upgrade del cluster AI Platform Pipelines, devi rimuovere il cluster AI Platform Pipelines esistente e reinstallarlo utilizzando le stesse impostazioni di archiviazione. Questa guida descrive:

  • Come determinare il metodo di archiviazione utilizzato dal cluster.
  • come si raccolgono le informazioni necessarie per eseguire l'upgrade del cluster.
  • I passaggi necessari per eseguire l'upgrade del tuo cluster AI Platform Pipelines a una release più recente di Kubeflow Pipelines.

Preparazione all'upgrade del cluster in corso...

Il processo di upgrade del cluster di AI Platform Pipelines dipende dal metodo utilizzato dal cluster per archiviare gli artefatti e i metadati della pipeline. Utilizza le istruzioni seguenti per determinare dove il tuo cluster AI Platform Pipelines archivia artefatti e metadati della pipeline.

  1. Apri AI Platform Pipelines in Google Cloud Console.

    Vai ad AI Platform Pipelines

  2. Nella riga relativa al cluster AI Platform Pipelines, prendi nota dei valori delle colonne Name, Cluster, Zone e Namespace. Queste informazioni vengono utilizzate nei prossimi passaggi.

  3. Apri una sessione di Cloud Shell.

    Apri Cloud Shell

    Cloud Shell si apre in un frame nella parte inferiore della console di Google Cloud.

  4. Esegui questi comandi per configurare kubectl con accesso al tuo cluster GKE e imposta il contesto sullo spazio dei nomi in cui è stata installata Kubeflow Pipelines.

    gcloud container clusters get-credentials CLUSTER_NAME --zone=ZONE
    kubectl config set-context --current --namespace=NAMESPACE
    

    Sostituisci quanto segue:

    • CLUSTER_NAME: il nome del tuo cluster GKE, che hai annotato in un passaggio precedente.
    • ZONE: la zona in cui si trova il tuo cluster GKE, che hai annotato in un passaggio precedente.
    • NAMESPACE: lo spazio dei nomi in cui è stata installata kubeflow Pipelines, che hai annotato in un passaggio precedente.
  5. AI Platform Pipelines archivia gli artefatti e i metadati della pipeline del tuo cluster utilizzando i servizi di archiviazione gestiti o i dischi permanenti nel cluster. Quando esegui l'upgrade del cluster, devi reinstallare AI Platform Pipelines utilizzando le stesse impostazioni di archiviazione utilizzate dal tuo attuale cluster AI Platform Pipelines.

    Esegui il comando seguente in Cloud Shell per verificare se è stato eseguito il deployment del cluster con spazio di archiviazione sul cluster.

    kubectl get pvc -o json | jq -r '.items[].metadata.name'
    

    Questo comando elenca le richieste di volumi permanenti (PVC) del tuo cluster Google Kubernetes Engine.

Upgrade di un cluster AI Platform Pipelines che utilizza l'archiviazione gestita

Usa le istruzioni seguenti per eseguire il backup degli artefatti e dei metadati del cluster AI Platform Pipelines ed eseguire l'upgrade del cluster a una release più recente di Kubeflow Pipelines.

  1. Quando esegui l'upgrade di un cluster Kubeflow, devi riutilizzare la stessa configurazione di archiviazione. Se è stato eseguito il deployment del cluster con archiviazione gestita, segui le istruzioni seguenti per trovare i dettagli di configurazione richiesti per eseguire l'upgrade del cluster.

    1. Esegui il comando seguente in Cloud Shell per ottenere il nome del bucket in cui il cluster archivia gli artefatti della pipeline:

      kubectl get configmap workflow-controller-configmap -o json | \
      jq -r '.data.config | capture("bucket: '"'(?<name>.*?)'"'").name'
      
    2. Esegui il comando seguente in Cloud Shell per ottenere il nome di connessione istanza dell'istanza Cloud SQL in cui il cluster archivia i metadati della pipeline.

      kubectl get deployments cloudsqlproxy -o json | \
      jq -r '.spec.template.spec.containers[].command[] | capture("instances=(?<name>.*)=").name'
      
    3. Kubeflow Pipelines dipende da due database MySQL. Esegui il comando seguente in Cloud Shell per ottenere il prefisso del database dei database del cluster.

      kubectl get configmap metadata-mysql-configmap -o json | \
      jq -r '.data.MYSQL_DATABASE | capture("(?<prefix>.*?)_metadata").prefix'
      
    4. Devi anche specificare il nome utente e la password di un account MySQL con il privilegio ALL che Kubeflow Pipelines può utilizzare per connettersi all'istanza Cloud SQL. Se non sai quale account utente MySQL utilizza il tuo cluster, utilizza Cloud SQL per creare un utente MySQL.

      Scopri di più sugli utenti MySQL.

  2. Utilizza Cloud SQL per creare un backup dei cluster MySQL di AI Platform Pipelines.

  3. Apri AI Platform Pipelines in Google Cloud Console.

    Vai ad AI Platform Pipelines

  4. Segui le istruzioni riportate di seguito per eliminare il tuo cluster AI Platform Pipelines. Per eseguire l'upgrade del cluster AI Platform Pipelines, devi reinstallare Kubeflow Pipelines con le stesse impostazioni di archiviazione gestite.

    1. Seleziona la casella di controllo il tuo cluster AI Platform Pipelines.

    2. Nella barra degli strumenti di AI Platform Pipelines, fai clic su Delete (Elimina). Viene visualizzata la finestra di dialogo Elimina pipeline Dataflow dal cluster.

    3. Fai clic su Elimina. L'eliminazione del cluster di AI Platform Pipelines può richiedere diversi minuti.

  5. Segui queste istruzioni per reinstallare le pipeline di Kubeflow.

    1. Nella barra degli strumenti di AI Platform Pipelines, fai clic su Nuova istanza. Kubeflow Pipelines si apre in Google Cloud Marketplace.

    2. Fai clic su Configura. Si apre un modulo per configurare il deployment di Kubeflow Pipelines.

    3. Seleziona il cluster in cui eseguire il deployment delle pipeline di Kubeflow. Non è necessario che questo cluster sia lo stesso cluster GKE in cui hai eseguito il deployment dell'istanza di AI Platform Pipelines.

      Scopri come assicurarti che il cluster GKE sia configurato correttamente per AI Platform Pipelines.

    4. Nella casella Nome istanza app, inserisci il nome istanza dell'applicazione utilizzato dalla tua istanza Kubeflow Pipelines precedente.

    5. Gli spazi dei nomi vengono utilizzati per gestire le risorse in grandi cluster GKE. Se non prevedi di utilizzare gli spazi dei nomi nel cluster, seleziona predefinita nell'elenco a discesa Spazio dei nomi.

      Se prevedi di utilizzare gli spazi dei nomi nel tuo cluster GKE, crea uno spazio dei nomi utilizzando l'elenco a discesa Spazio dei nomi. Per creare uno spazio dei nomi:

      1. Seleziona Crea uno spazio dei nomi nell'elenco a discesa Spazio dei nomi. Viene visualizzata la casella Nome nuovo spazio dei nomi.

      2. Inserisci il nome dello spazio dei nomi in Nome dello spazio dei nomi.

      Per saperne di più sugli spazi dei nomi, leggi un post del blog sull'organizzazione di Kubernetes con gli spazi dei nomi.

    6. L'archiviazione gestita consente di archiviare i metadati e gli artefatti della pipeline ML utilizzando Cloud SQL e Cloud Storage. Seleziona Utilizza archiviazione gestita e fornisci le seguenti informazioni:

      • Bucket Cloud Storage di archiviazione degli artefatti: specifica il nome del bucket trovato in un passaggio precedente.

      • Nome connessione istanza Cloud SQL: specifica il nome connessione dell'istanza che hai trovato in un passaggio precedente.

      • Nome utente del database: specifica il nome utente del database per le pipeline Kubeflow da utilizzare durante la connessione all'istanza MySQL. Attualmente, l'utente del database deve disporre dei privilegi di MySQL ALL per il deployment delle pipeline Kubeflow con archiviazione gestita. Se lasci questo campo vuoto, il valore predefinito è root.

        Scopri di più sugli utenti MySQL.

      • Password del database: specifica la password del database per le pipeline Kubeflow da utilizzare durante la connessione all'istanza MySQL. Se lasci vuoto questo campo, Kubeflow Pipelines si connette al tuo database senza fornire una password. Se la password è obbligatoria per il nome utente specificato, la richiesta non va a buon fine.

      • Prefisso del nome del database: specifica il prefisso del nome del database che hai trovato in un passaggio precedente.

    7. Fai clic su Esegui il deployment. Questo passaggio potrebbe richiedere diversi minuti.

    8. Per accedere alla dashboard delle pipeline, apri AI Platform Pipelines in Google Cloud Console.

      Vai ad AI Platform Pipelines

      Fai clic su Apri dashboard delle pipeline per l'istanza di AI Platform Pipelines.

Upgrade di un cluster AI Platform Pipelines che utilizza l'archiviazione su cluster

Usa le istruzioni seguenti per eseguire il backup degli artefatti e dei metadati del cluster AI Platform Pipelines ed eseguire l'upgrade del cluster a una release più recente di Kubeflow Pipelines.

  1. Esegui il backup dei metadati e dell'archiviazione degli artefatti del cluster AI Platform Pipelines. Con l'archiviazione on-cluster, gli artefatti e i metadati della pipeline vengono archiviati su dischi permanenti di Compute Engine, che sono collegati al cluster GKE come richieste di volumi permanenti.

    1. Per eseguire questa operazione, devi disporre delle seguenti autorizzazioni:

      • compute.disks.create nel progetto
      • compute.disks.useReadOnly sul disco di origine

      Ad esempio, il ruolo roles/compute.storageAdmin fornisce queste autorizzazioni. Scopri di più sulla concessione delle autorizzazioni e dei ruoli di Identity and Access Management.

    2. Esegui il comando seguente in Cloud Shell per elencare le PVC del cluster e, se appropriato, il nome del disco permanente di PVC di PVC.

      kubectl get pv -o json | \
      jq -r '.items[] | .spec.claimRef.name + " -  disk name = " + .spec.gcePersistentDisk.pdName'
      

      Se il tuo cluster utilizza spazio di archiviazione sul cluster, questo elenco deve contenere nomi di dischi permanenti per i PVC mysql-pv-claim e minio-pvc.

    3. Per effettuare il backup degli artefatti e dei metadati della pipeline, esegui il comando seguente in Cloud Shell per i dischi permanenti mysql-pv-claim e minio-pvc.

      gcloud compute disks create target-disk-name --zone=ZONE --source-disk=source-disk-name
      

      Sostituisci quanto segue:

      • target-disk-name: specifica un nome per il disco di backup.
      • ZONE: specifica la zona in cui risiede il tuo cluster.
      • source-disk-name: specifica il nome del disco permanente di cui vuoi eseguire il backup.

      Scopri di più sulla clonazione dei dischi permanenti.

  2. Apri AI Platform Pipelines in Google Cloud Console.

    Vai ad AI Platform Pipelines

  3. Segui le istruzioni riportate di seguito per eliminare il tuo cluster AI Platform Pipelines, senza eliminare il tuo cluster GKE. Per eseguire l'upgrade del tuo cluster AI Platform Pipelines, devi reinstallare Kubeflow Pipelines sullo stesso cluster GKE.

    1. Seleziona la casella di controllo il tuo cluster AI Platform Pipelines.

    2. Nella barra degli strumenti di AI Platform Pipelines, fai clic su Delete (Elimina). Viene visualizzata la finestra di dialogo Elimina pipeline Dataflow dal cluster.

    3. Fai clic su Elimina. L'eliminazione del cluster di AI Platform Pipelines può richiedere diversi minuti.

  4. Segui le istruzioni riportate di seguito per reinstallare le pipeline Kubeflow nel cluster GKE esistente.

    1. Nella barra degli strumenti di AI Platform Pipelines, fai clic su Nuova istanza. Kubeflow Pipelines si apre in Google Cloud Marketplace.

    2. Fai clic su Configura. Si apre un modulo per configurare il deployment di Kubeflow Pipelines.

    3. Nell'elenco a discesa Cluster, seleziona il cluster in cui è stata eseguita il deployment dell'istanza precedente di Kubeflow Pipelines.

    4. Seleziona lo spazio dei nomi in cui è stato eseguito il deployment dell'istanza precedente di Kubeflow Pipelines.

    5. Nella casella Nome istanza app, inserisci il nome istanza dell'applicazione utilizzato dalla tua istanza Kubeflow Pipelines precedente.

    6. Fai clic su Esegui il deployment. Questo passaggio potrebbe richiedere diversi minuti.

    7. Per accedere alla dashboard delle pipeline, apri AI Platform Pipelines in Google Cloud Console.

      Vai ad AI Platform Pipelines

      Fai clic su Apri dashboard delle pipeline per l'istanza di AI Platform Pipelines.

Passaggi successivi