Actualiza Knative serving en VMware a flotas

Aprende a migrar Knative serving en VMware para usar flotas a fin de actualizar a Anthos versión 1.8.

Knative serving ahora es una experiencia independiente del producto administrado Cloud Run y ahora se proporciona como un componente de flota en tus clústeres. Instalar funciones de Knative serving en VMware como componente de tu flota te permite administrar y actualizar tu instalación independientemente de otros componentes de la flota.

En un nivel alto, si quieres migrar tu instalación de Knative serving en VMware para usar una flota, debes hacer lo siguiente:

  • Configura la instalación de Knative serving en VMware para cumplir con los requisitos de la flota.
  • Habilita el componente de la función Knative serving en tu flota.

Ten en cuenta que el servidor de la API de Kubernetes no se verá afectado durante esta migración.

Si deseas obtener detalles sobre cómo realizar una instalación nueva de Knative serving en VMware, consulta Instala Knative serving en VMware.

Antes de comenzar

Debes cumplir con los siguientes requisitos:

  • Estos pasos requieren que tu clúster de Knative serving en VMware esté registrado en una flota y sea visible en la consola de Google Cloud:

    Ir a los clústeres de GKE

  • La instalación de Knative serving en VMware se encuentra en un clúster que ejecuta Anthos versión 1.7 o anterior.

  • Istio ya no es compatible con Anthos 1.8. La versión 1.18 de Cloud Service Mesh debe estar instalada en tu flota y la instalación de Knative serving debe estar configurada antes de actualizar ese clúster a la versión 1.8.

    Consulta las instrucciones de la malla de servicios de Cloud para obtener detalles sobre la instalación en Google Distributed Cloud.

    Ten en cuenta que Cloud Service Mesh requiere que el clúster use un tipo de máquina que tenga al menos cuatro CPU virtuales, como e2-standard-4. Si necesitas cambiar el tipo de máquina del clúster, consulta la sección sobre cómo migrar cargas de trabajo a diferentes tipos de máquina.

  • Existen dos opciones para migrar Knative serving a Cloud Service Mesh. Puedes hacer lo siguiente:

    • Obtén una nueva dirección IP externa en la que configurarás el balanceador de cargas.

    • Vuelve a usar la dirección IP del balanceador de cargas existente.

  • Asegúrate de que el entorno de la línea de comandos esté configurado y actualizado.

Migra a flotas

Si quieres actualizar Anthos a la versión 1.8, primero debes realizar los siguientes pasos para asegurarte de que tu instalación existente de Knative serving en VMware migre al componente de la flota.

Accede a tu clúster de administrador

Obtén la ruta de acceso y el nombre del archivo kubeconfig del clúster de administrador y, luego, crea la variable de entorno ADMIN_KUBECONFIG:

export ADMIN_KUBECONFIG=[ADMIN_CLUSTER_KUBECONFIG]

Reemplaza [ADMIN_CLUSTER_KUBECONFIG] por la ruta de acceso y el nombre del archivo por el archivo kubeconfig del clúster de administrador.

Configura cada clúster de usuario

  1. Crea las siguientes variables de entorno local para el clúster de usuario:

    1. Crea la variable de entorno USER_KUBECONFIG con la ruta de acceso del archivo kubeconfig del clúster de usuario:

      export USER_KUBECONFIG=[USER_CLUSTER_KUBECONFIG]
      

      Reemplaza [USER_CLUSTER_KUBECONFIG] por la ruta de acceso y el nombre del archivo por el archivo kubeconfig del clúster de usuario.

    2. Crea variables de entorno para los siguientes parámetros de configuración:

      • ID de tu proyecto de Google Cloud.
      • Ubicación de tus recursos de Google Cloud.
      • Nombre del clúster de usuario.
      export PROJECT_ID=$(kubectl get configmaps --namespace knative-serving config-observability --output jsonpath="{.data['metrics\.stackdriver-project-id']}")
      export CLUSTER_LOCATION=$(kubectl get configmaps --namespace knative-serving config-observability --output jsonpath="{.data['metrics\.stackdriver-gcp-location']}")
      export CLUSTER_NAME=$(kubectl get configmaps --namespace knative-serving config-observability --output jsonpath="{.data['metrics\.stackdriver-cluster-name']}")
      
  2. Quita la configuración cloudrun del recurso personalizado OnPremUserCluster del clúster de usuario:

    1. Verifica que cloudRun esté configurado en OnPremUserCluster:

      $ kubectl get onpremusercluster \
        "${CLUSTER_NAME}" \
        --namespace "${CLUSTER_NAME}-gke-onprem-mgmt" \
        --kubeconfig="${ADMIN_KUBECONFIG}" \
        --output=jsonpath="{.spec.cloudRun}"
      

      Resultado:

      {"enabled":true}
      
    2. Quita cloudRun de OnPremUserCluster:

      kubectl patch onpremusercluster \
        "${CLUSTER_NAME}" \
        --namespace "${CLUSTER_NAME}-gke-onprem-mgmt" \
        --kubeconfig="${ADMIN_KUBECONFIG}" \
        --type="merge" \
        --patch '{"spec": {"cloudRun": null}}'
      
    3. Para validar que cloudRun se haya quitado de OnPremUserCluster de forma correcta, ejecuta el mismo comando de get y verifica que no se muestre ninguna configuración:

      kubectl get onpremusercluster \
        "${CLUSTER_NAME}" \
        --namespace "${CLUSTER_NAME}-gke-onprem-mgmt" \
        --kubeconfig="${ADMIN_KUBECONFIG}" \
        --output=jsonpath="{.spec.cloudRun}"
      

      No debería haber ningún resultado en tu terminal.

  3. Actualiza el secreto create-config del clúster de usuario:

    1. Crea una copia YAML local del archivo create-config:

      kubectl get secret create-config \
        --kubeconfig="${ADMIN_KUBECONFIG}" \
        --namespace "${CLUSTER_NAME}" \
        --output=jsonpath={.data.cfg} \
        | base64 -d > "${CLUSTER_NAME}_create_secret.yaml"
      
    2. Abre el archivo ${CLUSTER_NAME}_create_secret.yaml que acabas de crear en un editor y, luego, quita el campo cloudrun de spec.

    3. Codifica en Base64 el archivo ${CLUSTER_NAME}_cluster_create_secret.yaml en un archivo .b64:

      cat "${CLUSTER_NAME}_create_secret.yaml" | base64 -w0 > "${CLUSTER_NAME}_create_secret.b64"
      
    4. En el editor, abre el archivo .b64 local que acabas de crear y, luego, copia la string desde el atributo data.cfg para usarla en el siguiente paso.

      Debes asegurarte de copiar solo el contenido del atributo cfg. Por ejemplo, no incluyas saltos de línea (\n).

    5. Ejecuta el siguiente comando para editar el secreto en el clúster de usuario:

      kubectl edit secret create-config --kubeconfig="${ADMIN_KUBECONFIG}" \
        --namespace "${CLUSTER_NAME}"
      
    6. En el editor que se abre, reemplaza el campo data[cfg] por la string que copiaste del archivo .b64 local y, luego, guarda los cambios.

    7. Verifica que los cambios se hayan implementado en el clúster de usuario y que el atributo cloudrun se haya quitado de forma correcta de los secretos create-config:

      kubectl get secret create-config \
        --kubeconfig="${ADMIN_KUBECONFIG}" \
        --namespace ${CLUSTER_NAME} \
        --output=jsonpath={.data.cfg} \
        | base64 -d
      
  4. Configura el espacio de nombres knative-serving en el clúster de usuario:

    1. Borra el operador cloudrun-operator del espacio de nombres knative-serving:

      kubectl delete deployments.apps --kubeconfig=${USER_KUBECONFIG} --namespace knative-serving cloudrun-operator
      
    2. Aplica un parche al configmap config-network en el espacio de nombres knative-serving:

      kubectl patch configmap --kubeconfig=${USER_KUBECONFIG} --namespace knative-serving config-network --patch '{"metadata": {"annotations":{"knative.dev/example-checksum": null}}}'
      
  5. Quita la configuración cloudrun.enabled del archivo de configuración user-config.yaml del clúster de usuario de tu instalación de Google Distributed Cloud.

    Los siguientes atributos deben borrarse del archivo user-config.yaml:

    cloudRun:
      enabled: true
    

    Cuando realizas la actualización del clúster a la versión 1.8 de Anthos, se implementa este cambio de configuración.

  6. Si tienes varios clústeres de usuario, debes repetir todos los pasos de esta sección, “Configura cada clúster de usuario”, para cada uno de ellos.

Configura el componente de tu flota

  1. Habilita el componente de Knative serving en tu flota:

    gcloud container fleet cloudrun enable --project=$PROJECT_ID
    

    Para obtener detalles y opciones adicionales, consulta la referencia de gcloud container fleet cloudrun enable.

  2. Opcional: Verifica que el componente de la función Knative serving esté habilitado:

    Console

    Consulta si el componente de Knative serving está Habilitado en la consola de Google Cloud:

    Ir a Administrador de funciones

    Línea de comandos

    Comprueba si el estado appdevexperience es ENABLED:

    gcloud container fleet features list --project=$PROJECT_ID
    

    Para obtener detalles y opciones adicionales, consulta la referencia de gcloud container fleet features list.

    Resultado:

    NAME               STATE
    appdevexperience   ENABLED
    
  3. Implementa el recurso personalizado CloudRun para instalar Knative serving en VMware en cada uno de tus clústeres de usuario. De forma predeterminada, se implementa la versión latest de Knative serving.

    Ejecuta el siguiente comando de kubectl apply para implementar la configuración predeterminada de los recursos personalizados de CloudRun:

    cat <<EOF | kubectl apply -f -
    apiVersion: operator.run.cloud.google.com/v1alpha1
    kind: CloudRun
    metadata:
      name: cloud-run
    spec:
      metricscollector:
        stackdriver:
          projectid: $PROJECT_ID
          gcpzone: $CLUSTER_LOCATION
          clustername: $CLUSTER_NAME
          secretname: "stackdriver-service-account-key"
          secretkey: "key.json"
    EOF
    

Configura Cloud Service Mesh

Configurar el balanceador de cargas de la malla de servicios de Cloud para cada uno de los clústeres de usuario

Para configurar la puerta de enlace de entrada de Cloud Service Mesh, configura una dirección IP externa nueva o reutiliza la dirección IP existente:

  • Con la dirección IP externa nueva que obtuviste, sigue los pasos en la documentación de Cloud Service Mesh para configurar el balanceador de cargas.

    Ten en cuenta que esta opción garantiza que los servicios de Knative serving se reinicien sin interrupciones.

  • Alternativa: Usa los siguientes pasos para configurar el balanceador de cargas de la malla de servicios de Cloud en tu dirección IP existente.

    1. Configura la puerta de enlace de tus servicios en Cloud Service Mesh mediante la ejecución de los siguientes comandos:

      export CURRENT_INGRESS_IP=$(kubectl get service --namespace gke-system istio-ingress --output jsonpath='{.spec.loadBalancerIP}')
      kubectl patch service --namespace istio-system istio-ingressgateway --patch "{\"spec\":{\"loadBalancerIP\": \"$CURRENT_INGRESS_IP\"}}"
      kubectl patch service --namespace gke-system istio-ingress --patch "{\"spec\":{\"loadBalancerIP\": null}}"
      
    2. Quita la configuración actual de Istio:

      kubectl patch configmap --namespace knative-serving config-istio --patch '{"data":{"local-gateway.cluster-local-gateway": null}}'
      kubectl patch configmap --namespace knative-serving config-istio --patch '{"data":{"gateway.gke-system-gateway": null}}'
      

Verifica la migración

Puedes comprobar si appdevexperience-operator está en funcionamiento para verificar que Knative serving en VMware se migró de forma correcta a tu flota.

Para cada clúster de usuario, ejecuta el siguiente comando:

 kubectl get deployment -n appdevexperience appdevexperience-operator

El operador appdevexperience-operator debe mostrar 1/1 como listo, por ejemplo:

 NAME                        READY   UP-TO-DATE   AVAILABLE   AGE
 appdevexperience-operator   1/1     1            1           1h

Si el operador no logra alcanzar el estado de listo, puedes ver la página de cargas de trabajo de tu clúster en la consola de Google Cloud para identificar los problemas de recursos:

Ir a Cargas de trabajo de Google Kubernetes Engine

Actualiza tu clúster

Ahora que migraste la instalación de Knative serving en VMware para usar el componente de flota, puedes actualizar tu clúster a la versión 1.8 de Anthos. Sigue las instrucciones detalladas en Actualiza GKE On-Prem.

Soluciona problemas

No se puede completar el proceso de actualización del clúster de usuario

El Pod cluster-local-gateway en el espacio de nombres gke-system puede impedir que el clúster de usuario complete la actualización a la versión 1.8 de Anthos. El Pod cluster-local-gateway ya no es necesario y se puede quitar de forma segura.

A fin de asistir de manualmente con el proceso de actualización, puedes quitar el Pod cluster-local-gateway de forma manual reduciendo la escala vertical de tus réplicas de implementación a 0. Por ejemplo:

  1. Reduce verticalmente la escala de cluster-local-gateway:

    kubectl scale deployment cluster-local-gateway --replicas 0 --namespace gke-system
    

    Se quitan el Pod cluster-local-gateway en el espacio de nombres gke-system y todas las cargas de trabajo en el espacio de nombres knative-serving.

  2. Espera a que se complete el proceso de actualización.

Obtén más información sobre el escalamiento de implementaciones.