Compatibilidad

Acceder a las notificaciones de software

Consulta las siguientes herramientas para recibir notificaciones cuando aparezca un problema en los componentes de software de tu plataforma:

  • El panel de control de software común: para recibir notificaciones sobre el estado del sistema, como componentes, clústeres, servicios y máquinas virtuales de GKE Enterprise.
  • Tu buzón: para recibir notificaciones por correo electrónico que incluyan información básica sobre el problema, como códigos de error.

Haz clic en una notificación para ver la página del componente problemático y acceder a los registros correspondientes.

Configurar los destinatarios de las notificaciones

Configura los siguientes canales de comunicación para recibir alertas, aunque estén desconectados del panel de control:

  • Mensajes SMS
  • Notificaciones por correo electrónico
  • PagerDuty

Organiza el tipo de notificación y el rol del destinatario, como facturación, software y hardware.

Información sobre los errores de software

Sigue estas prácticas para acceder a la información pertinente sobre los errores de los componentes de software, resolver el problema y comunicarte con el equipo de Asistencia de forma eficaz:

  • Busca el código de error de cada error.
  • Usa los códigos de error para buscar en la documentación local y online.
  • La interfaz de usuario proporciona fragmentos de información sobre errores concretos. Coloca el puntero sobre un código de error para ver los fragmentos.

Borrar los datos sensibles de la información para solucionar problemas de software

Anonimiza la información para solucionar problemas de los componentes de software, incluidas las configuraciones, los registros, el estado y las métricas de todos los datos sensibles, y cumple los requisitos de soberanía.

Google Distributed Cloud (GDC) con air gap proporciona una lista de palabras clave sensibles predeterminadas para ofuscar y eliminar. Sigue estos pasos para anonimizar la información de solución de problemas:

  1. Personaliza la lista predeterminada añadiendo y quitando palabras clave personalizadas.
  2. Recibir un informe de todas las ocurrencias ofuscadas.
  3. Recibir advertencias sobre la posible información sensible restante.

Entre los elementos críticos que se deben ofuscar se incluyen los siguientes:

  • Nombres de dominio completos (FQDNs)
  • Direcciones IP
  • Nombres de usuario
  • Nombres de host
  • Nombres de cargas de trabajo
  • Hashes
  • Certificados
  • Nombres de clientes

Crear una captura de un sistema de software

Crea una instantánea de tus componentes de software para empaquetar toda la información necesaria para solucionar el problema y comunicarte con el equipo de Asistencia de forma eficaz:

  1. Selecciona los componentes que quieras incluir.
  2. Genera un archivo tar con todas las configuraciones, los registros, el estado y las métricas necesarios.
  3. Especifica el componente que quieres depurar.
  4. Especifica cómo se deben anonimizar los datos.

Compartir información con el equipo de Asistencia

Google ofrece asistencia de nivel 1 (L1) y de nivel 2 (L2) para GDC.

Aplicar políticas al compartir capturas

Sigue estas prácticas para asegurarte de que los datos de la copia de seguridad que compartes con el equipo de Asistencia sean seguros, estén protegidos y estén sujetos a las políticas de retención de datos que controles:

  • Define y aplica políticas de control de acceso a la copia de seguridad.
  • Definir y aplicar políticas de conservación de datos para la instantánea.
  • Configura un canal seguro para subir la instantánea al portal de asistencia.

Acceder a las notificaciones de hardware

Consulta las notificaciones sobre cuándo aparece un problema en los componentes de hardware de tu plataforma. Las notificaciones aparecen en System Manager con información sobre el estado del sistema de componentes de hardware, como racks, servidores, conmutadores y almacenamiento.

También puedes recibir notificaciones por correo electrónico. Incluyen información básica sobre el problema, como códigos de error. Haz clic en la notificación para ver la página del componente problemático y acceder a los registros correspondientes.

Solicitar actualizaciones de capacidad

Monitoriza, predice y solicita capacidad de hardware adicional para asegurar el buen estado y la escalabilidad de tus cargas de trabajo.

Procesar la captura del sistema

Antes de procesar la instantánea del sistema, asegúrate de que cumples los siguientes requisitos:

  • La herramienta de creación de instantáneas tiene una conexión a un clúster en ejecución.
  • Tienes los permisos necesarios para leer la configuración y los registros del clúster:
    • Los operadores de aplicaciones tienen funciones administrativas.
    • Los administradores de la plataforma tienen permisos de acceso restringidos a la información asignada.

Para procesar la instantánea del sistema, selecciona los componentes del sistema que quieras incluir en la instantánea. La herramienta se conecta a tu clúster para extraer información de cada componente seleccionado. Después de recuperar los datos, estos se someten a un posprocesamiento para filtrar los datos sensibles. A continuación, la herramienta agrupa la información en un archivo ZIP.

También puedes inspeccionar el archivo ZIP y su contenido para asegurarte de que no incluyes datos sensibles antes de compartirlo con el equipo de Asistencia.

Acceder a la documentación de asistencia

Accede a la siguiente documentación y guías para solucionar el problema del cliente:

  • Guías de asistencia
  • Documentación pública, prácticas recomendadas, preguntas frecuentes y base de conocimientos
  • La comunidad de usuarios

Un partner puede proporcionar asistencia de nivel 1 y 2, por lo que estos artefactos deben estar disponibles públicamente.

Derivar un problema de software al nivel 3

Sigue estos pasos para derivar un problema de software a Google para que te proporcione asistencia de nivel 3 (L3) o asistencia avanzada:

  1. Solicitar permiso para compartir datos de la captura de pantalla con Google.
  2. Abre una incidencia con Google.
  3. Proporciona a Google acceso a tu vista general.
  4. Monitoriza y ofrece visibilidad sobre las operaciones que Google realiza en la copia de seguridad.

Derivar un problema de hardware al nivel 3

Sigue estos pasos para derivar a Google un problema causado por un fallo de hardware:

  1. Extrae y anonimiza la información mínima para solucionar problemas de los componentes de hardware:
    • Registros
    • Estado y configuraciones
    • Métricas
    • Información física, como el número de bastidor, el tipo de componente, el número de serie y la ubicación física.
  2. Solicitar permiso para compartir datos de la captura de pantalla con Google.
  3. Abre una incidencia con Google.
  4. Proporciona a Google acceso a tu vista general.
  5. Monitoriza y ofrece visibilidad sobre las operaciones que Google realiza en la copia de seguridad.

Abrir un caso de asistencia de hardware

Google tiene acceso a las mismas herramientas de solución de problemas para diagnosticar la captura del cliente. Abre un caso de asistencia con el partner de hardware como servicio (HWaaS) para obtener asistencia de hardware a través del sistema de incidencias compartido.

Las incidencias de asistencia tienen los siguientes niveles de prioridad con los acuerdos de nivel de servicio (ANS) correspondientes:

  • Crítica
  • Alta
  • Medio

Compartir datos de clientes con el partner de HWaaS

Sigue estos pasos para compartir datos de hardware del sistema con el partner de hardware y habilitar la solución de problemas de hardware:

  1. Solicita permiso para compartir datos de instantáneas con un partner de HWaaS.
  2. Asegúrese de cumplir los requisitos de soberanía: nacionalidad y ubicación del agente del equipo de Asistencia.
  3. Concede al partner de HWaaS acceso seguro a la instantánea del hardware del cliente, incluido el número de serie, la ubicación física, los registros, las métricas y los archivos de configuración.
  4. Notifica a los usuarios a los que hayas concedido acceso.
  5. Forzar el vencimiento automático de los privilegios de acceso.
  6. Registra todas las actividades y compártelas con todas las partes implicadas.

Notificar a Google los resultados de la solución de problemas y corregir la cronología

Informa a Google sobre la causa principal del problema y ofrece una solución gradual para que Google pueda notificarlo al cliente final y al partner. Usa un sistema de asistencia para proporcionar los detalles de la tarea de corrección necesaria y una cronología estimada para completarla.

Coordinar el acceso al centro de datos

Coordina la logística y los permisos para acceder de forma segura al centro de datos y realiza la reparación de hardware necesaria.

El partner de HWaaS se asegura de que se cumplan los requisitos de soberanía, como la nacionalidad del agente del servicio de asistencia. Necesitan la siguiente información:

  • Los detalles del punto de contacto del centro de datos y la ubicación.
  • La ubicación exacta del rack y del componente problemáticos en el centro de datos.
  • Proceso para obtener la autorización y el permiso de acceso al centro de datos a una hora acordada.
  • Proceso para programar una intervención in situ en un centro de datos.

Obtener asistencia de hardware para SLO y SLA

Google ofrece asistencia a través de un partner fabricante de equipos originales (OEM) de hardware. El proceso es el siguiente:

  1. Google negocia la asistencia de hardware para los objetivos de nivel de servicio y los acuerdos de nivel de servicio con un partner de HWaaS.
  2. Los objetivos y los acuerdos de nivel de servicio varían en función de la gravedad del incidente, que puede ser crítica, alta o media.
  3. El partner de HWaaS actualiza la incidencia con el estado y el tiempo estimado para solucionarla.
  4. El partner de HWaaS confirma cuándo se ha resuelto el problema.

Aumentar la capacidad

Para responder a una solicitud de aumento de capacidad, usa la capacidad adicional integrada si está disponible. Ve a las instalaciones y aumenta la capacidad física si no hay más capacidad disponible en los bastidores.

Programar revisiones periódicas con Google

Programa revisiones periódicas con el partner de HWaaS para comprobar el estado actual de las implementaciones y planificar las intervenciones programadas.

Sigue estos pasos durante las revisiones periódicas:

  • Comprueba las actualizaciones programadas necesarias del sistema operativo, el hardware y el firmware.
  • Revisa el estado de los despliegues.
  • Planificar nuevas implementaciones.

Comunicar el mantenimiento y las actualizaciones programados

Comunícate con los clientes actuales sobre los próximos planes de mantenimiento programado. Sigue estos pasos con ellos:

  • Selecciona los recursos que quieras actualizar.
  • Especifica por qué las actualizaciones funcionarán en su estado actual.
  • Determina quién realizará las actualizaciones y cuándo, dónde y cómo.
  • Planifica el posible impacto y los tiempos de inactividad.

Programar el mantenimiento

Programa un mantenimiento preventivo periódico y asegúrate de que el sistema esté actualizado y funcione correctamente. HWaaS informa sobre la finalización del mantenimiento. Necesita los siguientes procesos:

  • Un proceso para obtener autorización para acceder al centro de datos.
  • Un proceso para programar una intervención in situ en el centro de datos.