Perspectiva de la IA y el AA: Excelencia operativa

Last reviewed 2024-10-11 UTC

En este documento del framework de arquitectura: perspectiva de IA y AA, se proporciona una descripción general de los principios y las recomendaciones para ayudarte a compilar y operar sistemas sólidos de IA y AA en Google Cloud. Estas recomendaciones te ayudan a configurar elementos fundamentales, como la observabilidad, la automatización y la escalabilidad. Las recomendaciones de este documento se alinean con el pilar de excelencia operativa del framework de arquitectura.

La excelencia operativa dentro del dominio de la IA y el AA es la capacidad de implementar, administrar y gobernar sin problemas los complejos sistemas y canales de IA y AA que potencian los objetivos estratégicos de tu organización. La excelencia operativa te permite responder de manera eficiente a los cambios, reducir la complejidad operativa y garantizar que las operaciones permanezcan alineadas con los objetivos comerciales.

Crea una base sólida para el desarrollo de modelos

Establece una base sólida para optimizar el desarrollo del modelo, desde la definición del problema hasta la implementación. Esta base garantiza que tus soluciones de IA se basen en componentes y opciones confiables y eficientes. Este tipo de base te ayuda a lanzar cambios y mejoras de forma rápida y sencilla.

Ten en cuenta las siguientes recomendaciones:

  • Define el problema que resuelve el sistema de IA y el resultado que deseas.
  • Identifica y recopila los datos relevantes que se requieren para entrenar y evaluar tus modelos. Luego, limpia y procesa previamente los datos sin procesar. Implementa verificaciones de validación de datos para garantizar la calidad y la integridad de los datos.
  • Elige el enfoque de AA adecuado para la tarea. Cuando diseñes la estructura y los parámetros del modelo, considera la complejidad del modelo y los requisitos computacionales.
  • Adopta un sistema de control de versión para el código, el modelo y los datos.

Automatiza el ciclo de vida del desarrollo de modelos

Desde la preparación y el entrenamiento de datos hasta la implementación y la supervisión, la automatización te ayuda a mejorar la calidad y la eficiencia de tus operaciones. La automatización permite el desarrollo y la implementación de modelos sin problemas, repetibles y sin errores. La automatización minimiza la intervención manual, acelera los ciclos de lanzamiento y garantiza la coherencia en todos los entornos.

Ten en cuenta las siguientes recomendaciones:

  • Usa un sistema de orquestación de canalizaciones administrado para organizar y automatizar el flujo de trabajo de AA. La canalización debe controlar los pasos principales del ciclo de vida de desarrollo: preparación, entrenamiento, implementación y evaluación.
  • Implementa canalizaciones de CI/CD para el ciclo de vida de desarrollo de modelos. Estas canalizaciones deben automatizar la compilación, la prueba y la implementación de modelos. Las canalizaciones también deben incluir un entrenamiento continuo para volver a entrenar los modelos con datos nuevos según sea necesario.
  • Implementa enfoques de lanzamiento por fases, como las implementaciones canary o las pruebas A/B, para obtener lanzamientos de modelos seguros y controlados.

Implementa la observabilidad

Cuando implementas la observabilidad, puedes obtener estadísticas profundas sobre el rendimiento del modelo, la deriva de datos y el estado del sistema. Implementa mecanismos de supervisión, alertas y registro continuos para identificar problemas de forma proactiva, activar respuestas oportunas y garantizar la continuidad operativa.

Ten en cuenta las siguientes recomendaciones:

  • Implementa la supervisión de rendimiento permanente y automatizada para tus modelos. Usa métricas y criterios de éxito para la evaluación continua del modelo después de la implementación.
  • Supervisa los extremos y la infraestructura de tu implementación para garantizar la disponibilidad del servicio.
  • Configura alertas personalizadas según anomalías y umbrales específicos de la empresa para asegurarte de que los problemas se identifiquen y resuelvan de forma oportuna.
  • Usa técnicas de IA explicable para comprender e interpretar los resultados del modelo.

Crea una cultura de excelencia operativa

La excelencia operativa se basa en las personas, la cultura y las prácticas profesionales. El éxito de tu equipo y tu empresa depende de la eficacia con la que tu organización implemente metodologías que permitan el desarrollo confiable y rápido de las capacidades de IA.

Ten en cuenta las siguientes recomendaciones:

  • Promociona la automatización y la estandarización como metodologías de desarrollo principales. Usa técnicas de operaciones de AA para optimizar tus flujos de trabajo y administrar el ciclo de vida del AA de forma eficiente. Automatiza tareas para liberar tiempo para la innovación y estandariza los procesos para respaldar la coherencia y facilitar la solución de problemas.
  • Prioriza el aprendizaje y la mejora continuos. Fomenta las oportunidades de aprendizaje que los miembros del equipo pueden usar para mejorar sus habilidades y mantenerse al tanto de los avances de la IA y el AA. Fomenta la experimentación y realiza reuniones retrospectivas con regularidad para identificar áreas de mejora.
  • Cultiva una cultura de responsabilidad y propiedad. Define roles claras para que todos comprendan sus contribuciones. Empodera a los equipos para que tomen decisiones dentro de los límites y hagan un seguimiento del progreso mediante métricas transparentes.
  • Incorporar la ética y la seguridad de la IA en la cultura Prioriza los sistemas responsables integrando consideraciones éticas en cada etapa del ciclo de vida del AA. Establece principios éticos claros y fomenta debates abiertos sobre los desafíos relacionados con la ética.

Diseña para la escalabilidad

Diseña tus soluciones de IA para controlar los crecientes volúmenes de datos y las demandas de los usuarios. Usa una infraestructura escalable para que tus modelos puedan adaptarse y tener un rendimiento óptimo a medida que tu proyecto se expande.

Ten en cuenta las siguientes recomendaciones:

  • Planifica la capacidad y las cuotas. Anticipa el crecimiento futuro y planifica la capacidad de tu infraestructura y las cuotas de recursos en consecuencia.
  • Prepárate para los eventos de tráfico máximo. Asegúrate de que tu sistema pueda controlar aumentos repentinos en el tráfico o la carga de trabajo durante eventos de gran demanda.
  • Ajusta las aplicaciones de IA para la producción. Diseña para el escalamiento horizontal para adaptarse a los aumentos en la carga de trabajo. Usa frameworks como Ray en Vertex AI para realizar tareas en paralelo en varias máquinas.
  • Usa servicios administrados cuando corresponda. Usa servicios que te ayuden a escalar y, al mismo tiempo, minimizar la sobrecarga operativa y la complejidad de las intervenciones manuales.

Colaboradores

Autores:

Otros colaboradores: