¿Qué son las MLOps?

MLOps (aprendizaje automático) es un conjunto de prácticas que ayudan a los ingenieros y científicos de datos a administrar el ciclo de vida del aprendizaje automático (AA) de manera más eficiente.

Su objetivo es cerrar la brecha entre el desarrollo y las operaciones para el aprendizaje automático. El objetivo de las MLOps es garantizar que los modelos de AA se desarrollen, prueben e implementen de forma coherente y confiable.

Las MLOps son cada vez más importantes, ya que que son cada vez más las organizaciones que usan modelos de AA para tomar decisiones empresariales esenciales.

Definición de MLOps

MLOps significa operaciones de aprendizaje automático y hace referencia al proceso de administrar el ciclo de vida del aprendizaje automático, desde el desarrollo hasta la implementación y la supervisión. Incluye tareas como las siguientes:

  • Seguimiento de experimentos: Hacer un seguimiento de los experimentos y resultados para identificar los mejores modelos
  • Implementación de modelos: Implementación de modelos en producción y acceso a ellos para las aplicaciones
  • Supervisión de modelos: Supervisa modelos para detectar cualquier problema o degradación en el rendimiento.
  • Reentrenamiento de modelos: se vuelve a entrenar modelos con datos nuevos para mejorar su rendimiento

Las MLOps son esenciales para garantizar que los modelos del aprendizaje automático sean confiables y escalables, y que se puedan mantener en entornos de producción.

La importancia de las MLOps

Las MLOps son esenciales para administrar el ciclo de vida del AA y garantizar que los modelos del AA se desarrollen, implementen y mantengan de forma eficaz. Sin MLOps, las organizaciones pueden enfrentar varios desafíos, incluidos los siguientes:

Mayor riesgo de errores: Los procesos manuales pueden provocar incoherencias y errores en el ciclo de vida del AA, lo que puede afectar la exactitud y confiabilidad de los modelos del AA.

Falta de escalabilidad: Los procesos manuales pueden ser difíciles de administrar a medida que los conjuntos de datos y los modelos del AA aumentan en tamaño y complejidad, lo que dificulta el escalamiento eficaz de las operaciones del AA.

Eficiencia reducida: Los procesos manuales pueden consumir mucho tiempo y ser ineficientes, lo que ralentiza el desarrollo y la implementación de los modelos del AA.

Falta de colaboración: Los procesos manuales pueden dificultar que los científicos de datos, los ingenieros y los equipos de operaciones colaboren de manera eficaz, lo que genera silos y fallas en la comunicación.

Las MLOps abordan estos desafíos mediante el aprovisionamiento de un framework y un conjunto de herramientas para automatizar y administrar el ciclo de vida del AA. Permite a las organizaciones desarrollar, implementar y mantener modelos del AA de forma más eficiente, confiable y a gran escala.

Beneficios de las MLOps

Las MLOps ofrecen numerosos beneficios a las organizaciones que las adoptan, incluidos los siguientes:

  • Mayor eficiencia: Las MLOps automatizan y optimizan el ciclo de vida del AA, lo que reduce el tiempo y el esfuerzo necesarios para desarrollar, implementar y mantener los modelos del AA.
  • Mayor escalabilidad: Las MLOps permiten a las organizaciones escalar sus operaciones del AA de forma más eficaz, al controlar conjuntos de datos más grandes y modelos más complejos.
  • Confiabilidad mejorada: Las MLOps reducen el riesgo de errores y de incoherencias, lo que garantiza que los modelos del AA sean confiables y precisos en producción
  • Colaboración mejorada: Las MLOps proporcionan un framework y un conjunto de herramientas comunes para que los científicos de datos, ingenieros y equipos de operaciones colaboren de manera eficaz.
  • Reducción de costos: Las MLOps pueden ayudar a las organizaciones a reducir costos, ya que automatizan y optimizan el ciclo de vida del AA, lo que reduce la necesidad de intervención manual.

¿Cuál es la diferencia entre MLOps y DevOps?

DevOps es un conjunto de prácticas que ayuda a las organizaciones a cerrar la brecha entre los equipos de desarrollo de software y operaciones. Las MLOps son un conjunto similar de prácticas que abordan específicamente las necesidades de los modelos del AA.

Existen algunas diferencias clave entre MLOps y DevOps, incluidas las siguientes:

  • Alcance: DevOps se centra en el ciclo de vida del desarrollo de software, mientras que las MLOps se centran en el ciclo de vida del AA.
  • Complejidad: Los modelos de AA suelen ser más complejos que las aplicaciones de software tradicionales y requieren herramientas y técnicas especializadas para el desarrollo y la implementación.
  • Datos: Los modelos de AA se basan en los datos para el entrenamiento y la inferencia, lo que presenta desafíos adicionales en la administración y el procesamiento de los datos.
  • Reglamentación: Los modelos de AA pueden estar sujetos a requisitos reglamentarios, lo que puede afectar el proceso de desarrollo y de implementación

A pesar de estas diferencias, MLOps y DevOps comparten algunos principios comunes, como la importancia de la colaboración, la automatización y la mejora continua. Las organizaciones que han adoptado prácticas de DevOps suelen aprovechar esas prácticas cuando implementan MLOps.

Componentes básicos de las MLOps

Las MLOps constan de varios componentes que trabajan juntos para administrar el ciclo de vida del AA, que incluyen los siguientes:

Análisis exploratorio de datos (EDA)

El EDA es el proceso de explorar y comprender los datos que se usarán para entrenar el modelo del AA. Esto incluye tareas como las siguientes:

  • Visualización de datos: Visualizar los datos para identificar patrones, tendencias y valores atípicos
  • Limpieza de datos: Quitar los datos duplicados o erróneos y ocuparte de los valores faltantes
  • Ingeniería de atributos: Transformación de los datos sin procesar en atributos que sean relevantes y útiles para el modelo del AA

Ingeniería de atributos y preparación de datos

La preparación de los datos y la ingeniería de atributos son pasos fundamentales en el proceso de MLOps. La preparación de datos implica limpiar, transformar y formatear los datos sin procesar para que sean adecuados para el entrenamiento de modelos. 

La ingeniería de atributos implica crear atributos nuevos a partir de los datos sin procesar que sean más relevantes y útiles para el entrenamiento de modelos. Estos pasos son esenciales para garantizar que el modelo del AA esté entrenado con datos de alta calidad y pueda hacer predicciones precisas.

Entrenamiento y ajuste de modelos

El entrenamiento y el ajuste de modelos implican entrenar el modelo del AA con los datos preparados y optimizar sus hiperparámetros para lograr el mejor rendimiento posible. 

Entre las tareas comunes para el entrenamiento y el ajuste de modelos, se incluyen las siguientes:

  • Selección del algoritmo del AA correcto: cómo elegir el algoritmo del AA correcto para el problema y el conjunto de datos específicos
  • Entrenamiento del modelo: Entrena el modelo del AA con los datos de entrenamiento.
  • Ajustar el modelo: ajustar los hiperparámetros del modelo del AA para mejorar su rendimiento
  • Evaluación del modelo: evaluación del rendimiento del modelo del AA en los datos de prueba.

Revisión y administración del modelo

La revisión y administración de los modelos garantizan que los modelos del AA se desarrollen y se implementen de manera responsable y ética. 

  • Validación del modelo: validación del modelo del AA para garantizar que cumpla con los estándares de rendimiento y calidad deseados
  • Equidad del modelo: asegurarse de que el modelo del AA no exhiba sesgos ni discriminación
  • Interpretabilidad del modelo: Cómo asegurarse de que el modelo del AA sea comprensible y explicable
  • Seguridad del modelo: Cómo garantizar que el modelo del AA esté seguro y protegido de ataques

Inferencia y entrega de modelos

La inferencia y la entrega de modelos implican implementar el modelo del AA entrenado en producción y hacer que esté disponible para que lo usen las aplicaciones y los usuarios finales. 

  • Implementación del modelo: Implementa el modelo del AA en un entorno de producción.
  • Entrega de modelos: Haz que el modelo del AA esté disponible para inferencias por parte de aplicaciones y usuarios finales.
  • Supervisión de modelos: Supervisa el rendimiento y el comportamiento del modelo del AA en producción.

Supervisión de modelos

La supervisión de modelos implica la supervisión continua del rendimiento y el comportamiento del modelo del AA en producción. Las tareas pueden incluir:

  • Seguimiento del rendimiento del modelo: Métricas de seguimiento como la exactitud, la precisión y la recuperación para evaluar el rendimiento del modelo del AA
  • Detectar el desvío del modelo: Detectar cuándo el rendimiento del modelo del AA se degrada con el tiempo debido a cambios en los datos o el entorno
  • Identificar problemas del modelo: Identificar problemas como sesgos, sobreajuste o subajuste que podrían afectar el rendimiento del modelo del AA

Reentrenamiento automatizado de modelos

El reentrenamiento automático de modelos implica volver a entrenar el modelo del AA cuando su rendimiento se degrada o cuando hay nuevos datos disponibles. El reentrenamiento automatizado de modelos incluye lo siguiente:

  • Activación del reentrenamiento del modelo: Activa el proceso de reentrenamiento cuando se cumplen condiciones específicas, como una disminución en el rendimiento del modelo o la disponibilidad de datos nuevos.
  • Vuelve a entrenar el modelo: vuelve a entrenar el modelo del AA con los datos más recientes y actualiza el modelo en producción.
  • Evaluación del modelo que se volvió a entrenar: Evaluar el rendimiento del modelo que se volvió a entrenar y asegurarse de que cumpla con los estándares de rendimiento deseados

Resuelve tus desafíos más difíciles con Google Cloud

Los clientes nuevos obtienen $300 en créditos gratuitos que pueden usar en Google Cloud.
Habla con un especialista en ventas de Google Cloud para analizar tu desafío único en más detalle.

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud