O que são MLOps?

MLOps é um conjunto de práticas que ajuda engenheiros e cientistas de dados a gerenciar o ciclo de vida de machine learning (ML) com mais eficiência.

Ela visa preencher a lacuna entre o desenvolvimento e as operações para machine learning. O objetivo das MLOps é garantir que os modelos de ML sejam desenvolvidos, testados e implantados de maneira consistente e confiável.

As MLOps são cada vez mais importantes à medida que as organizações usam modelos de ML para tomar decisões críticas de negócios.

Definição de MLOps

MLOps significa operações de machine learning e se referem ao processo de gerenciamento do ciclo de vida de machine learning, desde o desenvolvimento até a implantação e o monitoramento. Elas envolvem tarefas como estas:

  • Rastreamento de experimentos: monitora experimentos e resultados para identificar os melhores modelos.
  • Implantação de modelos: implantação de modelos na produção e acesso a aplicativos
  • Monitoramento de modelos: monitora modelos para detectar problemas ou degradação no desempenho.
  • Retreinamento de modelos: treinar modelos com novos dados para melhorar o desempenho

As MLOps são essenciais para garantir que os modelos de machine learning sejam confiáveis, escalonáveis e de fácil manutenção em ambientes de produção.

A importância das MLOps

As MLOps são essenciais para gerenciar o ciclo de vida de ML e garantir que os modelos de ML sejam efetivamente desenvolvidos, implantados e mantidos. Sem MLOps, as organizações podem enfrentar vários desafios, incluindo:

Maior risco de erros: os processos manuais podem levar a erros e inconsistências no ciclo de vida do ML, o que pode afetar a acurácia e a confiabilidade dos modelos de ML.

Falta de escalonabilidade: os processos manuais podem se tornar difíceis de gerenciar à medida que os modelos e os conjuntos de dados de ML aumentam em tamanho e complexidade, dificultando o escalonamento eficaz das operações de ML.

Eficiência reduzida: os processos manuais podem ser demorados e ineficientes, retardando o desenvolvimento e a implantação de modelos de ML.

Falta de colaboração: os processos manuais podem dificultar a colaboração eficaz de cientistas de dados, engenheiros e equipes de operações, causando silos e falhas na comunicação.

As MLOps abordam esses desafios fornecendo um framework e um conjunto de ferramentas para automatizar e gerenciar o ciclo de vida de ML. Elas permitem que as organizações desenvolvam, implantem e mantenham modelos de ML com mais eficiência, confiabilidade e em grande escala.

Benefícios de MLOps

As MLOps oferecem vários benefícios para as organizações que as adotam, incluindo:

  • Mais eficiência: as MLOps automatizam e simplificam o ciclo de vida do ML, reduzindo o tempo e o esforço necessários para desenvolver, implantar e manter modelos de ML.
  • Maior escalonabilidade: com as MLOps, as organizações podem escalonar as operações de ML com mais eficiência, lidando com conjuntos de dados maiores e modelos mais complexos.
  • Maior confiabilidade: as MLOps reduzem o risco de erros e inconsistências, garantindo que os modelos de ML sejam confiáveis e precisos na produção.
  • Colaboração aprimorada: as MLOps oferecem um framework comum e um conjunto de ferramentas para que cientistas de dados, engenheiros e equipes de operações colaborem de maneira eficaz.
  • Custos reduzidos: as MLOps podem ajudar as organizações a reduzir custos automatizando e otimizando o ciclo de vida do ML, reduzindo a necessidade de intervenção manual

Qual é a diferença entre MLOps e DevOps?

DevOps é um conjunto de práticas que ajuda as organizações a preencher a lacuna entre as equipes de desenvolvimento de software e operações. MLOps é um conjunto semelhante de práticas que aborda especificamente as necessidades dos modelos de ML.

Há algumas diferenças importantes entre MLOps e DevOps, incluindo:

  • Escopo: o DevOps se concentra no ciclo de vida do desenvolvimento de software, enquanto o MLOps se concentra no ciclo de vida do ML
  • Complexidade: os modelos de ML costumam ser mais complexos do que os aplicativos de software tradicionais, exigindo ferramentas e técnicas especializadas para desenvolvimento e implantação
  • Dados: os modelos de ML dependem de dados para treinamento e inferência, o que cria mais desafios para gerenciar e processar dados.
  • Regulamento: os modelos de ML podem estar sujeitos a requisitos regulamentares, o que pode afetar o processo de desenvolvimento e implantação

Apesar dessas diferenças, MLOps e DevOps compartilham alguns princípios comuns, como a importância da colaboração, automação e melhoria contínua. As organizações que adotaram práticas de DevOps geralmente podem aproveitar essas práticas ao implementar MLOps.

Componentes básicos de MLOps

As MLOps consistem em vários componentes que trabalham juntos para gerenciar o ciclo de vida do ML, incluindo:

Análise exploratória de dados (EDA)

A EDA é o processo de explorar e entender os dados que serão usados para treinar o modelo de ML. Isso envolve tarefas como:

  • Visualização de dados: visualização dos dados para identificar padrões, tendências e valores atípicos.
  • Limpeza de dados: remoção de dados duplicados ou incorretos e como lidar com valores ausentes.
  • Engenharia de atributos: transformar os dados brutos em atributos relevantes e úteis para o modelo de ML.

Preparação de dados e engenharia de atributos

A preparação de dados e a engenharia de atributos são etapas fundamentais no processo de MLOps. A preparação de dados envolve a limpeza, transformação e formatação dos dados brutos para que sejam adequados para o treinamento do modelo. 

A engenharia de atributos envolve a criação de novos atributos com base nos dados brutos que são mais relevantes e úteis para o treinamento de modelos. Essas etapas são essenciais para garantir que o modelo de ML seja treinado com dados de alta qualidade e possa fazer previsões precisas.

Treinamento e ajuste de modelos

O treinamento e o ajuste do modelo envolvem o treinamento do modelo de ML nos dados preparados e a otimização dos hiperparâmetros para alcançar o melhor desempenho possível. 

Tarefas comuns para treinamento e ajuste de modelos incluem:

  • Seleção do algoritmo de ML certo: como escolher o algoritmo certo para o problema específico e o conjunto de dados
  • Como treinar o modelo: treinar o modelo de ML nos dados de treinamento
  • Ajuste do modelo: ajuste os hiperparâmetros do modelo de ML para melhorar o desempenho dele.
  • Avaliação do modelo: como avaliar o desempenho do modelo de ML nos dados de teste.

Revisão de modelo e governança

A revisão e a governança do modelo garantem que os modelos de ML sejam desenvolvidos e implantados de maneira responsável e ética. 

  • Validação de modelo: validar o modelo de ML para garantir que ele atenda aos padrões de desempenho e qualidade desejados.
  • Imparcialidade do modelo: garantir que o modelo de ML não apresente viés ou discriminação
  • Interpretabilidade do modelo: garantir que o modelo de ML seja compreensível e explicável
  • Segurança do modelo: garantir que o modelo de ML esteja seguro e protegido contra ataques.

Inferência e exibição de modelos

A inferência e a disponibilização de modelos envolvem a implantação do modelo de ML treinado na produção e a disponibilização dele para uso por aplicativos e usuários finais. 

  • Implantação de modelos: implantação do modelo de ML em um ambiente de produção
  • Exibição de modelo: disponibiliza o modelo de ML para inferência por aplicativos e usuários finais.
  • Monitoramento de modelo: como monitorar o desempenho e o comportamento do modelo de ML em produção

Monitoramento de modelos

O monitoramento de modelos envolve monitorar continuamente o desempenho e o comportamento do modelo de ML em produção. As tarefas podem incluir:

  • Rastreamento do desempenho do modelo: rastreia métricas como acurácia, precisão e recall para avaliar o desempenho do modelo de ML.
  • Detectar desvios de modelo: detectar quando o desempenho do modelo de ML se degrada ao longo do tempo devido a alterações nos dados ou no ambiente.
  • Como identificar problemas do modelo: identificar problemas como viés, overfitting ou underfitting que podem afetar o desempenho do modelo de ML

Retreinamento automatizado do modelo

O retreinamento automatizado do modelo envolve o retreinamento do modelo de ML quando o desempenho dele é reduzido ou quando novos dados são disponibilizados. O retreinamento automatizado de modelo inclui:

  • Como acionar o retreinamento do modelo: acionar o processo de retreinamento quando condições específicas forem atendidas, como uma queda no desempenho do modelo ou a disponibilidade de novos dados.
  • Retreinamento do modelo: treine novamente o modelo de ML usando os dados mais recentes e atualize o modelo na produção.
  • Avaliação do modelo retreinado: avaliar o desempenho do modelo treinado novamente e garantir que ele atenda aos padrões de desempenho desejados.

Resolva seus desafios comerciais com o Google Cloud

Clientes novos recebem US$ 300 em créditos para usar no Google Cloud.
Fale com um especialista em vendas do Google Cloud para discutir seu desafio exclusivo em mais detalhes.

Vá além

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud