Cosa significa MLOps?

MLOps (operazioni di machine learning) è un insieme di pratiche che aiutano i data scientist e gli ingegneri a gestire il ciclo di vita del machine learning (ML) in modo più efficiente.

Punta a colmare il divario tra lo sviluppo e le operazioni di machine learning. L'obiettivo di MLOps è garantire che lo sviluppo, i test e il deployment dei modelli ML siano coerenti e affidabili.

MLOps sta diventando sempre più importante poiché un numero crescente di organizzazioni utilizza modelli ML per prendere decisioni aziendali critiche.

Definizione di MLOps

MLOps è l'acronimo di "machine learning operations" (operazioni di machine learning) e si riferisce al processo di gestione del ciclo di vita del machine learning, dallo sviluppo al deployment fino al monitoraggio. Questo processo prevede attività quali:

  • Monitoraggio degli esperimenti: monitoraggio di esperimenti e risultati per identificare i modelli migliori
  • Deployment dei modelli: deployment dei modelli in produzione per renderli accessibili alle applicazioni
  • Monitoraggio dei modelli: monitoraggio dei modelli per rilevare eventuali problemi o peggioramenti delle prestazioni
  • Riaddestramento dei modelli: riaddestramento dei modelli con nuovi dati per migliorare le prestazioni

MLOps è essenziale per garantire che i modelli di machine learning siano affidabili, scalabili e gestibili negli ambienti di produzione.

L'importanza di MLOps

Il concetto di MLOps è essenziale per la gestione del ciclo di vita del ML e per garantire lo sviluppo, il deployment e la gestione efficaci dei modelli ML. Senza MLOps, le organizzazioni potrebbero affrontare diverse sfide, tra cui:

Aumento del rischio di errori: i processi manuali possono generare errori e incoerenze nel ciclo di vita del machine learning, che possono influire sull'accuratezza e sull'affidabilità dei modelli ML.

Mancanza di scalabilità: i processi manuali possono diventare difficili da gestire man mano che i modelli ML e i set di dati aumentano in dimensioni e complessità, il che rende difficile scalare in modo efficace le operazioni di ML.

Efficienza ridotta: i processi manuali possono richiedere molto tempo ed essere inefficienti, rallentando lo sviluppo e il deployment dei modelli di ML.

Mancanza di collaborazione: i processi manuali possono rendere difficile la collaborazione efficace tra data scientist, ingegneri e team operativi, portando alla creazione di silos e a interruzioni della comunicazione.

MLOps affronta queste sfide fornendo un framework e una serie di strumenti per automatizzare e gestire il ciclo di vita del ML. Consente alle organizzazioni di sviluppare, eseguire il deployment e gestire i modelli ML in modo più efficiente, affidabile e su larga scala.

Vantaggi di MLOps

Le pratiche MLOps offrono numerosi vantaggi alle organizzazioni che le adottano, tra cui:

  • Maggiore efficienza: MLOps automatizza e ottimizza il ciclo di vita del ML, riducendo il tempo e l'impegno necessari per sviluppare, eseguire il deployment e gestire i modelli ML
  • Maggiore scalabilità: MLOps consente alle organizzazioni di scalare le operazioni ML in modo più efficace, gestendo set di dati più grandi e modelli più complessi
  • Maggiore affidabilità: MLOps riduce il rischio di errori e incongruenze, garantendo che i modelli ML in produzione siano affidabili e precisi
  • Collaborazione migliore: MLOps fornisce un framework comune e una serie di strumenti per consentire a data scientist, ingegneri e team operativi di collaborare in modo efficace
  • Costi ridotti: MLOps può aiutare le organizzazioni a ridurre i costi grazie all'automazione e all'ottimizzazione del ciclo di vita del ML, riducendo la necessità di interventi manuali

Qual è la differenza tra MLOps e DevOps?

DevOps è un insieme di pratiche che aiutano le organizzazioni a colmare il divario tra i team di sviluppo software e quelli operativi. MLOps è un insieme simile di pratiche che rispondono in modo specifico alle esigenze dei modelli ML.

Esistono alcune differenze fondamentali tra MLOps e DevOps, tra cui:

  • Ambito: DevOps si concentra sul ciclo di vita di sviluppo del software, mentre MLOps si concentra sul ciclo di vita del ML
  • Complessità: i modelli ML sono spesso più complessi delle applicazioni software tradizionali e richiedono tecniche e strumenti specializzati per lo sviluppo e il deployment
  • Dati: i modelli ML si basano sui dati per l'addestramento e l'inferenza, il che comporta ulteriori sfide per la gestione e l'elaborazione dei dati
  • Requisiti normativi: i modelli ML possono essere soggetti a requisiti normativi, che possono influire sul processo di sviluppo e deployment

Nonostante queste differenze, MLOps e DevOps condividono alcuni principi comuni, come l'importanza della collaborazione, dell'automazione e del miglioramento continuo. Le organizzazioni che hanno adottato pratiche DevOps possono spesso sfruttarle durante l'implementazione di MLOps.

Componenti di base di MLOps

MLOps include diversi componenti che lavorano insieme per gestire il ciclo di vita del ML, tra cui:

Analisi esplorativa dei dati (EDA)

L'EDA è il processo di esplorazione e comprensione dei dati che verranno utilizzati per addestrare il modello ML. Questo processo prevede attività quali:

  • Visualizzazione dei dati: visualizzazione dei dati per identificare pattern, tendenze e valori anomali
  • Pulizia dei dati: rimozione dei dati duplicati o errati e gestione dei valori mancanti
  • Feature engineering: trasformazione dei dati non elaborati in caratteristiche pertinenti e utili per il modello ML

Preparazione dei dati e feature engineering

La preparazione dei dati e il feature engineering sono passaggi critici del processo MLOps. La preparazione dei dati comporta la pulizia, la trasformazione e la formattazione dei dati non elaborati per renderli adatti all'addestramento del modello. 

Il feature engineering comporta la creazione di nuove caratteristiche più pertinenti e utili per l'addestramento del modello dai dati non elaborati. Questi passaggi sono essenziali per garantire che il modello ML sia addestrato su dati di alta qualità e possa fare previsioni accurate.

Addestramento e ottimizzazione del modello

L'addestramento e l'ottimizzazione di un modello implicano l'addestramento del modello ML sui dati preparati e l'ottimizzazione dei relativi iperparametri per ottenere le migliori prestazioni possibili. 

Le attività comuni per l'addestramento e l'ottimizzazione di un modello includono:

  • Selezione dell'algoritmo ML corretto: scelta dell'algoritmo ML giusto per il problema e il set di dati specifici
  • Addestramento del modello: addestramento del modello ML sulla base dei dati di addestramento
  • Ottimizzazione del modello: regolazione degli iperparametri del modello ML per migliorarne le prestazioni
  • Valutazione del modello: valutazione delle prestazioni del modello ML sulla base dei dati di test

Revisione e governance del modello

La revisione e la governance dei modelli assicurano che lo sviluppo e il deployment dei modelli ML avvengano in modo etico e responsabile. 

  • Convalida del modello: la convalida del modello ML garantisce che soddisfi gli standard desiderati in termini di prestazioni e qualità
  • Equità del modello: garantisce che il modello ML non presenti pregiudizi o discriminazioni
  • Interpretabilità del modello: assicura che il modello ML sia comprensibile e spiegabile
  • Sicurezza del modello: garantisce che il modello ML sia sicuro e protetto dagli attacchi

Inferenza e pubblicazione del modello

L'inferenza e la gestione dei modelli prevedono di eseguire il deployment del modello ML addestrato in produzione e di renderlo disponibile per l'uso da parte di applicazioni e utenti finali. 

  • Deployment del modello: deployment del modello ML in un ambiente di produzione
  • Pubblicazione del modello: disponibilità del modello ML per l'inferenza da parte di applicazioni e utenti finali
  • Monitoraggio del modello: monitoraggio delle prestazioni e del comportamento del modello ML in produzione

Monitoraggio del modello

Il monitoraggio del modello comporta il monitoraggio continuo delle prestazioni e del comportamento del modello ML in produzione. Le attività possono includere:

  • Monitoraggio delle prestazioni del modello: metriche di monitoraggio, come accuratezza, precisione e richiamo, per valutare le prestazioni del modello ML
  • Rilevamento della deviazione del modello: rilevamento del deterioramento delle prestazioni del modello ML nel tempo a causa di modifiche ai dati o all'ambiente
  • Identificazione dei problemi del modello: identificazione di problemi come bias, overfitting o underfitting che potrebbero influire sulle prestazioni del modello ML

Riaddestramento automatico del modello

Il riaddestramento automatico del modello comporta il riaddestramento del modello ML quando le sue prestazioni si riducono o quando sono disponibili nuovi dati. Il riaddestramento automatico dei modelli include:

  • Attivazione del riaddestramento del modello: attivazione del processo di riaddestramento quando vengono soddisfatte condizioni specifiche, come un calo delle prestazioni del modello o la disponibilità di nuovi dati
  • Riaddestramento del modello: riaddestramento del modello ML con i dati più recenti e aggiornamento del modello in produzione
  • Valutazione del modello riaddestrato: valutazione delle prestazioni del modello riaddestrato per garantire che soddisfi gli standard di rendimento desiderati

Risolvi le tue sfide aziendali con Google Cloud

I nuovi clienti ricevono 300 $ di crediti gratuiti da spendere su Google Cloud.
Parla con un esperto delle vendite di Google Cloud per discutere della tua sfida unica in modo più dettagliato.

Fai il prossimo passo

Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud