L'apprendimento supervisionato è una categoria di machine learning che utilizza set di dati etichettati per addestrare algoritmi al fine di prevedere i risultati e riconoscere pattern. A differenza dell'apprendimento non supervisionato, agli algoritmi di apprendimento supervisionato viene assegnato un addestramento etichettato per apprendere la relazione tra input e output.
Gli algoritmi di machine learning supervisionato consentono alle organizzazioni di creare più facilmente modelli complessi in grado di fare previsioni accurate. Di conseguenza, sono ampiamente utilizzati in vari settori e campi, tra cui la sanità, il marketing, i servizi finanziari e altri ancora.
Qui tratteremo le nozioni di base dell'apprendimento supervisionato nell'AI, il funzionamento degli algoritmi di apprendimento supervisionato e alcuni dei casi d'uso più comuni.
I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per provare Vertex AI e altri prodotti Google Cloud.
I dati utilizzati nell'apprendimento supervisionato sono etichettati, il che significa che contengono esempi di input (chiamati caratteristica) e di output corretti (etichette). Gli algoritmi analizzano un grande set di dati di queste coppie di addestramento per dedurre quale sarebbe il valore di output desiderato quando viene richiesto di fare una previsione su nuovi dati.
Supponiamo, ad esempio, di voler insegnare a un modello a identificare le immagini degli alberi. Devi fornire un set di dati etichettato contenente molti esempi diversi di tipi di alberi e i nomi di ogni specie. Puoi consentire all'algoritmo di provare a definire quale insieme di caratteristiche appartiene a ogni albero in base agli output etichettati. Puoi quindi testare il modello mostrando un'immagine dell'albero e chiedendo di indovinare di che specie si tratta. Se il modello fornisce una risposta errata, puoi continuare ad addestrarlo e regolarne i parametri con più esempi per migliorarne l'accuratezza e ridurre al minimo gli errori.
Una volta che il modello è stato addestrato e testato, puoi utilizzarlo per fare previsioni su dati sconosciuti in base alle conoscenze precedenti che ha appreso.
L'apprendimento supervisionato nel machine learning è generalmente diviso in due categorie: classificazione e regressione.
Gli algoritmi di classificazione vengono utilizzati per raggruppare i dati prevedendo un'etichetta categorica o una variabile di output in base ai dati di input. La classificazione viene utilizzata quando le variabili di output sono categoriche, ovvero ci sono due o più classi.
Uno degli esempi più comuni di algoritmi di classificazione in uso è il filtro antispam nella posta in arrivo. In questo caso, un modello di apprendimento supervisionato viene addestrato per prevedere se un'email è spam o meno con un set di dati che contiene esempi etichettati di spam e email legittime. L'algoritmo estrae le informazioni da ogni email, tra cui il mittente, la riga dell'oggetto, il corpo del testo e altre informazioni. Dopodiché utilizza queste caratteristiche e le corrispondenti etichette di output per apprendere i pattern e assegnare un punteggio che indica se un'email è reale o spam.
Gli algoritmi di regressione vengono utilizzati per prevedere un valore reale o continuo, in cui l'algoritmo rileva una relazione tra due o più variabili.
Un esempio comune di attività di regressione potrebbe essere la previsione di uno stipendio in base all'esperienza lavorativa. Ad esempio, un algoritmo di apprendimento supervisionato verrebbe fornito con input relativi all'esperienza lavorativa (ad es. durata, settore o campo, località e così via) e il corrispondente importo dello stipendio assegnato. Una volta addestrato il modello, potrebbe essere utilizzato per prevedere lo stipendio medio in base all'esperienza lavorativa.
I modelli di apprendimento supervisionato possono essere utilizzati per una serie di casi d'uso aziendali diversi che aiutano ad affrontare un'ampia gamma di problemi. Ecco alcuni esempi comuni di apprendimento supervisionato:
La differenza principale tra apprendimento supervisionato e non supervisionato è il tipo di dati di input utilizzati per addestrare il modello. L'apprendimento supervisionato utilizza set di dati di addestramento etichettati per provare a insegnare a un modello un obiettivo specifico e predefinito.
In confronto, l'apprendimento non supervisionato utilizza dati non etichettati e opera in modo autonomo per provare ad apprendere la struttura dei dati senza ricevere istruzioni esplicite.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.