L'apprendimento non supervisionato nell'intelligenza artificiale è un tipo di machine learning che apprende dai dati senza supervisione umana. A differenza dell'apprendimento supervisionato, i modelli di machine learning non supervisionato ricevono dati non etichettati e possono scoprire pattern e approfondimenti senza indicazioni o istruzioni esplicite.
Che tu te ne renda conto o meno, l'intelligenza artificiale e il machine learning stanno influenzando ogni aspetto della vita quotidiana, contribuendo a trasformare i dati in insight in grado di migliorare l'efficienza, ridurre i costi e orientare meglio il processo decisionale. Oggi le aziende ricorrono agli algoritmi di machine learning per offrire consigli personalizzati, traduzioni in tempo reale o persino generare automaticamente testi, immagini e altri tipi di contenuti.
Qui esamineremo le nozioni di base del machine learning non supervisionato, il suo funzionamento e alcune delle sue applicazioni più comuni nella vita reale.
I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per provare Vertex AI e altri prodotti Google Cloud.
Come suggerisce il nome, l'apprendimento non supervisionato utilizza algoritmi di autoapprendimento: l'apprendimento ha luogo in assenza di etichette o senza alcun addestramento preliminare. Al contrario, il modello riceve dati non elaborati e non etichettati e deve dedurre le proprie regole e strutturare le informazioni in base a somiglianze, differenze e pattern senza istruzioni esplicite su come elaborare i singoli dati.
Gli algoritmi di apprendimento non supervisionato si prestano in maniera ottimale per attività di elaborazione più complesse, come l'organizzazione di grandi set di dati in cluster. Sono utili per identificare pattern non rilevati in precedenza nei dati e possono contribuire a identificare caratteristiche utili per classificare i dati.
Immagina di avere un grande set di dati sul meteo. Un algoritmo di apprendimento non supervisionato analizzerà i dati identificando i pattern presenti nei punti dati. Ad esempio, potrebbe raggruppare i dati per temperatura o modelli meteorologici simili.
Anche se l'algoritmo non comprende i pattern identificati in base alle eventuali informazioni che hai fornito in precedenza, puoi esaminare i raggruppamenti di dati e cercare di classificarli in base alla tua comprensione del set di dati. Ad esempio, potresti riconoscere che i diversi gruppi di temperature rappresentano tutte e quattro le stagioni o che i modelli meteorologici sono stati suddivisi in base ai diversi tipi di condizioni meteorologiche, come pioggia, nevischio o neve.
In generale, esistono tre tipi di attività basate sull'apprendimento non supervisionato: clustering, regole di associazione e riduzione della dimensionalità.
Di seguito analizzeremo più nel dettaglio ciascun tipo di tecnica di apprendimento non supervisionato.
Il clustering è una tecnica utilizzata per esplorare dati non elaborati e non etichettati e suddividerli in gruppi (o cluster) in base a somiglianze o differenze. Viene utilizzato in numerose applicazioni, tra cui la segmentazione dei clienti, il rilevamento di attività fraudolente e l'analisi delle immagini. Gli algoritmi di clustering suddividono i dati in gruppi naturali individuando strutture o pattern simili in dati non classificati.
Il clustering è uno degli approcci al machine learning non supervisionato più diffusi. Esistono diversi tipi di algoritmi di apprendimento non supervisionato che vengono utilizzati per il clustering, che può essere di tipo esclusivo, non esclusivo, gerarchico e probabilistico.
L'estrazione delle regole di associazione è un approccio basato su regole finalizzato a rilevare le relazioni interessanti esistenti tra i punti dati in grandi set di dati. Gli algoritmi di apprendimento non supervisionato cercano associazioni "if-then" frequenti, chiamate anche regole, per scoprire correlazioni e co-occorrenze all'interno dei dati, oltre alle diverse connessioni tra gli oggetti dati.
Questo approccio viene generalmente utilizzato per analizzare i carrelli di vendita al dettaglio o i set di dati transazionali allo scopo di rappresentare la frequenza con cui determinati articoli vengono acquistati insieme. Questi algoritmi rivelano i pattern di acquisto dei clienti e le relazioni precedentemente nascoste tra i prodotti, fornendo così informazioni utili per i motori per suggerimenti o altre opportunità di cross-sell. Queste regole potrebbero esserti più familiari dalle sezioni "Acquistati frequentemente insieme" e "Le persone che hanno acquistato questo articolo hanno acquistato anche" del tuo negozio online preferito.
Le regole di associazione vengono spesso utilizzate per organizzare i set di dati medici per le diagnosi cliniche. L'utilizzo delle regole di associazione e del machine learning non supervisionato può aiutare i medici a identificare le probabilità di una specifica diagnosi confrontando le relazioni tra i sintomi dei casi passati dei pazienti.
In genere, gli algoritmi Apriori sono quelli più utilizzati per l'apprendimento delle regole di associazione al fine di identificare raccolte di elementi correlati o insiemi di elementi. Tuttavia, vengono utilizzati anche altri tipi, come gli algoritmi Eclat e FP-growth.
La riduzione della dimensionalità è una tecnica di apprendimento non supervisionato che riduce il numero di caratteristiche (o dimensioni) all'interno di un set di dati. Una quantità maggiore di dati in genere è l'ideale per il machine learning, ma può anche rendere più difficile la visualizzazione dei dati.
La riduzione della dimensionalità estrae caratteristiche importanti dal set di dati, riducendo il numero di caratteristiche irrilevanti o casuali presenti. Questo metodo utilizza algoritmi di analisi delle componenti principali (ACP) e di decomposizione ai valori singolari (SVD) per ridurre il numero di input di dati senza compromettere l'integrità delle proprietà dei dati originali.
Ora che hai compreso le basi del funzionamento dell'apprendimento non supervisionato, diamo un'occhiata ai casi d'uso più comuni che aiutano le aziende a esplorare rapidamente grandi volumi di dati.
Ecco alcuni esempi reali di apprendimento non supervisionato:
L'apprendimento non supervisionato è adatto per attività che richiedono l'analisi di grandi quantità di dati non etichettati. Adottando questo approccio, le aziende possono ottenere più facilmente informazioni approfondite dai dati privi di etichette e comprendere così la struttura di base di un set di dati e identificare pattern e relazioni tra i set di dati senza la necessità di un intervento umano.
La differenza principale tra apprendimento supervisionato e non supervisionato consiste nel tipo di dati di input utilizzati. A differenza degli algoritmi di machine learning non supervisionato, l'apprendimento supervisionato si basa su dati di addestramento etichettati per determinare se il riconoscimento di forme all'interno di un set di dati è accurato.
Anche gli obiettivi dei modelli di apprendimento supervisionato sono predeterminati, il che significa che il tipo di output di un modello è già noto prima dell'applicazione degli algoritmi. In altre parole, l'input viene mappato all'output in base ai dati di addestramento.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.