Qual è la differenza tra deep learning, machine learning e intelligenza artificiale?

L'intelligenza artificiale è un campo ampio con molti termini e concetti interconnessi e viene spesso utilizzata come termine generico per indicare qualsiasi tipo di macchina intelligente. In realtà, intelligenza artificiale, machine learning e deep learning sono termini distinti con alcune, sottili differenze.

Per sapere come l'intelligenza artificiale e il machine learning possono aiutare la tua azienda, leggi di più sui prodotti e soluzioni AI e ML di Google Cloud qui.

I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per provare Vertex AI e altri prodotti Google Cloud. 

Per saperne di più sulla relazione tra AI, deep learning e machine learning, continua a leggere.

Che cos'è il deep learning?

Il deep learning è una branca del machine learning che utilizza reti neurali artificiali per elaborare e analizzare le informazioni. Le reti neurali sono composte da nodi di calcolo stratificati all'interno di algoritmi di deep learning. Ogni livello contiene uno strato di input, uno di output e uno nascosto. Alla rete neurale vengono forniti dati di addestramento, che aiutano l'algoritmo ad apprendere e a migliorare l'accuratezza. Quando una rete neurale contiene più strati nascosti oltre agli strati di input e output, è considerata una rete neurale profonda, che è la base del deep learning.

Gli algoritmi di deep learning si ispirano ai meccanismi del cervello umano e sono particolarmente efficaci per l'analisi di grandi quantità di dati non strutturati. Viene utilizzato in molte delle attività che oggi pensiamo come AI, tra cui il riconoscimento vocale e di immagini, il rilevamento di oggetti e l'elaborazione del linguaggio naturale. Il deep learning può creare correlazioni non lineari e complesse all'interno dei set di dati, sebbene richieda più dati di addestramento e risorse informatiche rispetto al machine learning.

Alcuni tipi comuni di reti neurali utilizzate per il deep learning includono:

  • Le reti neurali feed-forward (FF) sono una delle forme più vecchie di reti neurali, in cui i dati passano in un solo verso tra i livelli di neuroni artificiali fino a raggiungere l'output.
  • Le reti neurali ricorrenti (RNN) si differenziano dalle reti neurali feed-forward in quanto di solito utilizzano dati di serie temporali o che prevedono sequenze. Le reti neurali ricorrenti hanno "memoria" di ciò che è successo nello strato precedente in quanto dipendente dall'output di quello corrente.
  • La memoria lunga a breve termine (LSTM) è una forma avanzata di RNN che può utilizzare la memoria per "ricordare" ciò che è accaduto nei livelli precedenti.
  • Le rete neurali convoluzionali (CNN) includono alcune delle reti neurali più comuni nell'intelligenza artificiale moderna e utilizzano diversi livelli distinti (uno convoluzionale, quindi uno di pooling) che filtrano parti diverse di un'immagine prima di ricrearla (nello strato completamente connesso).
  • Le reti generative avversarie (GAN) sono due reti neurali (una che funge da "generatore" e l'altra da "discriminatore") che competono tra loro in un gioco che alla fine migliora l'accuratezza del risultato.

Che cos'è il machine learning?

Il machine learning è una branca dell'intelligenza artificiale che consente a un sistema di apprendere e migliorare in modo autonomo senza essere programmato esplicitamente. Gli algoritmi di machine learning agiscono riconoscendo pattern e dati e facendo previsioni quando vengono inseriti nuovi dati nel sistema.

Nel machine learning vengono in genere utilizzati diversi modelli, tra cui:

Apprendimento supervisionato

L'apprendimento supervisionato è un modello di machine learning che utilizza dati di addestramento etichettati (dati strutturati) per mappare un input specifico a un output. Nell'apprendimento supervisionato, l'output è noto (ad esempio il riconoscimento dell'immagine di una mela) e il modello viene addestrato sui dati dell'output noto. In parole povere, per addestrare l'algoritmo a riconoscere le immagini di mele, gli si forniscono immagini etichettate come mele.

Gli algoritmi di apprendimento supervisionato più comuni utilizzati oggi includono:

  • Regressione lineare
  • Risultati vicini K-nearest
  • Naive Bayes
  • Regressione polinomiale
  • Alberi decisionali

Apprendimento non supervisionato

L'apprendimento non supervisionato è un modello di machine learning che utilizza dati non etichettati (dati non strutturati) per apprendere pattern. A differenza dell'apprendimento supervisionato, l'output non è noto in anticipo. Piuttosto, l'algoritmo apprende dai dati senza input umani (di conseguenza, non è supervisionato) e li classifica in gruppi in base agli attributi.

Gli algoritmi di apprendimento non supervisionato più comuni utilizzati oggi includono:

  • Medie fuzzy
  • Clustering K-means
  • Clustering gerarchico
  • Analisi delle componenti principali
  • Minimi quadrati parziali

Apprendimento semi-supervisionato

Spesso si utilizza anche il machine learning con approccio misto, chiamato apprendimento semi-supervisionato, dove solo una parte dei dati viene etichettata. Nell'apprendimento semi-supervisionato, l'algoritmo deve capire come organizzare e strutturare i dati per ottenere un risultato noto. Ad esempio, al modello di machine learning viene detto che il risultato finale è una mela, ma solo alcuni dati di addestramento sono etichettati come mela.

Apprendimento per rinforzo

L'apprendimento per rinforzo è un modello di machine learning che può essere descritto come un modello di "apprendimento tramite pratica" attraverso una serie di prove con potenziali errori. Un "agente" impara a eseguire una determinata attività attraverso un ciclo di feedback finché le sue prestazioni non rientrano in un intervallo desiderato. L'agente riceve un premio quando esegue correttamente l'attività e una penalità quando le prestazioni sono inadeguate.

Che cos'è l'intelligenza artificiale?

L'intelligenza artificiale è un settore scientifico che riguarda la creazione di computer e macchine in grado di ragionare, imparare e agire in un modo che normalmente richiede l'intelligenza umana o prevede l'analisi di dati la cui scala supera ciò che l'uomo è in grado di analizzare. L'AI è un vasto campo che comprende molte discipline, tra cui l'informatica, i dati e l'analisi, l'ingegneria del software e persino la filosofia. 

A livello aziendale, l'AI è un insieme di tecnologie con molti casi d'uso, tra cui analisi dei dati, previsioni e stime, elaborazione del linguaggio naturale, suggerimenti, automazione informatica, recupero intelligente dei dati e altro ancora.

Intelligenza artificiale, machine learning e deep learning a confronto

Sebbene questi termini siano correlati, rappresentano una chiara gerarchia: il deep learning è un tipo specializzato di machine learning e il machine learning è una disciplina fondamentale nel campo più ampio dell'intelligenza artificiale. La distinzione principale riguarda capacità, complessità e feature engineering. 

Funzionalità

Intelligenza artificiale

Machine learning

Deep learning

Ambito e definizione

Concetto più ampio. Campo dedicato alla creazione di sistemi o macchine in grado di eseguire attività che in genere richiedono l'intelligenza umana (ad esempio: ragionamento, risoluzione di problemi, apprendimento, percezione).

Un sottoinsieme dell'AI. Si concentra sullo sviluppo di sistemi in grado di apprendere dai dati e prendere decisioni in base a essi, senza essere programmati esplicitamente per ogni scenario.

Un sottoinsieme dell'ML. Utilizza reti neurali artificiali (ANN) a più livelli per apprendere pattern complessi e rappresentazioni gerarchiche direttamente da grandi quantità di dati non elaborati.

Obiettivo


Simulare o replicare l'intelligenza umana nelle macchine.

Per consentire alle macchine di apprendere dai dati per eseguire attività specifiche in modo accurato.

Per ottenere una maggiore accuratezza e gestire pattern più complessi (soprattutto nei dati non strutturati) apprendendo automaticamente le caratteristiche dai dati utilizzando reti neurali profonde.

Metodo

Può utilizzare varie tecniche: logica, sistemi basati su regole, algoritmi di ricerca, ottimizzazione e, forse cosa più importante, machine learning e deep learning.

Utilizza algoritmi (ad esempio: regressione lineare, SVM, alberi decisionali, foreste casuali) per analizzare i dati, imparare da essi e prendere decisioni o fare previsioni informate.

Utilizza reti neurali artificiali complesse e a più livelli (ispirate alla struttura del cervello umano) con molti parametri.

Requisiti dei dati

Varia molto. L'AI basata su regole potrebbe aver bisogno di pochi dati, mentre l'AI basata su ML/DL ha bisogno di una quantità significativa di dati.

Richiede grandi quantità di dati strutturati o etichettati per addestrare gli algoritmi in modo efficace. In genere, le prestazioni migliorano con più dati.

Richiede set di dati molto grandi (spesso milioni di punti dati) per addestrare efficacemente le reti profonde. Le prestazioni dipendono molto dalla scala dei dati.

Requisiti hardware

Varia. L'AI semplice può essere eseguita su hardware di base.

Spesso può essere eseguito su CPU standard, anche se i modelli complessi traggono vantaggio da una maggiore potenza di calcolo.

In genere richiede computing ad alte prestazioni, in particolare GPU o TPU, per un addestramento efficiente a causa di calcoli paralleli massivi.

Feature engineering


Dipende dal metodo utilizzato.

Spesso richiede una significativa feature engineering manuale. Gli esseri umani devono selezionare, trasformare e creare caratteristiche di input pertinenti dai dati non elaborati per aiutare l'algoritmo ad apprendere.

Esegue l'estrazione delle caratteristiche in modo automatico. La rete apprende le caratteristiche pertinenti in modo gerarchico attraverso i suoi strati direttamente dai dati non elaborati, riducendo la necessità di eseguire manualmente la progettazione delle caratteristiche.

Tempo di addestramento

N/A per l'AI non di apprendimento. Varia molto per l'AI basata su ML/DL.

Può variare da secondi a ore, generalmente più veloce del DL per le attività in cui l'ML è adatto.

Spesso richiede tempi di addestramento molto lunghi (ore, giorni o persino settimane) a causa di set di dati di grandi dimensioni e architetture di rete complesse.

Interpretabilità

Varia. I sistemi basati su regole possono essere altamente interpretabili. L'AI che utilizza ML/DL complessi può essere difficile da interpretare.

Varia. I modelli più semplici (ad esempio, alberi decisionali, regressione lineare) sono relativamente più interpretabili. I modelli complessi (ad esempio, i metodi di ensemble) potrebbero esserlo meno.

Spesso manca la trasparenza. Comprendere perché un modello di deep learning ha preso una decisione specifica può essere difficile a causa della complessità e della quantità di parametri.

Casi d'uso ed esempi principali


Sistemi esperti, programmi di scacchi, risolutori di problemi generali, concetti generali per assistenti virtuali e auto a guida autonoma.

Sistemi di suggerimenti nell'e-commerce o nei servizi di streaming, filtri antispam, manutenzione predittiva, diagnosi mediche da dati strutturati, previsione dell'abbandono dei clienti.

Riconoscimento delle immagini (tagging di foto), elaborazione del linguaggio naturale (traduzione, analisi del sentiment), riconoscimento vocale (assistenti vocali), sistemi di percezione dei veicoli autonomi, analisi avanzata delle immagini mediche.

Funzionalità

Intelligenza artificiale

Machine learning

Deep learning

Ambito e definizione

Concetto più ampio. Campo dedicato alla creazione di sistemi o macchine in grado di eseguire attività che in genere richiedono l'intelligenza umana (ad esempio: ragionamento, risoluzione di problemi, apprendimento, percezione).

Un sottoinsieme dell'AI. Si concentra sullo sviluppo di sistemi in grado di apprendere dai dati e prendere decisioni in base a essi, senza essere programmati esplicitamente per ogni scenario.

Un sottoinsieme dell'ML. Utilizza reti neurali artificiali (ANN) a più livelli per apprendere pattern complessi e rappresentazioni gerarchiche direttamente da grandi quantità di dati non elaborati.

Obiettivo


Simulare o replicare l'intelligenza umana nelle macchine.

Per consentire alle macchine di apprendere dai dati per eseguire attività specifiche in modo accurato.

Per ottenere una maggiore accuratezza e gestire pattern più complessi (soprattutto nei dati non strutturati) apprendendo automaticamente le caratteristiche dai dati utilizzando reti neurali profonde.

Metodo

Può utilizzare varie tecniche: logica, sistemi basati su regole, algoritmi di ricerca, ottimizzazione e, forse cosa più importante, machine learning e deep learning.

Utilizza algoritmi (ad esempio: regressione lineare, SVM, alberi decisionali, foreste casuali) per analizzare i dati, imparare da essi e prendere decisioni o fare previsioni informate.

Utilizza reti neurali artificiali complesse e a più livelli (ispirate alla struttura del cervello umano) con molti parametri.

Requisiti dei dati

Varia molto. L'AI basata su regole potrebbe aver bisogno di pochi dati, mentre l'AI basata su ML/DL ha bisogno di una quantità significativa di dati.

Richiede grandi quantità di dati strutturati o etichettati per addestrare gli algoritmi in modo efficace. In genere, le prestazioni migliorano con più dati.

Richiede set di dati molto grandi (spesso milioni di punti dati) per addestrare efficacemente le reti profonde. Le prestazioni dipendono molto dalla scala dei dati.

Requisiti hardware

Varia. L'AI semplice può essere eseguita su hardware di base.

Spesso può essere eseguito su CPU standard, anche se i modelli complessi traggono vantaggio da una maggiore potenza di calcolo.

In genere richiede computing ad alte prestazioni, in particolare GPU o TPU, per un addestramento efficiente a causa di calcoli paralleli massivi.

Feature engineering


Dipende dal metodo utilizzato.

Spesso richiede una significativa feature engineering manuale. Gli esseri umani devono selezionare, trasformare e creare caratteristiche di input pertinenti dai dati non elaborati per aiutare l'algoritmo ad apprendere.

Esegue l'estrazione delle caratteristiche in modo automatico. La rete apprende le caratteristiche pertinenti in modo gerarchico attraverso i suoi strati direttamente dai dati non elaborati, riducendo la necessità di eseguire manualmente la progettazione delle caratteristiche.

Tempo di addestramento

N/A per l'AI non di apprendimento. Varia molto per l'AI basata su ML/DL.

Può variare da secondi a ore, generalmente più veloce del DL per le attività in cui l'ML è adatto.

Spesso richiede tempi di addestramento molto lunghi (ore, giorni o persino settimane) a causa di set di dati di grandi dimensioni e architetture di rete complesse.

Interpretabilità

Varia. I sistemi basati su regole possono essere altamente interpretabili. L'AI che utilizza ML/DL complessi può essere difficile da interpretare.

Varia. I modelli più semplici (ad esempio, alberi decisionali, regressione lineare) sono relativamente più interpretabili. I modelli complessi (ad esempio, i metodi di ensemble) potrebbero esserlo meno.

Spesso manca la trasparenza. Comprendere perché un modello di deep learning ha preso una decisione specifica può essere difficile a causa della complessità e della quantità di parametri.

Casi d'uso ed esempi principali


Sistemi esperti, programmi di scacchi, risolutori di problemi generali, concetti generali per assistenti virtuali e auto a guida autonoma.

Sistemi di suggerimenti nell'e-commerce o nei servizi di streaming, filtri antispam, manutenzione predittiva, diagnosi mediche da dati strutturati, previsione dell'abbandono dei clienti.

Riconoscimento delle immagini (tagging di foto), elaborazione del linguaggio naturale (traduzione, analisi del sentiment), riconoscimento vocale (assistenti vocali), sistemi di percezione dei veicoli autonomi, analisi avanzata delle immagini mediche.

Fai il prossimo passo

Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.

Google Cloud