Quelle est la différence entre le deep learning, le machine learning et l'intelligence artificielle ?

L'intelligence artificielle est un vaste domaine qui englobe de nombreux termes et concepts interconnectés. Elle est souvent utilisée comme un terme fourre-tout désignant n'importe quel type de machine intelligente. En réalité, l'intelligence artificielle, le machine learning et le deep learning sont des termes distincts qui présentent de légères différences. 

Pour mieux comprendre comment l'intelligence artificielle et le machine learning peuvent aider votre entreprise, consultez cette page sur les produits et solutions d'IA et de ML de Google Cloud.

Les nouveaux clients bénéficient d'un maximum de 300 $ de crédits offerts pour essayer Vertex AI et d'autres produits Google Cloud. 

Pour en savoir plus sur la relation entre l'IA, le deep learning et le machine learning, poursuivez votre lecture.

Qu'est-ce que le deep learning ?

Le deep learning est un sous-domaine du machine learning qui utilise des réseaux de neurones artificiels pour traiter et analyser des informations. Les réseaux de neurones sont composés de nœuds de calcul superposés à des algorithmes de deep learning. Chaque couche contient une couche d'entrée, une couche de sortie et une couche cachée. Le réseau de neurones reçoit des données d'entraînement qui aident l'algorithme à apprendre et à améliorer la précision. Lorsqu'un réseau de neurones contient plusieurs couches cachées en plus de ses couches d'entrée et de sortie, il est considéré comme un réseau de neurones profond, qui est le fondement du deep learning.

Les algorithmes de deep learning s'inspirent du fonctionnement du cerveau humain et sont particulièrement efficaces pour analyser de grandes quantités de données non structurées. Le deep learning est utilisé dans de nombreuses tâches que nous considérons aujourd'hui comme l'IA, y compris la reconnaissance d'images et vocale, la détection d'objets et le traitement du langage naturel. Le deep learning est capable d'établir des corrélations non linéaires et complexes au sein d'ensembles de données. Toutefois, il nécessite plus de données d'entraînement et de ressources de calcul que le machine learning.

Voici quelques types de réseaux de neurones couramment utilisés pour le deep learning :

  • Les réseaux de neurones feedforward (FF) sont l'une des plus anciennes formes de réseaux de neurones. Les données circulent dans un sens à travers les couches de neurones artificiels jusqu'à leur sortie.
  • Les réseaux de neurones récurrents (RNN) sont différents des réseaux de neurones feedforward, car ils utilisent généralement des données de séries temporelles ou impliquant des séquences. Les réseaux de neurones récurrents disposent de la "mémoire" de ce qui s'est produit au niveau de la couche précédente en tant que composant de la sortie de la couche actuelle.
  • Le réseau de neurones récurrents à mémoire longue à court terme (LSTM) est une forme avancée de RNN qui peut utiliser la mémoire pour "se souvenir" de ce qui s'est passé aux couches précédentes.
  • Les réseaux de neurones convolutifs incluent certains des réseaux de neurones les plus courants de l'intelligence artificielle moderne et utilisent plusieurs couches distinctes (une couche convolutive, puis une couche de pooling) qui filtrent différentes parties d'une image avant de la reconstituer (dans la couche entièrement connectée).
  • Les réseaux antagonistes génératifs (GAN) impliquent deux réseaux de neurones (un "générateur" et un "discriminateur") qui s'affrontent dans un jeu qui, au final, améliore la justesse du résultat.

Qu'est-ce que le machine learning ?

Le machine learning est un sous-domaine de l'intelligence artificielle qui permet à un système d'apprendre et de s'améliorer de manière autonome, sans être explicitement programmé. Les algorithmes de machine learning reconnaissent des modèles et des données, et effectuent des prédictions lorsque de nouvelles données sont entrées dans le système.

Plusieurs modèles différents sont généralement utilisés en machine learning, y compris :

Apprentissage supervisé

L'apprentissage supervisé est un modèle de machine learning qui utilise des données d'entraînement étiquetées (données structurées) pour mapper une entrée spécifique à une sortie. Dans l'apprentissage supervisé, la sortie est connue (par exemple, la reconnaissance de l'image d'une pomme), et le modèle est entraîné sur les données de ces résultats. En d'autres termes, pour entraîner l'algorithme à reconnaître des images de pommes, il faut lui fournir des images étiquetées comme étant des pommes.

Les algorithmes d'apprentissage supervisé les plus couramment utilisés aujourd'hui sont les suivants :

  • Régression linéaire
  • K plus proches voisins
  • Naive Bayes
  • Régression polynomiale
  • Arbres de décision

Apprentissage non supervisé

L'apprentissage non supervisé est un modèle de machine learning qui utilise des données non étiquetées (données non structurées) pour apprendre des schémas. Contrairement à l'apprentissage supervisé, la sortie n'est pas connue à l'avance. L'algorithme apprend à partir des données sans intervention humaine (et donc sans supervision) et les classe par groupes en fonction d'attributs. 

Les algorithmes d'apprentissage non supervisé les plus couramment utilisés aujourd'hui sont les suivants :

  • Moyennes partielles
  • Partitionnement en k-moyennes
  • Clustering hiérarchique
  • Analyse des composants principaux
  • Moindres carrés partiels

Apprentissage partiellement supervisé

Nous employons également souvent une approche mixte appelée "apprentissage partiellement supervisé", dans laquelle seule une partie des données est étiquetée. Dans l'apprentissage partiellement supervisé, l'algorithme doit déterminer comment organiser et structurer les données pour obtenir un résultat connu. Par exemple, on dit au modèle de machine learning que le résultat final est une pomme, mais seules certaines des données d'entraînement sont étiquetées en tant que pomme.

Apprentissage par renforcement

L'apprentissage par renforcement est un modèle de machine learning que l'on peut décrire comme un "apprentissage par la pratique" au travers d'une série de tests et d'erreurs. Un "agent" apprend à exécuter une tâche définie de manière empirique (boucle de rétroaction) jusqu'à ce que ses performances se situent dans une plage souhaitée. L'agent reçoit un renforcement positif lorsqu'il effectue bien la tâche, et un renforcement négatif lorsqu'il se trompe. 

Qu'est-ce que l'intelligence artificielle ?

L'intelligence artificielle est un domaine scientifique qui vise à créer des ordinateurs et des machines capables de raisonner, d'apprendre et d'agir d'une manière qui nécessiterait normalement l'intelligence humaine ou qui implique des données dont l'échelle dépasse ce que les humains peuvent analyser. L'IA est un vaste domaine qui englobe de nombreuses disciplines, dont l'informatique, les données et l'analyse, l'ingénierie logicielle et même la philosophie.

Au niveau de l'entreprise, l'IA est un ensemble de technologies qui couvre de nombreux cas d'utilisation : analyse de données, prédictions et prévisions, traitement du langage naturel, recommandations, automatisation des machines, récupération intelligente des données, etc.

Intelligence artificielle, machine learning et deep learning

Bien que ces termes soient liés, ils représentent une hiérarchie claire : le deep learning est un type spécialisé de machine learning, et le machine learning est une discipline fondamentale dans le domaine plus vaste de l'intelligence artificielle. La principale distinction réside dans les capacités, la complexité et l'ingénierie des caractéristiques. 

Fonctionnalité

Intelligence artificielle

Machine learning

Deep learning

Champ d'application et définition

Concept le plus large. Domaine consacré à la création de systèmes ou de machines capables d'effectuer des tâches qui nécessitent généralement une intelligence humaine (par exemple, le raisonnement, la résolution de problèmes, l'apprentissage et la perception).

Sous-ensemble de l'IA. Il s'agit de développer des systèmes capables d'apprendre à partir des données et de prendre des décisions en fonction de celles-ci, sans être explicitement programmés pour chaque scénario.

Sous-ensemble du ML. Utilise des réseaux de neurones artificiels (ANN) multicouches pour apprendre des schémas complexes et des représentations hiérarchiques directement à partir de grandes quantités de données brutes.

Objectif


Simuler ou reproduire l'intelligence humaine dans des machines

Permettre aux machines d'apprendre à partir de données pour accomplir des tâches spécifiques avec précision.

Pour obtenir une plus grande justesse et gérer des schémas plus complexes (en particulier dans les données non structurées) en apprenant automatiquement des caractéristiques à partir des données à l'aide de réseaux de neurones profonds.

Méthode

Peut utiliser différentes techniques : logique, systèmes basés sur des règles, algorithmes de recherche, optimisation et, surtout, machine learning et deep learning.

Utilise des algorithmes (par exemple, régression linéaire, SVM, arbres de décision, forêts d'arbres décisionnels) pour analyser les données, en tirer des enseignements et prendre des décisions ou faire des prédictions éclairées.

Utilise des réseaux de neurones artificiels complexes à plusieurs couches (inspirés de la structure du cerveau humain) avec de nombreux paramètres.

Exigences en matière de données

Très variable. L'IA basée sur des règles peut nécessiter peu de données, tandis que l'IA basée sur le ML/DL a besoin d'une quantité importante de données.

Nécessite de grandes quantités de données structurées ou étiquetées pour entraîner efficacement les algorithmes. En général, plus vous disposez de données, plus vos performances s'améliorent.

Nécessite des ensembles de données très volumineux (souvent des millions de points de données) pour entraîner efficacement les réseaux profonds. Les performances dépendent fortement de l'échelle des données.

Configuration matérielle requise

Variable. L'IA simple peut s'exécuter sur du matériel de base.

Peut souvent s'exécuter sur des processeurs standards, mais les modèles complexes bénéficient d'une puissance de calcul plus élevée.

Nécessite généralement un calcul hautes performances, en particulier des GPU ou des TPU, pour un entraînement efficace en raison des calculs parallèles massifs.

Ingénierie des caractéristiques


Dépend de la méthode utilisée.

Nécessite souvent une ingénierie des caractéristiques manuelle importante. Les humains doivent sélectionner, transformer et créer des caractéristiques d'entrée pertinentes à partir des données brutes pour aider l'algorithme à apprendre.

Extrait les caractéristiques automatiquement. Le réseau apprend les caractéristiques pertinentes de manière hiérarchique à travers ses couches directement à partir des données brutes, ce qui réduit le besoin d'ingénierie manuelle des caractéristiques.

Durée d'entraînement

Non applicable pour l'IA sans apprentissage. Varie considérablement pour l'IA basée sur le ML/DL.

Peut prendre de quelques secondes à quelques heures. Généralement plus rapide que le DL pour les tâches où le ML est adapté.

Nécessite souvent des temps d'entraînement très longs (heures, jours, voire semaines) en raison de la taille des ensembles de données et de la complexité des architectures réseau.

Interprétabilité

Variable Les systèmes basés sur des règles peuvent être très interprétables. L'IA utilisant des techniques de ML/DL complexes peut être difficile à interpréter.

Variable Les modèles plus simples (par exemple, les arbres de décision et la régression linéaire) sont relativement plus interprétables. Les modèles complexes (par exemple, les méthodes ensemblistes) peuvent l'être moins.

Manque souvent de transparence. Comprendre pourquoi un modèle de deep learning a pris une décision spécifique peut s'avérer difficile en raison de la complexité et du nombre de paramètres.

Principaux cas d'utilisation et exemples


Systèmes experts, programmes de jeu d'échecs, outils de résolution de problèmes généraux, concepts généraux pour les assistants virtuels et les voitures autonomes.

Systèmes de recommandation dans les services d'e-commerce ou de streaming, filtrage antispam, maintenance prédictive, diagnostic médical à partir de données structurées, prédiction de la perte de clients

Reconnaissance d'image (taggage de photos), traitement du langage naturel (traduction, analyse des sentiments), reconnaissance vocale (assistants vocaux), systèmes de perception des véhicules autonomes, analyse avancée d'images médicales.

Fonctionnalité

Intelligence artificielle

Machine learning

Deep learning

Champ d'application et définition

Concept le plus large. Domaine consacré à la création de systèmes ou de machines capables d'effectuer des tâches qui nécessitent généralement une intelligence humaine (par exemple, le raisonnement, la résolution de problèmes, l'apprentissage et la perception).

Sous-ensemble de l'IA. Il s'agit de développer des systèmes capables d'apprendre à partir des données et de prendre des décisions en fonction de celles-ci, sans être explicitement programmés pour chaque scénario.

Sous-ensemble du ML. Utilise des réseaux de neurones artificiels (ANN) multicouches pour apprendre des schémas complexes et des représentations hiérarchiques directement à partir de grandes quantités de données brutes.

Objectif


Simuler ou reproduire l'intelligence humaine dans des machines

Permettre aux machines d'apprendre à partir de données pour accomplir des tâches spécifiques avec précision.

Pour obtenir une plus grande justesse et gérer des schémas plus complexes (en particulier dans les données non structurées) en apprenant automatiquement des caractéristiques à partir des données à l'aide de réseaux de neurones profonds.

Méthode

Peut utiliser différentes techniques : logique, systèmes basés sur des règles, algorithmes de recherche, optimisation et, surtout, machine learning et deep learning.

Utilise des algorithmes (par exemple, régression linéaire, SVM, arbres de décision, forêts d'arbres décisionnels) pour analyser les données, en tirer des enseignements et prendre des décisions ou faire des prédictions éclairées.

Utilise des réseaux de neurones artificiels complexes à plusieurs couches (inspirés de la structure du cerveau humain) avec de nombreux paramètres.

Exigences en matière de données

Très variable. L'IA basée sur des règles peut nécessiter peu de données, tandis que l'IA basée sur le ML/DL a besoin d'une quantité importante de données.

Nécessite de grandes quantités de données structurées ou étiquetées pour entraîner efficacement les algorithmes. En général, plus vous disposez de données, plus vos performances s'améliorent.

Nécessite des ensembles de données très volumineux (souvent des millions de points de données) pour entraîner efficacement les réseaux profonds. Les performances dépendent fortement de l'échelle des données.

Configuration matérielle requise

Variable. L'IA simple peut s'exécuter sur du matériel de base.

Peut souvent s'exécuter sur des processeurs standards, mais les modèles complexes bénéficient d'une puissance de calcul plus élevée.

Nécessite généralement un calcul hautes performances, en particulier des GPU ou des TPU, pour un entraînement efficace en raison des calculs parallèles massifs.

Ingénierie des caractéristiques


Dépend de la méthode utilisée.

Nécessite souvent une ingénierie des caractéristiques manuelle importante. Les humains doivent sélectionner, transformer et créer des caractéristiques d'entrée pertinentes à partir des données brutes pour aider l'algorithme à apprendre.

Extrait les caractéristiques automatiquement. Le réseau apprend les caractéristiques pertinentes de manière hiérarchique à travers ses couches directement à partir des données brutes, ce qui réduit le besoin d'ingénierie manuelle des caractéristiques.

Durée d'entraînement

Non applicable pour l'IA sans apprentissage. Varie considérablement pour l'IA basée sur le ML/DL.

Peut prendre de quelques secondes à quelques heures. Généralement plus rapide que le DL pour les tâches où le ML est adapté.

Nécessite souvent des temps d'entraînement très longs (heures, jours, voire semaines) en raison de la taille des ensembles de données et de la complexité des architectures réseau.

Interprétabilité

Variable Les systèmes basés sur des règles peuvent être très interprétables. L'IA utilisant des techniques de ML/DL complexes peut être difficile à interpréter.

Variable Les modèles plus simples (par exemple, les arbres de décision et la régression linéaire) sont relativement plus interprétables. Les modèles complexes (par exemple, les méthodes ensemblistes) peuvent l'être moins.

Manque souvent de transparence. Comprendre pourquoi un modèle de deep learning a pris une décision spécifique peut s'avérer difficile en raison de la complexité et du nombre de paramètres.

Principaux cas d'utilisation et exemples


Systèmes experts, programmes de jeu d'échecs, outils de résolution de problèmes généraux, concepts généraux pour les assistants virtuels et les voitures autonomes.

Systèmes de recommandation dans les services d'e-commerce ou de streaming, filtrage antispam, maintenance prédictive, diagnostic médical à partir de données structurées, prédiction de la perte de clients

Reconnaissance d'image (taggage de photos), traitement du langage naturel (traduction, analyse des sentiments), reconnaissance vocale (assistants vocaux), systèmes de perception des véhicules autonomes, analyse avancée d'images médicales.

Passez à l'étape suivante

Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.

  • Faites des économies grâce à notre approche transparente concernant la tarification
  • Le paiement à l'usage de Google Cloud permet de réaliser des économies automatiques basées sur votre utilisation mensuelle et des tarifs réduits pour les ressources prépayées. Contactez-nous dès aujourd'hui afin d'obtenir un devis.
Google Cloud