Qu'est-ce que le machine learning ?

Le machine learning est une fonctionnalité qui permet à des logiciels d'effectuer une tâche sans programmation ni règles explicites. Généralement considéré comme une sous-catégorie de l'intelligence artificielle, le machine learning fait appel à des techniques statistiques, comme le deep learning (c'est-à-dire des réseaux de neurones), qui s'inspirent de théories sur le mode de traitement des informations par le cerveau humain.

Comment le machine learning fonctionne-t-il ?

Le machine learning repose sur des modèles algorithmiques entraînés à reconnaître des schémas dans les données collectées (par exemple, des journaux, de la parole, du texte ou des images). Pour être efficace, le machine learning nécessite un accès à une grande quantité de données d'entraînement, ainsi qu'une forte puissance de calcul. C'est pourquoi le cloud constitue une plate-forme idéale pour le machine learning, car il offre des capacités importantes de stockage des données et de calcul hautes performances, à un coût avantageux.

Quels exemples de machine learning peut-on donner ?

Les exemples de machine learning sont nombreux dans la vie de tous les jours. Un exemple très simple est la saisie semi-automatique de noms, de mots clés ou d'adresses dans un champ de recherche, mais le même concept peut être appliqué à des cas d'utilisation plus complexes dans divers secteurs. Par exemple, le machine learning permet d'effectuer les opérations suivantes :

  • Classer des images (comme des examens d'IRM, des photos ou des images satellite)
  • Rechercher des mots clés dans un nombre considérable de documents texte ou d'e-mails
  • Signaler des transactions potentiellement frauduleuses
  • Personnaliser des recommandations de produits en fonction du comportement des clients
  • Permettre aux logiciels de répondre de manière adéquate à des commandes vocales
  • Prédire des situations météorologiques ou d'autres conditions climatiques
  • Traduire des langues dans du texte ou des contenus audio

En résumé, dès lors qu'un logiciel effectue une tâche très fastidieuse à une échelle qui dépasse la capacité humaine, on peut faire appel au machine learning.

Comment le machine learning est-il exploité au sein de Google ?

Le machine learning est la pierre angulaire des systèmes internes de Google depuis des années, principalement en raison de notre besoin d'automatiser des systèmes basés sur les données à très grande échelle. Cette expérience nous procure de précieux enseignements sur les techniques, l'infrastructure, les données et les frameworks à mettre en œuvre pour permettre à nos clients de tirer profit du machine learning.

Par exemple, le framework Open Source nommé TensorFlow, initialement conçu pour un usage interne au sein de Google, est désormais un standard dans la communauté des data scientists. Il donne aux utilisateurs la possibilité de créer et d'entraîner des modèles performants. De même, nos centaines de chercheurs en machine learning contribuent non seulement de manière significative aux communautés universitaires et Open Source, mais aussi à l'intégration de cette fonctionnalité dans les produits Google (tels que Google Workspace, la recherche Google et Google Photos) en plus des opérations internes de Google (pour l'automatisation des centres de données, par exemple).

Comment introduire le machine learning dans mon organisation ?

Relevant autrefois des domaines exotiques des statistiques et de la science des données, les fonctionnalités du machine learning sont désormais largement accessibles sous la forme de bibliothèques Open Source (TensorFlow), ainsi que de services gérés et d'API Cloud. Pour les data scientists qui souhaitent créer des modèles évolutifs pouvant passer de l'infrastructure sur site au cloud et vice versa, ou pour les développeurs qui ne disposent pas d'assez de données d'entraînement et qui souhaitent utiliser un modèle pré-entraîné/prédéfini via une API Cloud, l'utilisation de ces outils au quotidien est un objectif réaliste.

En savoir plus :