Qu'est-ce que le machine learning ?

Le machine learning est une fonctionnalité qui permet à des logiciels d'effectuer une tâche sans programmation ni règles explicites. Généralement considéré comme une sous-catégorie de l'intelligence artificielle, le machine learning implique des techniques statistiques, comme le deep learning (c'est-à-dire des réseaux de neurones), qui s'inspirent de théories sur le mode de traitement des informations par le cerveau humain.

Comment le machine learning fonctionne-t-il ?

Le machine learning repose sur des modèles algorithmiques entraînés à reconnaître des schémas dans les données collectées (par exemple, des journaux, du son, du texte ou des images). Comme l'accès à une grande quantité de données d'entraînement et une forte puissance de calcul sont des conditions préalables au succès, le cloud (dans lequel les capacités de stockage des données et de calcul hautes performances sont importantes et peuvent être particulièrement rentables) constitue une plate-forme idéale pour le machine learning.

Quels exemples de machine learning peut-on donner ?

Les exemples de machine learning sont nombreux dans la vie de tous les jours. Un exemple très simple est la saisie semi-automatique de noms, de mots clés ou d'adresses dans un champ de recherche, mais le même concept peut être appliqué à des cas d'utilisation plus complexes dans divers secteurs. Par exemple, le machine learning permet d'effectuer les opérations suivantes :

  • Classer des images (comme des examens d'IRM, des photos ou des images satellites)
  • Rechercher des mots clés dans un nombre considérable de documents texte ou d'e-mails
  • Signaler des transactions potentiellement frauduleuses
  • Personnaliser des recommandations de produits en fonction du comportement des clients
  • Permettre aux logiciels de répondre de manière adéquate à des commandes vocales
  • Prédire des situations météorologiques ou d'autres conditions climatiques
  • Traduire des langues dans du texte ou des contenus audio

En résumé, dès lors qu'un logiciel effectue une tâche très fastidieuse à une échelle qui dépasse la capacité humaine, le machine learning peut être sollicité.

Comment le machine learning est-il exploité au sein de Google ?

Le machine learning est la pierre angulaire des systèmes internes de Google depuis des années, principalement en raison de notre besoin d'automatiser des systèmes basés sur les données à très grande échelle. Cette expérience nous offre un aperçu unique des techniques, de l'infrastructure, des données et des frameworks à utiliser pour que les clients puissent tirer profit du machine learning.

Par exemple, le framework Open Source nommé TensorFlow, mis au point à l'origine afin d'être utilisé en interne par Google, est désormais un standard dans la communauté des sciences de données, donnant aux utilisateurs la possibilité de créer et d'entraîner des modèles puissants. Non seulement nos centaines de chercheurs en machine learning contribuent fortement aux communautés Open Source et académiques, mais il participent également à la mise en œuvre de cette fonctionnalité dans les produits Google (comme G Suite, Photos et Recherche) en plus des opérations internes de Google (pour l'automatisation des centres de données, par exemple).

Comment introduire le machine learning dans mon organisation ?

Relevant autrefois des domaines exotiques des statistiques et de la science des données, les fonctionnalités du machine learning sont désormais largement accessibles sous la forme de bibliothèques Open Source (TensorFlow), ainsi que de services gérés et d'API Cloud. Pour les data scientists qui souhaitent créer des modèles évolutifs pouvant passer de l'infrastructure sur site au cloud et vice versa, ou pour les développeurs traditionnels qui ne disposent pas d'assez de données d'entraînement adéquates et souhaitent utiliser un modèle pré-entraîné/prédéfini dans leur application via une API Cloud, l'utilisation de ces outils au quotidien est un objectif réaliste.

En savoir plus :