• Sujets
  • Qu'est-ce que l'analyse de flux ?

Qu'est-ce que l'analyse de flux ?

L'analyse de flux est le traitement et l'analyse des enregistrements de données en continu plutôt que par lot. En général, l'analyse de flux est utile avec les types de sources de données qui envoient des données de petite taille (souvent en kilo-octets) sous forme de flux continu au fur et à mesure que les données sont générées.

Découvrez Dataflow, le service de traitement unifié des données par flux et par lot de Google Cloud.

Présentation de l'analyse de flux

L'analyse de flux peut inclure une grande variété de sources de données, telles que la télémétrie à partir d'appareils connectés, les fichiers journaux générés par les clients utilisant des applications Web, les transactions e-commerce ou les informations provenant de réseaux sociaux ou de services géospatiaux. Elle est souvent utilisée pour l'agrégation et la corrélation en temps réel, le filtrage et l'échantillonnage.

Les données sont traditionnellement déplacées par lots. Le traitement par lot traite souvent d'importants volumes de données en même temps, avec de longues périodes de latence. Un processus peut par exemple être exécuté toutes les 24 heures. Bien que cette méthode puisse être efficace pour gérer d'importants volumes de données, elle ne fonctionne pas avec les données "urgentes" qui doivent être transmises en direct, car ces données risquent de ne plus être d'actualité une fois leur traitement terminé.

Comment optimiser l'analyse de flux ?

Lorsque les entreprises collectent des données au rythme de centaines de milliers, voire de millions d'événements par seconde, on obtient des ensembles de données absolument gigantesques. À cette échelle, les systèmes traditionnels peuvent nécessiter plusieurs jours pour dégager des insights de ces données.

Pour générer des actions en temps réel, vous devez procéder à un traitement et une analyse des données en temps réel. Cela est possible avec la bonne infrastructure et plate-forme de flux de données. L'analyse de flux basée sur les produits et services Google Cloud, par exemple, permet aux entreprises d'ingérer, de traiter et d'analyser des flux de données en temps réel.

Cas d'utilisation de l'analyse de flux

Les entreprises utilisent l'analyse de flux pour analyser des données en temps réel et fournir des insights sur toute une palette d'activités, telles que les mesures, l'activité de serveurs, la géolocalisation d'appareils ou les clics sur des sites Web. Voici quelques cas d'utilisation possibles :

E-commerce

Analysez les flux de clics des utilisateurs pour optimiser l'expérience d'achat avec une tarification, des promotions et une gestion de l'inventaire en temps réel.

Services financiers

Analysez l'activité du compte pour détecter toute anomalie dans les flux de données et générer une alerte de sécurité en cas de comportement anormal.

Services d'investissement

Surveillez les évolutions du marché et ajustez les paramètres aux portefeuilles clients en fonction de contraintes configurées, telles que la vente lorsqu'une action atteint une certaine valeur.

Médias d'actualités

Importez les enregistrements de clics d'utilisateurs par flux depuis différentes plates-formes de médias d'actualités et enrichissez les données avec des données démographiques pour diffuser les articles les plus adaptés à l'audience cible.

Énergie

Surveillez le débit sur un réseau électrique et générez des alertes ou lancez des workflows lorsque les seuils établis sont atteints.

Les analyses de flux de Google Cloud permettent de mieux organiser les données, et de les rendre utiles et accessibles dès qu'elles sont générées. Basée sur l'infrastructure d'autoscaling de Pub/Sub, Dataflow et BigQuery, l'analyse de flux de Google Cloud assure le provisionnement des ressources dont vous avez besoin pour ingérer, traiter et analyser des volumes variables de données en temps réel pour obtenir instantanément des insights métier et prendre les mesures qui s'imposent. Ce provisionnement distinct réduit la complexité, et rend les analyses de flux accessibles aux analystes et aux ingénieurs de données.