Qu'est-ce que l'analyse de flux ?
L'analyse de flux est le traitement et l'analyse des enregistrements de données en continu plutôt que par lot. En général, l'analyse de flux est utile avec les types de sources de données qui envoient des données de petite taille (souvent en kilo-octets) sous forme de flux continu au fur et à mesure que les données sont générées.
Découvrez Dataflow, le service de traitement unifié des données par flux et par lot de Google Cloud.
Présentation de l'analyse de flux
L'analyse de flux peut inclure une grande variété de sources de données, telles que la télémétrie à partir d'appareils connectés, les fichiers journaux générés par les clients utilisant des applications Web, les transactions e-commerce ou les informations provenant de réseaux sociaux ou de services géospatiaux. Elle est souvent utilisée pour l'agrégation et la corrélation en temps réel, le filtrage et l'échantillonnage.
Les données sont traditionnellement déplacées par lots. Le traitement par lot traite souvent d'importants volumes de données en même temps, avec de longues périodes de latence. Un processus peut par exemple être exécuté toutes les 24 heures. Bien que cette méthode puisse être efficace pour gérer d'importants volumes de données, elle ne fonctionne pas avec les données "urgentes" qui doivent être transmises en direct, car ces données risquent de ne plus être d'actualité une fois leur traitement terminé.
Relevez vos plus grands défis avec Google Cloud
Comment optimiser l'analyse de flux ?
Lorsque les entreprises collectent des données au rythme de centaines de milliers, voire de millions d'événements par seconde, on obtient des ensembles de données absolument gigantesques. À cette échelle, les systèmes traditionnels peuvent nécessiter plusieurs jours pour dégager des insights de ces données.
Pour générer des actions en temps réel, vous devez procéder à un traitement et une analyse des données en temps réel. Cela est possible avec la bonne infrastructure et plate-forme de flux de données. L'analyse de flux basée sur les produits et services Google Cloud, par exemple, permet aux entreprises d'ingérer, de traiter et d'analyser des flux de données en temps réel.
Cas d'utilisation de l'analyse de flux
E-commerce
Analysez les flux de clics des utilisateurs pour optimiser l'expérience d'achat avec une tarification, des promotions et une gestion de l'inventaire en temps réel.
Services financiers
Analysez l'activité du compte pour détecter toute anomalie dans les flux de données et générer une alerte de sécurité en cas de comportement anormal.
Services d'investissement
Surveillez les évolutions du marché et ajustez les paramètres aux portefeuilles clients en fonction de contraintes configurées, telles que la vente lorsqu'une action atteint une certaine valeur.
Médias d'actualités
Importez les enregistrements de clics d'utilisateurs par flux depuis différentes plates-formes de médias d'actualités et enrichissez les données avec des données démographiques pour diffuser les articles les plus adaptés à l'audience cible.
Utilitaires
Surveillez le débit sur un réseau électrique et générez des alertes ou lancez des workflows lorsque les seuils établis sont atteints.
Produits et services associés
Les analyses de flux de Google Cloud permettent de mieux organiser les données, et de les rendre utiles et accessibles dès qu'elles sont générées. Basée sur l'infrastructure d'autoscaling de Pub/Sub, Dataflow et BigQuery, l'analyse de flux de Google Cloud assure le provisionnement des ressources dont vous avez besoin pour ingérer, traiter et analyser des volumes variables de données en temps réel pour obtenir instantanément des insights métier et prendre les mesures qui s'imposent. Ce provisionnement distinct réduit la complexité, et rend les analyses de flux accessibles aux analystes et aux ingénieurs de données.