• Temas
  • ¿Qué son las analíticas de streaming?

¿Qué son las analíticas de streaming?

Las analíticas de streaming consisten en procesar y analizar los registros de datos de forma continua en lugar de por lotes. Suelen resultar muy útiles con las fuentes que envían datos de pequeño tamaño (a menudo, kilobytes) a medida que se generan en un flujo constante.

Obtén información sobre Dataflow, el servicio de procesamiento unificado de datos de streaming y por lotes de Google Cloud.

Información general sobre las analíticas de streaming

Las analíticas de streaming pueden incluir una amplia variedad de fuentes de datos, como telemetría de dispositivos conectados, archivos de registro que generan los clientes mientras usan aplicaciones web, transacciones de comercio electrónico o información de redes sociales o servicios geoespaciales. Con frecuencia, se utilizan en la agregación y la correlación en tiempo real, el filtrado o el muestreo.

Desde siempre, los datos se han transferido por lotes. El procesamiento por lotes suele manejar grandes volúmenes de datos al mismo tiempo, lo cual provoca periodos largos de latencia. Por ejemplo, ejecutar un proceso cada 24 horas puede ser un método eficiente para gestionar grandes volúmenes de datos. Sin embargo, no vale si el tiempo es un factor decisivo y los datos están concebidos para enviarse en streaming, ya que, cuando se procesen, quizá estén obsoletos.

¿Cómo se optimizan las analíticas de streaming?

Cuando las empresas recogen datos de unos cientos de miles o incluso unos millones de eventos por segundo, el resultado son unos conjuntos de datos absolutamente desproporcionados. Con los sistemas tradicionales, se pueden tardar días en extraer información valiosa de datos de tal magnitud.

Para emprender acciones en tiempo real, tienes que procesar y analizar los datos en tiempo real, lo cual es factible si utilizas la plataforma y la infraestructura de flujos de datos adecuadas. Por ejemplo, las analíticas de streaming integradas en los productos y servicios de Google Cloud permiten que las empresas ingieran, procesen y analicen los flujos de datos en tiempo real.

¿Cuáles son los usos de las analíticas de streaming?

Las empresas emplean las analíticas de streaming para analizar datos en tiempo real y aportar información valiosa sobre numerosas acciones, como mediciones, actividad de servidores, geolocalización de dispositivos o clics en sitios web. Estos son algunos de los usos más probables:

Comercio electrónico

Analiza los flujos de clics de los usuarios para optimizar la experiencia de compra ofertando rebajas y promociones en tiempo real, a la vez que gestionas el inventario.

Servicios financieros

Analiza la actividad de las cuentas para detectar comportamientos anómalos en los flujos de datos y, en ese caso, emitir alertas de seguridad.

Sociedades de inversión

Haz el seguimiento de las variaciones en el mercado y amolda los ajustes a las carteras de los clientes basándote en las restricciones configuradas; por ejemplo, vender ciertas acciones cuando alcancen una cotización concreta.

Medios de comunicación

Envía en streaming los registros de clics de usuarios procedentes de distintas plataformas de fuentes de noticias y enriquece los datos con información demográfica para servir artículos relevantes a la audiencia objetivo con más acierto.

Servicios públicos

Monitoriza el rendimiento de la red eléctrica para que, si se alcanzan los umbrales definidos, se emitan alertas o se inicien flujos de trabajo.

Gracias a las analíticas de streaming de Google Cloud, los datos están más organizados y son más útiles. Además, puedes acceder a ellos desde el instante en que se generan. Las analíticas de streaming de Google Cloud se basan en la infraestructura con autoescalado de Pub/Sub, Dataflow y BigQuery. Aprovisionan los recursos necesarios para ingerir, procesar y analizar volúmenes variables de datos en tiempo real, lo que te permite extraer información empresarial valiosa y tomar medidas también en tiempo real. Ese aprovisionamiento generalizado no solo reduce la complejidad, sino que facilita que tanto analistas como ingenieros de datos hagan analíticas de streaming.