Patrones de diseño de estadísticas de datos

Last reviewed 2023-02-06 UTC

En esta página, se proporcionan vínculos a casos de uso empresariales, códigos de muestra y guías de referencia técnica para casos de uso de estadísticas de datos de la industria. Usa estos recursos para aprender, identificar prácticas recomendadas a fin de acelerar la implementación de tus cargas de trabajo.

Los patrones de diseño que se enumeran aquí son casos de uso orientados al código y destinados a que puedas implementarlos con rapidez. Para ver una gama más amplia de soluciones de estadísticas, revisa la lista de guías de referencia técnica de análisis de datos.

Detección de anomalías

Solución Descripción Productos Vínculos

Encuentra anomalías en datos de series temporales mediante un codificador automático de LSTM

Usa esta implementación de referencia a fin de obtener información sobre cómo preprocesar los datos de series temporales para llenar los vacíos en los datos de origen y, luego, ejecutar los datos a través de un codificador automático de LSTM para identificar anomalías. El codificador automático se compila como un modelo de Keras que implementa una red neuronal de LSTM.

Código de muestra: Processing time-series data (Procesa datos de series temporales)

Detección de fraudes con tarjetas de crédito en tiempo real

Aprende cómo usar las transacciones y los datos de clientes para entrenar modelos de aprendizaje automático en BigQuery ML que se puedan usar en una canalización de datos en tiempo real con el fin de identificar, analizar y activar alertas para un posible fraude con tarjeta de crédito.

Código de muestra: Detección de fraudes con tarjetas de crédito en tiempo real

Video de descripción general: Fraudfinder: una solución integral para problemas reales de ciencia de datos

Modelado de fuerza relativa en series temporales para mercados de capital

Este patrón es particularmente relevante para los clientes de mercados de capitales y sus departamentos de análisis cuantitativo (Quants), ya que les permite hacer un seguimiento de sus indicadores técnicos en tiempo real a fin de tomar decisiones de inversión o hacer un seguimiento de los índices. Se basa en la detección de anomalías en series temporales, y puede aplicarse con facilidad a otras industrias, como la manufactura, a fin de detectar anomalías en las métricas de series temporales relevantes.

Código de muestra: Ejemplo de serie temporal de servicios financieros de Dataflow

Entrada de blog técnico y empresarial: Cómo detectar anomalías de aprendizaje automático en datos de intercambio extranjero en tiempo real

Entorno, redes sociales y administración

Solución Descripción Productos Links

Cálculo del riesgo físico del clima para las finanzas sustentables

Presentamos un patrón de diseño de estadísticas de riesgos meteorológicos para carteras de inversión y préstamos que usan herramientas nativas de la nube y conjuntos de datos geoespaciales detallados.

Descripción general técnica: Repositorio de Bitbucket de estadísticas de riesgos meteorológicos para carteras

Video de descripción general: Aprovecha las estadísticas de datos de ESG independientes

Entrada de blog: Quantifying portfolio climate risk for sustainable investing with geospatial analytics

Estadísticas generales

Solución Descripción Productos Vínculos

Compila un panel de estadísticas de sitios web en tiempo real

Obtén información sobre cómo compilar un panel que proporcione métricas en tiempo real que puedas usar para comprender el rendimiento de los incentivos o los experimentos en tu sitio web.

Código de muestra: Realtime Analytics using Dataflow and Memorystore (Estadísticas en tiempo real mediante Dataflow y Memorystore)

Video de descripción general: Level Up - Real-time analytics using Dataflow and Memorystore (Sube de nivel: Estadísticas en tiempo real mediante Dataflow y Memorystore)

Compila una canalización para transcribir y analizar archivos de voz

Aprende a transcribir y analizar archivos de voz subidos y, a continuación, guarda esos datos en BigQuery para usarlos en las visualizaciones.

Código de muestra: Speech Analysis Framework (Framework de análisis de voz)

Analiza datos no estructurados en almacenes de objetos

Obtén información sobre cómo analizar datos no estructurados en Cloud Storage, lo que permite analizar con funciones remotas, como Vertex AI Vision en imágenes. Aprende a realizar inferencias en datos no estructurados mediante BigQuery ML.

Guía de referencia técnica: Introducción a las tablas de objetos

Instructivo: Analiza una tabla de objetos con una función remota y la API de Cloud Vision

Instructivo: Ejecuta inferencias en tablas de objetos de imagen mediante TensorFlow y BigQuery ML

Analiza archivos de documentos no estructurados en un almacén de datos

Aprende a usar tablas de objetos y funciones remotas de BigLake para analizar documentos no estructurados con Document AI y guardar el resultado como datos estructurados en BigQuery.

Código de muestra: Análisis de documentos no estructurados en SQL

Compila un almacén de datos de administración de la experiencia

Obtén información para transformar los datos de encuestas en formatos que se pueden usar en un almacén de datos y obtener estadísticas más detalladas. Este patrón se aplica a la experiencia del cliente, la experiencia de los empleados y otros casos de uso enfocados en la experiencia.

Guía técnica de referencia: Genera estadísticas a partir de formularios de Google con un almacén de datos de encuestas

Código de muestra: Transforma y carga datos de encuestas en BigQuery mediante Dataprep de Trifacta

Entrada de blog: Crea un almacén de datos de administración de la experiencia (XM) con respuestas de encuestas

Video de descripción general: Crea un almacén de datos de administración de la experiencia con respuestas de encuestas

Instructivo: Transforma y carga respuestas de encuestas de formularios de Google en BigQuery

Obtén información sobre cómo usar el conjunto de datos públicos de Google Trends de nuestros conjuntos de datos de Google Cloud para abordar desafíos comerciales comunes, como identificar tendencias en las ubicaciones de venta minorista, anticipar la demanda de los productos y desarrollar nuevas campañas de marketing.

Entrada de blog: Toma decisiones fundamentadas con datos de Google Trends

Video de descripción general: El conjunto de datos de Google Trends ahora está en BigQuery

Código de muestra (notebook): Notebook de ejemplo de Trends

Código de muestra (SQL): consultas de muestra de Google Trends

Panel de muestra: los 25 términos más populares de la Búsqueda de Google

Comprende y optimiza el gasto de Google Cloud

Descubre cómo trasladar tus datos de la Facturación de Google Cloud a BigQuery para comprender y optimizar tus gastos y visualizar los resultados prácticos en Looker o Looker Studio.

Entrada de blog: Optimiza tu inversión en Google Cloud con BigQuery y Looker

Código de muestra: Bloque de Looker de Facturación de Google Cloud

Optimización de precios basados en datos

Aprende a reaccionar rápido a los cambios del mercado para seguir siendo competitivos, con una optimización de precios más rápida que permite que los clientes ofrezcan precios competitivos a sus usuarios finales mediante los servicios de Google Cloud, lo que aumenta las ventas y sus resultados. Esta solución usa Dataprep de Trifacta para integrar y estandarizar fuentes de datos, y BigQuery para administrar y almacenar tus modelos de precios, así como visualizar los resultados prácticos en Looker.

Entrada de blog: Data Driven Precio Optimization (Optimización de precios basada en datos)

Instructivo: Optimiza el precio de los productos de venta minorista

Código de muestra: Bloque de Looker de Facturación de Google Cloud

Salud y ciencias biológicas

Solución Descripción Productos Vínculos

Ejecuta un análisis de genómica de una sola celda

Aprende a configurar Dataproc con Dask, RAPIDS, GPU y JupyterLab; luego, ejecuta un análisis genómico de una sola celda.

Descripción general técnica: ejecuta un análisis genómico con Dask, RAPIDS y GPU en Dataproc

Código de muestra: Notebook

Entrada de blog: Análisis de genomas de una sola celda acelerado por NVIDIA en Google Cloud

Estadísticas de registros

Solución Descripción Productos Vínculos

Compila una canalización para capturar las interacciones de Dialogflow

Aprende a compilar una canalización a fin de capturar y almacenar interacciones de Dialogflow para un análisis más detallado.

Código de muestra: Dialogflow log parser (Analizador de registros de Dialogflow)

Reconocimiento de patrones

Solución Descripción Productos Vínculos

Detecta objetos en clips de video

En esta solución, se muestra cómo crear una solución de estadísticas de clips de video en tiempo real para el seguimiento de objetos mediante Dataflow y la API de Video Intelligence, lo que te permite analizar grandes volúmenes de datos no estructurados casi en tiempo real.

Código de muestra: Video Analytics Solution Using Dataflow and the Video Intelligence API (Solución de estadísticas de videos mediante Dataflow y la API de Video Intelligence)

Apache Beam Ptransform para llamar a la API de Video Intelligence: apache_beam.ml.gcp.videointelligenceml module (Módulo apache_beam.ml.gcp.videointelligenceml)

Anonimiza (desidentifica) y reidentifica los datos de PII en tu canalización de analítica inteligente

En esta serie de soluciones, se muestra cómo usar Dataflow, Sensitive Data Protection, BigQuery y Pub/Sub para desidentificar y reidentificar información de identificación personal (PII) en un conjunto de datos de muestra.

Guías de referencia técnica:

Código de muestra: Migrate Sensitive Data in BigQuery Using Dataflow and Cloud Data Loss Prevention (Migra datos sensibles en BigQuery mediante Dataflow y Cloud Data Loss Prevention)

Previsión

Solución Descripción Productos Vínculos

Compila y visualiza predicciones de previsión de la demanda mediante Datastream, Dataflow, BigQuery ML y Looker

Obtén información sobre cómo replicar y procesar datos operativos de una base de datos de Oracle en Google Cloud en tiempo real. En el instructivo, también se muestra cómo predecir la demanda futura y cómo visualizar estos datos de previsión a medida que llegan. Por ejemplo, a fin de minimizar el desperdicio de comida para la venta minorista.

Entrada de blog: Solving for food waste with data analytics in Google Cloud

Guía de referencia técnica: Compila y visualiza predicciones de previsión de la demanda mediante Datastream, Dataflow, BigQuery y Looker

Compila un modelo de previsión de demanda

Obtén información sobre cómo compilar un modelo de serie temporal que puedas usar para prever la demanda minorista de varios productos.

Entrada de blog: Cómo compilar modelos de previsión de demanda con BigQuery ML

Notebook: bqml_retail_demand_forecasting.ipynb

Compila una app web de previsión

Aprende a compilar una app web que aproveche varios modelos de previsión, incluidos los de BigQuery y Vertex AI, para predecir las ventas de productos. Los usuarios no técnicos pueden usar esta app web para generar previsiones y explorar los efectos de diferentes parámetros.

Código de muestra: Previsión de series temporales

App web de muestra: Demostración en vivo de la previsión de series temporales

Compila nuevos públicos en función del valor del ciclo de vida del cliente existente

Aprende a identificar a tus clientes actuales más valiosos y, luego, usarlos para desarrollar públicos similares en Google Ads.

Guía técnica de referencia: Crea nuevos públicos en función del valor del ciclo de vida del cliente existente

Código de muestra: Activa las predicciones de LTV

Realiza previsiones de Hojas de cálculo de Google mediante BigQuery ML

Si deseas aprender a poner en funcionamiento el aprendizaje automático con tus procesos empresariales, combina las Hojas conectadas con un modelo de previsión en BigQuery ML. En este ejemplo específico, revisaremos el proceso de compilación de un modelo de previsión para el tráfico del sitio web mediante los datos de Google Analytics. Este patrón se puede extender para que funcione con otros tipos de datos y otros modelos de aprendizaje automático.

Entrada de blog: Cómo usar un modelo de aprendizaje automático a partir de Hojas de cálculo de Google mediante BigQuery ML

Código de muestra: Previsión del AA de BigQuery con Hojas de cálculo

Plantilla: Previsión del AA de BigQuery con Hojas de cálculo

Modelos de propensión para aplicaciones de videojuegos

Aprende a usar BigQuery ML para entrenar, evaluar y obtener predicciones de varios tipos de modelos de propensión. Los modelos de propensión pueden ayudarte a determinar la probabilidad de qué usuarios específicos vuelvan a tu app para que puedas usar esa información en decisiones de marketing.

Entrada de blog: Predicción de deserción para desarrolladores de videojuegos mediante Google Analytics 4 y BigQuery ML

Notebook: Predicción de deserción para desarrolladores de videojuegos mediante Google Analytics 4 y BigQuery ML

Descripción general técnica: Modelos de propensión para aplicaciones de videojuegos

Recomienda productos de inversión personalizados

Aprende a proporcionar recomendaciones de inversiones personalizadas mediante la transferencia, el procesamiento y la mejora de los datos de mercado de las API públicas con Cloud Functions, la carga de datos en BigQuery con Dataflow y, luego, el entrenamiento y la implementación de varios modelos de AutoML Tables con Vertex AI, la organización de estas canalizaciones con Cloud Composer y, por último, la implementación de un frontend web básico para recomendar inversiones a los usuarios.

Entrada de blog: Potencia las aplicaciones de finanzas del consumidor con recomendaciones de inversión altamente personalizadas mediante Vertex AI

Guía de referencia técnica: Una solución técnica que produce recomendaciones de inversión altamente personalizadas mediante el AA

Código de muestra: Motor de recomendaciones de productos de inversión (IPRE) de patrones de diseño FSI

Trabaja con data lakes

Solución Descripción Productos Vínculos

Compila canalizaciones de CI/CD para los servicios de procesamiento de datos sin servidores de un data lake

Aprende a configurar la integración continua y la entrega continua (CI/CD) para las canalizaciones de procesamiento de datos de un data lake. Implementa métodos de CI/CD con Terraform, GitHub y Cloud Build mediante la popular metodología GitOps

Descripción general técnica: Compila canalizaciones de CI/CD para los servicios de procesamiento de datos sin servidores de un data lake

Control de acceso detallado para los datos almacenados en un almacén de objetos

Aprende a usar BigLake para aplicar permisos detallados (seguridad a nivel de fila y de columna) en los archivos almacenados en un almacén de objetos. Demuestra que esa seguridad se extiende a otros servicios, como Spark, que se ejecuta en Dataproc.

Código de muestra: Control de acceso detallado en BigLake con Spark