Descripción general del análisis de contribuciones

Puedes usar el análisis de contribución, también llamado análisis de impulsores clave, para generar estadísticas sobre los cambios en las métricas clave de tus datos multidimensionales. Por ejemplo, puedes usar el análisis de contribución para ver el cambio en las cifras de ingresos en dos trimestres o para comparar dos conjuntos de datos de entrenamiento y comprender los cambios en el rendimiento de un modelo de AA. Puedes usar una sentencia CREATE MODEL para crear un modelo de análisis de contribución en BigQuery.

El análisis de contribuciones es una forma de análisis aumentado, que consiste en el uso de la inteligencia artificial (IA) para mejorar y automatizar el análisis y la comprensión de los datos. El análisis de contribuciones logra uno de los objetivos clave de las estadísticas avanzadas, que es ayudar a los usuarios a encontrar patrones en sus datos.

Un modelo de análisis de contribución detecta segmentos de los datos que muestran cambios estadísticamente significativos en una métrica a lo largo del tiempo comparando un conjunto de datos de prueba con un conjunto de datos de control. Esto te permite ver cómo cambian los datos a lo largo del tiempo, la ubicación, el segmento de clientes o cualquier otra métrica que te interese. Por ejemplo, puedes comparar una instantánea de tabla tomada a fines de 2023 con una instantánea de tabla tomada a fines de 2022 para ver cómo difieren los datos en dos años.

La métrica es el valor numérico que usan los modelos de análisis de contribución para medir y comparar los cambios entre los datos de prueba y control. Puedes especificar una métrica sumable o una métrica proporción sumada con modelos de análisis de contribución.

Un segmento es una porción de los datos que se identifica mediante una combinación determinada de valores de dimensión. Por ejemplo, para un modelo de análisis de contribución basado en las dimensiones store_number, customer_id y day, cada combinación única de esos valores de dimensión representa un segmento. En la siguiente tabla, cada fila representa un segmento diferente:

store_number customer_id day
tienda 1
tienda 1 cliente 1
tienda 1 cliente 1 Lunes
tienda 1 cliente 1 Martes
tienda 1 cliente 2
tienda 2

Para modelar solo los segmentos más grandes y, por lo tanto, más relevantes, especifica un umbral de apoyo a priori que elimine los segmentos pequeños del uso del modelo. Esto también reduce el tiempo de creación del modelo.

Después de crear un modelo de análisis de contribución, puedes usar la función ML.GET_INSIGHTS para recuperar la información de métricas que calcula el modelo.

¿Qué sigue?