Predice el valor del ciclo de vida del cliente con AI Platform: Introducción

Last reviewed 2019-02-06 UTC

Este artículo es la primera parte de una serie de cuatro partes en la que se analiza cómo puedes predecir el valor del ciclo de vida del cliente (CVC) mediante AI Platform en Google Cloud.

Los artículos de esta serie son los siguientes:

  • Parte 1: Introducción (este artículo). Se presenta el valor del ciclo de vida del cliente (CVC) y dos técnicas de modelado para predecir el CVC.
  • Parte 2: Entrena el modelo. Se analiza cómo preparar los datos y entrenar los modelos.
  • Parte 3: Implementa en producción. Se describe cómo implementar los modelos analizados en la Parte 2 en un sistema de producción.
  • Parte 4: Usa tablas de AutoML. Se muestra cómo usar las tablas de AutoML para compilar un modelo a fin de implementarlo.

Descripción general

Muchos anunciantes intentan adaptar sus anuncios a individuos o grupos de usuarios similares, pero no siempre apuntan a sus clientes más valiosos. El principio de Pareto a menudo se cita en referencia a las ventas y predice que el 20% de tus clientes representa el 80% de tus ventas. ¿Qué pasaría si pudieras identificar cuáles de tus clientes representan ese 20%, no solo en el pasado, sino también en el futuro? La predicción del valor del ciclo de vida del cliente (CVC) es una forma de identificar a esos clientes.

Los objetivos de esta serie son los siguientes:

  • Explicar los conceptos de modelado de CVC
  • Comparar dos enfoques para el modelado de CVC
  • Mostrar cómo implementar modelos de CVC en Google Cloud

Esta solución compara dos enfoques diferentes para el modelado de CVC: modelos probabilísticos y modelos de aprendizaje automático (AA). Proporciona una implementación de cada enfoque y presenta los resultados cuando cada modelo se aplica a un conjunto de datos públicos. En los artículos de la serie, se explica cómo implementar el sistema de modelado en Google Cloud.

Cuándo debes usar este enfoque

Puedes usar modelos de CVC para responder a este tipo de preguntas sobre los clientes:

  • Cantidad de compras: ¿Cuántas compras realizará el cliente en un intervalo de tiempo futuro determinado?
  • Vida útil: ¿Cuánto tiempo pasará antes de que el cliente se vuelva inactivo de forma permanente?
  • Valor monetario: ¿Cuánto valor monetario generará el cliente en un intervalo de tiempo futuro determinado?

Cuando predices el valor del ciclo de vida del cliente futuro, hay dos problemas distintos que requieren datos y estrategias de modelado diferentes:

  • Predecir el valor futuro para los clientes existentes que tienen un historial de transacciones conocido
  • Predecir el valor futuro para los nuevos clientes que acaban de realizar su primera compra

Esta serie se centra en el primer problema.

Muchas empresas predicen los CVC solo a partir el importe monetario total de las ventas, sin comprender el contexto. Por ejemplo, un cliente que hace un pedido grande puede ser menos valioso que otro cliente que compra varias veces, pero en cantidades más pequeñas. El modelado de CVC puede ayudarte a comprender mejor el perfil de compra de tus clientes y a valorar tu negocio con mayor precisión.

Si usas los enfoques descritos en esta serie para predecir el valor de tus clientes, puedes priorizar tus acciones próximas, por ejemplo:

  • Decidir cuánto invertir en publicidad
  • Decidir a qué clientes apuntar con la publicidad
  • Planificar cómo mover clientes de un segmento a otro

Los modelos que se usan en esta serie no son adecuados para empresas en las que se puede observar y medir la deserción de clientes de forma directa. Por ejemplo, no debes usar estos modelos para empresas que se basan en suscripciones, cuentas de clientes o contratos que se pueden cancelar. En su lugar, en los modelos de esta serie se supone que los usuarios interactúan con el negocio a voluntad, como en las tiendas de comercio electrónico en las que los usuarios pueden realizar compras en cualquier momento. Además, los modelos que se describen en esta serie sirven más para predecir el valor futuro de los clientes existentes que tienen al menos una historial de transacciones de tamaño moderado.

Conceptos de CVC: compras recientes, frecuencia y valor monetario (RFM)

Tres entradas importantes en los modelos de CVC son las compras recientes, la frecuencia y el valor monetario:

  • Compras recientes: ¿Cuándo fue el último pedido del cliente?
  • Frecuencia: ¿Con qué frecuencia compra?
  • Valor monetario: ¿Qué cantidad de dinero gasta?

En el siguiente diagrama, se muestra una sucesión de ventas pasadas para un conjunto de cuatro clientes.

Historial de ventas de 4 clientes

En el diagrama, se ilustran los valores de RFM y se muestra lo siguiente para cada cliente:

  • Compras recientes: el período entre la última compra y hoy, representado por la distancia entre el círculo del extremo derecho y la línea de puntos vertical etiquetada como Ahora.
  • Frecuencia: El período entre las compras, representado por la distancia entre los círculos en una sola línea.
  • Valor monetario: La cantidad de dinero gastado en cada compra, representada por el tamaño del círculo. Esta cantidad podría ser el valor promedio del pedido o la cantidad de productos que el cliente pidió.

En los modelos de esta serie, solo se usan los datos históricos de ventas para calcular el CVC. Las entradas de valor de RFM se calculan a partir del historial de transacciones de cada cliente.

Dos métodos de modelado para el CVC

Como se señaló antes, esta serie de artículos compara dos enfoques para calcular el CVC:

  • Modelos probabilísticos. Estos modelos ajustan una distribución de probabilidad a los valores de RFM observados para los clientes. Estos modelos se basan en el comportamiento de compra que define el historial de transacciones de cada cliente. Esos datos son suficientes para extraer valores de RFM.
  • Modelos de AA. Estos modelos son una clase extensa y muy usada de modelos estadísticos en los que los parámetros se ajustan a los datos mediante entrenamiento con descenso de gradientes estocástico. Los modelos de AA pueden usar más atributos que los probabilísticos. En esta serie, usamos modelos de red neuronal profunda (DNN), una clase popular de modelos de AA. También mostramos cómo usar las tablas de AutoML para crear de forma automática un modelo de AA.

Para los modelos probabilísticos, esta solución usa una biblioteca de Lifetimes existente que se basa en DataFrames con Pandas. Es posible compilar una biblioteca equivalente en TensorFlow para realizar las mismas tareas que la biblioteca de Lifetimes.

Modelos probabilísticos

Los modelos probabilísticos usan valores de RFM que se calculan a partir de una lista de transacciones de pedidos. Cada transacción consta de un ID de cliente, una fecha de pedido y el valor del pedido. Los diferentes modelos son apropiados para modelar distintas relaciones con los clien