¿Qué son los productos de datos?

Un producto de datos es simplemente una forma de empaquetar datos para resolver un problema empresarial específico. En lugar de ofrecer datos en bruto que pueden ser confusos o estar desordenados, se tratan como si fueran un producto en un estante de una tienda, con una descripción de lo que son y cómo usarlos, y con la promesa de que son precisos. De esta forma, la información en bruto se convierte en un recurso de alta calidad y fácil de encontrar en el que toda la organización puede confiar.

Imagina la diferencia entre comprar ingredientes sueltos y comprar un kit de comida. Un producto de datos es ese kit: contiene los datos en bruto con las instrucciones y el contexto necesarios para resolver un problema empresarial concreto. Transforma los datos dispersos en algo fiable, fácil de encontrar e inmediatamente útil para tu empresa.

Conclusiones clave

Los productos de datos pueden usarse de muchas formas, entre las que se incluyen las siguientes:

  • APIs que devuelven puntuaciones predictivas (como una puntuación de riesgo crediticio)
  • Paneles de control insertados en una aplicación para mostrar analíticas de usuarios
  • Motores de recomendaciones que sugieren películas o productos
  • Modelos de aprendizaje automático que detectan fraudes en tiempo real
  • Agentes de IA que se pueden entrenar y operar con datos que ya se han limpiado, organizado y alineado con los objetivos empresariales

Datos como producto frente a productos de datos

Es fácil confundir los términos "productos de datos" y "datos como producto", pero significan cosas diferentes. Es importante entender la diferencia entre ambos conceptos para crear soluciones en la nube.

  • Los datos como producto (DaaP) son una mentalidad o una estrategia que suele estar relacionada con el concepto arquitectónico de la malla de datos. Esto significa tratar los conjuntos de datos internos con el mismo cuidado que tratarías un producto de software público.
  • Por otro lado, los productos de datos son los resultados técnicos reales. Son los datos preempaquetados que nutren el software o las herramientas que creas utilizando esos datos de alta calidad.

Diferencias principales:

Función

Datos como producto

Productos de datos

¿Qué es?

Una estrategia o filosofía.

Un recurso de datos predefinido.

Objetivo principal

Para mejorar la calidad y la fiabilidad de los datos.

Para resolver un problema específico de los usuarios.

Ejemplo

Una tabla "Customer" limpia y documentada en BigQuery con un propietario asignado.

Un producto de datos de "vista de 360 grados del cliente" que extrae datos de esa tabla para mostrar el historial de un usuario.

Función

Datos como producto

Productos de datos

¿Qué es?

Una estrategia o filosofía.

Un recurso de datos predefinido.

Objetivo principal

Para mejorar la calidad y la fiabilidad de los datos.

Para resolver un problema específico de los usuarios.

Ejemplo

Una tabla "Customer" limpia y documentada en BigQuery con un propietario asignado.

Un producto de datos de "vista de 360 grados del cliente" que extrae datos de esa tabla para mostrar el historial de un usuario.

Casos prácticos de productos de datos

Los productos de datos actúan como una función de control al empaquetar datos y modelos en unidades lógicas, seguras y fáciles de localizar. De esta forma, las organizaciones pueden establecer una propiedad clara y gestionar el acceso mediante flujos de trabajo de aprobación.


Los comercios pueden agrupar los datos de comportamiento de los clientes y los modelos de recomendación de productos en un único "producto de datos de personalización". Al usar Knowledge Catalog, la organización puede asegurarse de que solo los desarrolladores autorizados puedan acceder a los conjuntos de datos subyacentes y a los endpoints de los modelos. Esta capa de gobernanza proporciona contexto a través de metadatos (aspectos) y, al mismo tiempo, protege las interacciones sensibles de los usuarios.

Las instituciones financieras pueden crear un producto de datos de "riesgo de fraude" que combine flujos de transacciones en tiempo real con modelos de aprendizaje automático. Este paquete unificado permite un flujo de trabajo de aprobación seguro. Cuando un investigador necesita acceder a las puntuaciones de riesgo, lo solicita a través de un portal central. De esta forma, el acceso está limitado en el tiempo y se audita por completo, lo que evita la exposición de datos no autorizada.

En el sector de la fabricación, un producto de datos de "estado de la máquina" combina datos de sensores con modelos de detección de anomalías. Las funciones de gobernanza, como las comprobaciones automatizadas de la calidad de los datos y la elaboración de perfiles, garantizan que el modelo solo consuma datos fiables. De esta forma, se evitan las predicciones de fallos incorrectas causadas por sensores defectuosos o entradas sin procesar "desordenadas".

Los equipos de logística pueden empaquetar algoritmos de rutas y conjuntos de datos de restricciones de vehículos como un producto de datos de "optimización de entregas". Al establecer la propiedad a nivel de dominio en una estructura de datos, la empresa puede hacer un seguimiento del linaje de los datos, que muestra exactamente cómo se transformaron los datos de ubicación sin procesar en los horarios finales de los conductores.

Ventajas de los productos de datos

Desarrollar productos de datos ofrece ventajas significativas para una empresa. Pueden ayudar a cambiar el enfoque de simplemente servir para recabar datos a tener un uso real para generar valor.

Mejor toma de decisiones

Las empresas pueden usar productos de datos para poner información valiosa directamente a disposición de las personas que la necesitan. Esto ayuda a los equipos a tomar decisiones estratégicas más inteligentes basadas en pruebas en lugar de en la intuición.

Innovación más rápida

Los productos de datos reutilizables reducen el tiempo necesario para implementar nuevos casos prácticos. Los desarrolladores pueden integrar en sus aplicaciones los productos de datos que ya tengan, lo que les ayuda a lanzar funciones y resolver problemas más rápido sin tener que gestionar flujos de procesamiento de datos en bruto y complejos.

Incremento de los ingresos

Los productos de datos ayudan a las empresas a monetizar sus recursos directamente. Por ejemplo, una empresa podría empaquetar sus datos propios para que otros desarrolladores los usen.

Ventaja competitiva

Las empresas que cuentan con datos fiables suelen ser más eficaces a la hora de adquirir y retener clientes. Al ofrecer experiencias más inteligentes y personalizadas, pueden diferenciarse de sus competidores que no utilizan sus datos de forma eficaz.

Crea agentes de forma segura

Al crear agentes de IA a partir de estos productos de datos "predefinidos", te aseguras de que la IA aprende a partir de información verificada y de alta calidad, en lugar de datos en bruto desordenados. De esta forma, se crea un entorno seguro en el que la IA ofrece respuestas precisas en las que puedes confiar, sin que se filtre accidentalmente información sensible o incorrecta.

Ejemplo: desarrollador de comercio electrónico de una empresa que usa Knowledge Catalog y BigQuery

Veamos cómo podrías crear un producto de datos, como un "predictor de inventario de tiendas", usando herramientas como BigQuery y Knowledge Catalog.

El objetivo: crear una herramienta interna que indique a los responsables de tienda qué artículos se están agotando y prediga qué deben pedir para la semana siguiente.

Paso 1: Ingerir y almacenar datos con BigQuery

En primer lugar, necesitas un lugar donde almacenar los datos de ventas. Puedes usar BigQuery, un almacén de datos sin servidor, para configurar un flujo de procesamiento que transfiera las cifras de ventas diarias de cada tienda a tablas de BigQuery.

Paso 2: Gestionar y gobernar los datos con Knowledge Catalog

Antes de crear el modelo, debes asegurarte de que los datos estén limpios. Usa Knowledge Catalog para gestionar el ciclo de vida de los datos, ya que te puede ayudar a:

  • Catalogar los datos para que otros desarrolladores puedan encontrarlos
  • Definir reglas de calidad de los datos (por ejemplo, "El precio no puede ser negativo")
  • Proteger los datos para que solo los usuarios autorizados puedan acceder a ellos

Paso 3: Crear el modelo con BigQuery ML

Ahora, la información la creas tú. En lugar de exportar los datos a una herramienta independiente, usas BigQuery ML para escribir una consulta de SQL sencilla que entrena un modelo de aprendizaje automático. Este modelo analiza las tendencias de ventas pasadas para predecir la demanda futura.

  • SQL
Cargando...

Paso 4: Exponer el producto de datos

Por último, puedes crear una API sencilla o un panel de control con Looker. Cuando el gerente de una tienda inicia sesión, en lugar de ver consultas de SQL, ve una interfaz limpia que dice "Pide 50 camisetas rojas más para el martes". ¡Enhorabuena! Has transformado correctamente datos en bruto en un producto de datos útil.

Soluciona los retos empresariales que se te presenten con Google Cloud

Los nuevos clientes reciben 300 USD en crédito sin coste para invertirlos en Google Cloud.

Recursos adicionales

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito de regalo y más de 20 productos que siempre se ofrecen sin coste económico.

Google Cloud