Cloud Dataprep de Trifacta

Servicio inteligente de datos en la nube que permite examinar, limpiar y preparar datos de forma visual para analizarlos y crear modelos de aprendizaje automático

Consulta la documentación de este producto.

Preparación inteligente de datos

Preparación inteligente de datos

Cloud Dataprep de Trifacta es un servicio inteligente de datos que permite examinar, limpiar y preparar datos estructurados y sin estructurar de forma visual para procesos de análisis, generación de informes y aprendizaje automático. Dado que prescinde de servidores y funciona a cualquier escala, no hace falta desplegar ni gestionar ninguna infraestructura. Cada vez que introduces datos en la interfaz de usuario, este servicio predice y te sugiere la transformación que deberías llevar a cabo, por lo que no es necesario que escribas ningún código.

Sencillez sin servidor

Cloud Dataprep es un servicio integrado y operado por un partner, Trifacta, que se basa en su solución de preparación de datos líder del sector: Trifacta Wrangler. En Google, colaboramos estrechamente con este partner para ofrecer una experiencia de usuario tan fluida que no tengas que instalar software por anticipado, adquirir licencias independientes ni sufragar gastos operativos continuos. En función del volumen de datos que debes preparar, puedes escalar bajo demanda este servicio totalmente gestionado y centrar tu atención únicamente en el análisis.

Examen de datos y detección de anomalías con rapidez

Interpreta y examina los datos al momento gracias a las funciones visuales de distribución de datos. Cloud Dataprep detecta de forma automática esquemas, tipos de datos, posibles uniones y anomalías (como duplicados y valores que faltan o que son atípicos) para que ahorres tiempo, ya que te permite saltarte la evaluación de la calidad de los datos y pasar directamente a su examen y a su análisis.

Preparación de datos fácil y potente

Para cada acción que indicas en su interfaz, Cloud Dataprep sugiere y predice la transformación de datos idónea que conviene hacer a continuación. Una vez que hayas definido la secuencia de transformaciones, el servicio utiliza Cloud Dataflow de forma interna y te permite procesar conjuntos de datos estructurados o sin estructurar de cualquier tamaño con solo unos clics y sin programación.

Características

Transformación predictiva

Cloud Dataprep utiliza un algoritmo de inferencia propio para interpretar el intent de transformación que implica la selección de datos del usuario. Entonces, genera automáticamente una lista ordenada con sugerencias y patrones adecuados para esa selección.

Transformaciones enriquecidas

Aprovecha los centenares de funciones de transformación para convertir los datos en el recurso que te interesa. Basta un clic para aplicar funciones de agregación, columnas dinámicas, anulación de columnas dinámicas, incorporación de columnas, incorporación de filas, extracción, cálculo, comparación, condición, combinación, expresión regular y muchas más.

Parametrización

Puedes ejecutar una misma receta en varias instancias de conjuntos de datos idénticos. Para ello, parametriza una variable de forma que se sustituyan las partes de la ruta al archivo que cambien con cada actualización. Si es preciso, puedes modificar esa variable en el momento de ejecutar las tareas.

Colaboración

Si los usuarios forman equipos, puede resultar útil que varios colaboren en los mismos recursos o que se creen copias de los trabajos de calidad óptima para utilizarlas como plantillas. Cloud Dataprep permite a los usuarios colaborar en tiempo real en los mismos objetos del flujo, así como generar copias para que las utilicen otros compañeros en trabajos distintos.

Coincidencia de patrones

Utiliza la coincidencia de patrones en columnas para identificar los patrones de datos que te interesan, mostrarlos en la interfaz y usarlos para crear tus recetas. También puedes aplicar expresiones regulares o patrones de Cloud Dataprep a los pasos de las recetas para localizar patrones y transformar los datos de tus conjuntos que coincidan.

Estandarización

Agrupa los valores según su semejanza ortográfica o el parecido en la pronunciación en todos los idiomas y crea clústeres estandarizados de valores coherentes.

Elaboración activa de perfiles

Consulta y examina tus datos mediante distribuciones visuales interactivas que facilitan el descubrimiento, la limpieza y la transformación. Las representaciones visuales ayudan a interpretar volúmenes grandes de datos, y las innovadoras técnicas de elaboración de perfiles de Cloud Dataprep reflejan información estadística clave con un formato dinámico e intuitivo.

Muestreo

Para optimizar el rendimiento, Cloud Dataprep genera automáticamente una o varias muestras de los datos que se van a mostrar y a manipular en la aplicación cliente. No obstante, puedes cambiar fácilmente el tamaño de las muestras, su alcance y el método con el que se crean.

Programación

Programa la ejecución de recetas en tus flujos con carácter periódico o en función de las necesidades. Cuando se completan las tareas programadas, puedes acceder a los datos limpios con el formato indicado en la ubicación de salida que hayas especificado.

Selección rápida de destinos

Define esquemas de destinos por medio de conjuntos de datos importados o creados. Luego, asígnalos a tus recetas para sistematizar y agilizar los procesos de preparación. Los destinos se muestran en la página de transformación y se pueden aplicar a todo el conjunto de datos o a las columnas concretas con las que quieres trabajar.

Tipos de datos habituales

Transforma conjuntos de datos, tanto estructurados como sin estructurar, almacenados en formato CSV, JSON o de tabla relacional y de cualquier tamaño, desde megabytes hasta petabytes: siempre te resultará igual de fácil manipularlos.

Integración con Google Cloud Platform

Procesa los datos almacenados en Cloud Storage, en BigQuery o en tu ordenador. Luego, exporta los datos limpios a BigQuery o a Cloud Storage para almacenarlos, analizarlos, visualizarlos o crear modelos de aprendizaje automático. Gracias a Gestión de Identidades y Accesos de Cloud, el acceso de los usuarios y la seguridad de los datos se gestionan a la perfección.

Arquitectura de Cloud Dataprep

Arquitectura de Cloud Dataprep

Cloud Dataprep nos permite examinar rápidamente los conjuntos de datos nuevos. Es un servicio muy flexible que cubre todas nuestras necesidades en cuanto a transformación de datos. Ahora, en Merkle completamos las tareas de preparación de datos en cuestión de minutos en lugar de horas o días, es decir, hemos reducido en un 90 % el tiempo de preparación.

Henry Culver, arquitecto de TI de Merkle

Nuestros clientes

Recursos

Precios

Cloud Dataprep es una aplicación web interactiva que permite a los usuarios trabajar sobre una muestra de sus datos para definir reglas de preparación. No se te cobra nada por usarla para examinar muestras de datos, definir los pasos de transformación y exportar las muestras transformadas. Puedes ejecutar el flujo en el conjunto de datos entero como una tarea de Cloud Dataprep mediante Google Cloud Dataflow. Para obtener información más detallada, consulta nuestra guía de precios.

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito gratuito y más de 20 productos Always Free.

¿Necesitas ayuda para empezar?
Trabaja con un partner de confianza
Sigue explorando nuestras soluciones