Cloud Dataprep by Trifacta

Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar visualmente los datos para su análisis y aprendizaje automático.

Preparación inteligente de datos

Preparación inteligente de datos

Cloud Dataprep by Trifacta es un servicio inteligente de datos que permite explorar visualmente, limpiar y preparar datos estructurados y sin estructurar para su análisis, la elaboración de informes y el aprendizaje automático. Funciona sin servidores y a cualquier escala, por lo que no requiere la implementación ni la administración de ninguna infraestructura. Cada entrada en la IU te sugiere y predice la siguiente transformación de datos ideal, de modo que no tengas que escribir código. Además, puedes olvidarte de la tediosa tarea del perfilado de datos y enfocarte en el análisis gracias a la detección automática de esquemas, tipos de datos, uniones posibles y anomalías.

Simplicidad sin servidores

Simplicidad sin servidores

Cloud Dataprep es un servicio integrado de socios que administra Trifacta, basado en Trifacta Wrangler, una solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia optimizada del usuario que elimina la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Cloud Dataprep está completamente administrado y ajusta la escala según la demanda a fin de satisfacer tus crecientes necesidades de preparación de datos, lo que permite que te enfoques en los análisis.

Exploración rápida y detección de anomalías

Exploración rápida y detección de anomalías

Comprende y explora la información al instante con las distribuciones visuales de datos. Cloud Dataprep detecta automáticamente los esquemas, tipos de datos, y las uniones y anomalías posibles, como valores faltantes, valores atípicos y duplicados. Olvídate de la tediosa tarea del perfilado de datos y comienza a explorarlos y analizarlos de inmediato.

Preparación de datos de forma fácil y eficiente

Preparación de datos de forma fácil y eficiente

Con cada gesto en la IU, Cloud Dataprep te sugiere y predice de forma automática la siguiente transformación ideal de datos. Luego de definir la secuencia de transformaciones, Cloud Dataprep usa Cloud Dataflow de forma interna para el procesamiento de conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics y sin la necesidad de escribir código.

Clientes de Cloud Dataprep

Cloud Dataprep nos permite explorar nuevos conjuntos de datos con rapidez, y su flexibilidad cumple con todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% nuestro tiempo de preparación.

Henry Culver, arquitecto de TI, Merkle

Arquitectura de Cloud Dataprep

Arquitectura de Cloud Dataprep

Funciones de Cloud Dataprep

Transformación predictiva

Cloud Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intent de transformación de los datos a partir de la selección de datos de un usuario, y genera de forma automática un conjunto clasificado de sugerencias y patrones que coinciden con la selección.

Parametrización

Ejecuta una receta en varias instancias de conjuntos de datos idénticos mediante la parametrización de una variable para reemplazar las partes de la ruta del archivo que cambian con cada actualización. Esta variable puede modificarse según sea necesario en el entorno de ejecución del trabajo.

Colaboración

En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que hagan copias de las tareas de buena calidad realizadas para usarlas como plantillas en otros trabajos. Cloud Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.

Coincidencia de patrones

Usa la comparación de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz, a fin de utilizarlos en la compilación de tus recetas. Además, en los pasos de tu receta puedes aplicar expresiones regulares o patrones de Cloud Dataprep para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Perfiles visuales

Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y las técnicas innovadoras de perfilado de Cloud Dataprep visualizan información estadística clave en un formato dinámico y sencillo.

Muestreo

Para optimizar el rendimiento, Cloud Dataprep genera de forma automática uno o más conjuntos de muestra de los datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar fácilmente el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.

Programación

Programa la ejecución de recetas en tus flujos cada vez que lo necesites o de forma recurrente. Cuando el trabajo programado se ejecuta con éxito, puedes recopilar los datos de salida derivados en la ubicación de salida especificada. Los datos estarán disponibles en la forma de publicación que hayas elegido.

Coincidencia de destino

Define esquemas de destino mediante conjuntos de datos importados o creados y asígnalos a una receta existente a fin de sistematizar y acelerar tus esfuerzos por organizar los datos. Los destinos aparecen en la página de transformación y se pueden aplicar hacia todo el conjunto de datos o hacia las columnas elegidas del conjunto de datos que necesites organizar.

Tipos comunes de datos

Transforma conjuntos de datos estructurados y sin estructurar que estén almacenados en CSV, JSON o en formato de tablas relacionales de cualquier tamaño (megabytes o petabytes) con la misma facilidad y simplicidad.

Integrado en Google Cloud Platform

Procesa los datos almacenados en Cloud Storage, BigQuery o en tu computadora de escritorio, y luego exporta a BigQuery o Cloud Storage los que estén mejor definidos para su almacenamiento, análisis, visualización o aprendizaje automático. Cloud Identity and Access Management administra el acceso de los usuarios y la seguridad de los datos sin problemas.

Precio de Cloud Dataprep

Cloud Dataprep es una aplicación web interactiva que permite a los usuarios interactuar con una muestra de sus datos y definir las reglas para prepararlos. El uso de la aplicación para explorar datos de muestra, definir los pasos de la transformación y exportar la muestra transformada es sin cargo. El flujo se puede realizar como un trabajo de Cloud Dataprep (mediante Google Cloud Dataflow) a fin de ejecutarlo sobre el conjunto de datos completo. Obtén más información y revisa todos los detalles en nuestra guía de precios.

Recursos

Google Cloud

Comenzar

Aprende y crea

¿Acabas de comenzar a usar GCP? Empieza a usar cualquier producto de GCP sin costo con un crédito de $300.

¿Necesitas más ayuda?

Nuestros expertos te ayudarán a crear las soluciones más adecuadas o a comunicarte con el socio más indicado para lo que necesites.

Enviar comentarios sobre…

Cloud Dataprep by Trifacta