Cloud Dataprep de Trifacta

Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar de manera visual los datos para el análisis y el aprendizaje automático.

Consulta la documentación de este producto.

Preparación inteligente de datos

Preparación inteligente de datos

Cloud Dataprep de Trifacta es un servicio inteligente de datos que permite limpiar, preparar y explorar de manera visual datos estructurados y sin estructurar para el análisis, la elaboración de informes y el aprendizaje automático. Debido a que Cloud Dataprep funciona sin servidores y a cualquier escala, no requiere infraestructura para implementar ni administrar. Cada entrada en la IU te sugiere y predice la siguiente transformación de datos ideal de modo que no tengas que escribir código.

Novedades

Simplicidad sin servidores

Cloud Dataprep es un servicio integrado de socios que opera Trifacta, basado en su solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia del usuario optimizada que quita la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Cloud Dataprep está completamente administrado y ajusta la escala según la demanda a fin de satisfacer tus crecientes necesidades de preparación de datos, lo que permite que te enfoques en el análisis.

Exploración rápida y detección de anomalías

Comprende y explora la información al instante con las distribuciones visuales de datos. Cloud Dataprep detecta de manera automática los esquemas, los tipos de datos, las uniones posibles y las anomalías, como valores faltantes, valores atípicos y duplicados. Olvídate de la tediosa tarea de evaluar la calidad de los datos y comienza a explorarlos y analizarlos de inmediato.

Preparación de datos de forma fácil y eficiente

Con cada gesto en la IU, Cloud Dataprep sugiere y predice de forma automática la siguiente transformación ideal de datos. Luego de definir la secuencia de transformaciones, Cloud Dataprep usa Cloud Dataflow de forma interna, lo que te permite procesar conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics y sin la necesidad de escribir código.

Características

Transformación predictiva

Cloud Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intent de transformación de los datos a partir de la selección de datos de un usuario. Además, genera de forma automática un conjunto clasificado de sugerencias y patrones que coinciden con la selección.

Transformaciones enriquecidas

Aprovecha cientos de funciones de transformación para convertir los datos en los elementos que deseas. Con tan solo un clic, puedes aplicar agregaciones, dinamizar, anular la dinamización, realizar juntas, uniones, extracciones, cálculos, comparaciones, condiciones y combinaciones; usar expresiones regulares y mucho más.

Parametrización

Ejecuta una receta en varias instancias de conjuntos de datos idénticos mediante la parametrización de una variable para reemplazar las partes de la ruta del archivo que cambian con cada actualización. Esta variable puede modificarse según sea necesario en el entorno de ejecución del trabajo.

Colaboración

En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que hagan copias de las tareas de buena calidad realizadas para usarlas como plantillas en otros trabajos. Cloud Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.

Coincidencia de patrones

Usa la coincidencia de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz a fin de usarlos en la compilación de tus recetas. Además, en los pasos de tu receta puedes aplicar expresiones regulares o patrones de Cloud Dataprep para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Estandarización

Agrupa valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.

Creación de perfiles activa

Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y se puede visualizar información estadística clave en un formato dinámico y sencillo con las técnicas innovadoras de perfilado de Cloud Dataprep.

Muestreo

Para optimizar el rendimiento, Cloud Dataprep genera de forma automática una o más muestras de datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar de manera sencilla el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.

Programa

Programa la ejecución de recetas en tus flujos cada vez que lo necesites o de forma recurrente. Cuando el trabajo programado se ejecuta con éxito, puedes recopilar los datos de salida transformados en la ubicación de salida especificada. Los datos estarán disponibles en la forma de publicación que hayas elegido.

Orientación rápida

Define esquemas de destino mediante conjuntos de datos importados o creados y asígnalos a una receta existente a fin de sistematizar y acelerar tus esfuerzos por transformar los datos. Los destinos aparecen en la página de transformación y se pueden aplicar en todo el conjunto de datos o en las columnas elegidas del conjunto de datos que necesites transformar.

Tipos comunes de datos

Transforma conjuntos de datos estructurados y sin estructurar que estén almacenados en CSV, JSON o en formato de tablas relacionales de cualquier tamaño (megabytes o petabytes) con la misma facilidad y simplicidad.

Integrado en Google Cloud Platform

Procesa los datos almacenados en Cloud Storage, BigQuery o en tu computadora de escritorio y, luego, exporta a BigQuery o Cloud Storage los datos mejor definidos para el almacenamiento, el análisis, la visualización o el aprendizaje automático. Cloud Identity and Access Management administra el acceso de los usuarios y la seguridad de los datos sin problemas.

Arquitectura de Cloud Dataprep

Arquitectura de Cloud Dataprep

Cloud Dataprep nos permite explorar conjuntos de datos nuevos con rapidez, y su flexibilidad admite todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% el tiempo de preparación.

Henry Culver, arquitecto de TI, Merkle

Nuestros clientes

Recursos

Precios

Cloud Dataprep es una aplicación web interactiva que permite a los usuarios interactuar con una muestra de sus datos y definir las reglas para prepararlos. El uso de la aplicación para explorar datos de muestra, definir los pasos de la transformación y exportar la muestra transformada no tiene cargo. El flujo se puede realizar como un trabajo de Cloud Dataprep (mediante Google Cloud Dataflow) a fin de ejecutarlo sobre el conjunto de datos completo. Obtén más información y revisa todos los detalles en nuestra guía de precios.

Da el siguiente paso

Comienza a compilar en Google Cloud con un crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Sigue explorando