Obtén un pase de acceso ilimitado a la Cumbre de 2021 sobre Trifacta y Wrangle para mirar a más de 20 sesiones de ingeniería de datos exclusivas a pedido.

Dataprep de Trifacta

Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar de manera visual los datos para el análisis y el aprendizaje automático.

Ve la documentación de este producto.

El ícono de Dataprep se encuentra frente a una laptop abierta con una pila de páginas web a la derecha, una hoja de cálculo con el logotipo de Trifacta a la izquierda y un gráfico de barras en la nube detrás

Preparación inteligente de datos

Dataprep de Trifacta es un servicio inteligente de datos que permite limpiar, preparar y explorar de manera visual datos estructurados y sin estructurar para el análisis, la elaboración de informes y el aprendizaje automático. Debido a que Dataprep no tiene servidores y funciona a cualquier escala, no hay infraestructura para implementar o administrar. Cada entrada en la IU te sugiere y predice la siguiente transformación de datos ideal de modo que no tengas que escribir código.

Novedades

Monitor de computadora con datos en pantalla

Simplicidad sin servidores

Dataprep es un servicio integrado de socios que opera Trifacta, basado en su solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia del usuario optimizada que quita la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Dataprep está completamente administrado y ajusta la escala según la demanda a fin de satisfacer tus crecientes necesidades de preparación de datos, lo que permite que te enfoques en el análisis.

Gráfico estilizado con un ícono de cronómetro

Exploración rápida y detección de anomalías

Comprende y explora la información al instante con las distribuciones visuales de datos. Dataprep detecta de manera automática los esquemas, los tipos de datos, las uniones posibles y las anomalías, como valores faltantes, atípicos y duplicados. Olvídate de la tediosa tarea de evaluar la calidad de los datos y comienza a explorarlos y analizarlos de inmediato.

Página con texto y marcas de verificación azules en el margen derecho que emerge de una caja de cartón abierta. El ícono de Dataprep se encuentra a la izquierda.

Preparación de datos de forma fácil y eficiente

Con cada gesto en la IU, Dataprep te sugiere y predice de forma automática la siguiente transformación ideal de datos. Luego de definir la secuencia de transformaciones, Dataprep usa Dataflow o BigQuery de forma interna para el procesamiento de conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics y sin la necesidad de escribir código.

Funciones de Dataprep

Ediciones Starter, Professional y Enterprise

Transformación predictiva

Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intent de transformación de los datos a partir de la selección de datos de un usuario. Además, genera de forma automática un conjunto clasificado de sugerencias y patrones que coinciden con la selección.

Transformaciones enriquecidas

Aprovecha cientos de funciones de transformación para convertir los datos en los elementos que deseas. Con tan solo un clic, puedes aplicar agregaciones, dinamizar, anular la dinamización, realizar juntas, uniones, extracciones, cálculos, comparaciones, condiciones y combinaciones; usar expresiones regulares y mucho más.

Capacidad de procesamiento de procesamiento optimizada

Dataprep selecciona automáticamente el mejor motor de procesamiento subyacente de Google Cloud para transformar los datos lo más rápido posible. Según la localidad y el volumen de los datos, Dataprep aprovecha BigQuery (transformaciones ELT en el lugar) para preparar los datos, Dataflow o el motor de memoria en Dataprep para los pequeños volúmenes.

Creación de perfiles activa

Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y se puede visualizar información estadística clave en un formato dinámico y sencillo con las técnicas innovadoras de perfilado de Cloud Dataprep.

Reglas de calidad de los datos

Con estas reglas, se sugieren indicadores de calidad de los datos para supervisar y mejorar la exactitud, la integridad, la coherencia, la validez y la unicidad de los datos, lo que garantiza que tengas una vista integral de su claridad.

Colaboración

En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que hagan copias de las tareas de buena calidad realizadas para usarlas como plantillas en otros trabajos. Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.

Conectividad integral

Además de BigQuery, Cloud Storage, Microsoft Excel y la conectividad estándar de Hojas de cálculo de Google, debes enriquecer tus análisis de autoservicio con cientos de fuentes de datos como Salesforce, Oracle, Microsoft SQL Server, MySQL y PostgreSQL y mucho más.

Organización de canalizaciones de datos

Programa y automatiza tus trabajos de preparación de datos mediante la encadenación en un orden secuencial y condicional. Comunica a los usuarios los éxitos o los errores y activa tareas externas (como Cloud Functions). Aprovecha las API integrales para integrar Dataprep como parte de la solución de extremo a extremo de una empresa.

Funcionamiento a escala empresarial

Adopta una práctica de implementación continua con la importación o exportación de recetas en todas las ediciones y versiones, los parámetros de flujo, la configuración personalizada para el ajuste de rendimiento de Dataflow o BigQuery y las API avanzadas para automatizar los ciclos de vida y la supervisión del desarrollo de software.

Tipos comunes de datos

Transforma conjuntos de datos estructurados o no estructurados, almacenados en CSV, JSON, formatos de tablas relacionales o datos de aplicaciones SaaS de cualquier tamaño (desde megabytes hasta petabytes), con la misma facilidad y simplicidad.

Coincidencia de patrones

Usa la coincidencia de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz a fin de usarlos en la compilación de tus recetas. Además, en los pasos de tu receta puedes aplicar expresiones regulares o patrones de Dataprep para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Estandarización

Agrupa valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.

Muestreo

Para optimizar el rendimiento, Dataprep genera de forma automática una o más muestras de datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar de manera sencilla el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.

Seguridad avanzada

Amplía los estándares actuales de seguridad. Para ello, brinda control de acceso de datos individuales mediante una combinación de funciones de Google IAM y derechos de acceso de BigQuery, Cloud Storage y Hojas de cálculo de Google a fin de determinar el acceso.

Arquitectura de la canalización de Dataprep ELT

A la izquierda, la columna Transferencia contiene datos sin procesar en BigQuery, Cloud Storage, Hojas de cálculo de Google, Microsoft Excel, bases de datos, aplicaciones y carga de archivos. El flujo se mueve hacia la derecha, a través de la columna Preparación y Almacenamiento en Cloud Dataprep y Dataflow, los datos se definen mejor en BigQuery y Cloud Storage. En esta columna, se encuentra Administración y automatización: Data Catalog, Cloud Functions y Cloud Composer. El flujo continúa directamente hacia la columna Análisis y AA, con BigQuery/BigQuery ML, Looker, Google Data Studio, servicios de BI para socios (logotipo de Qlik) y Cloud AI Platform.

Dataprep nos permite explorar conjuntos de datos nuevos con rapidez, y su flexibilidad admite todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% el tiempo de preparación.

Henry Culver, arquitecto de TI, Merkle

Nuestros clientes

Recursos

Precios

Dataprep es una aplicación web interactiva que permite a los usuarios interactuar con una muestra de sus datos a fin de definir reglas para prepararlos. Para la ejecución del flujo sobre el conjunto de datos completo, el flujo se puede ejecutar como un trabajo de Dataprep (con Dataflow).  Los precios se dividen en dos variables; diseño y ejecución. El precio del diseño se aplica según el proyecto para una cantidad de usuarios ilimitada. El precio de la ejecución consiste en el uso de Dataflow en los trabajos que se ejecutan en Dataprep. Obtén más información y revisa todos los detalles en nuestra página de precios en Google Cloud Marketplace. 

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Sigue explorando