Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.
Acompáñanos el 6 de abril en la Cumbre de datos de la nube de Google para conocer las innovaciones más recientes en estadísticas, IA, inteligencia empresarial y bases de datos.

Dataprep de Trifacta

Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar de manera visual los datos para el análisis y el aprendizaje automático.

Consulta la documentación de este producto.

El ícono de Dataprep se encuentra frente a una laptop abierta con una pila de páginas web a la derecha, una hoja de cálculo con el logotipo de Trifacta a la izquierda y un gráfico de barras en la nube detrás

Preparación inteligente de datos

Cloud Dataprep de Trifacta es un servicio inteligente de datos que permite limpiar, preparar y explorar de manera visual datos estructurados y sin estructurar para el análisis, la elaboración de informes y el aprendizaje automático. Como Dataprep funciona sin servidores y a cualquier escala, no requiere infraestructura para implementar o administrar. Cada entrada en la IU le sugiere y predice la siguiente transformación de datos ideal, de modo que usted no deba escribir código.

Novedades

Monitor de computadora con datos en pantalla

Simplicidad sin servidores

Dataprep es un servicio integrado de socios que opera Trifacta, basado en su solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia del usuario optimizada que quita la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Dataprep está completamente administrado y ajusta la escala a pedido para satisfacer sus necesidades en aumento de preparación de datos, lo que permite que usted se enfoque en el análisis.

Gráfico estilizado con un ícono de cronómetro

Exploración rápida y detección de anomalías

Comprende y explora la información al instante con las distribuciones visuales de datos. Dataprep detecta de manera automática los esquemas, los tipos de datos, las uniones posibles y las anomalías, como valores faltantes, atípicos y duplicados. Olvídate de la tediosa tarea de evaluación de calidad de los datos y comienza a explorarlos y analizarlos de inmediato.

Página con texto y marcas de verificación azules en el margen derecho que emerge de una caja de cartón abierta. El ícono de Dataprep se encuentra a la izquierda.

Preparación de datos de forma fácil y eficiente

Con cada gesto en la IU, Dataprep te sugiere y predice de forma automática la siguiente transformación ideal de datos. Luego de definir la secuencia de transformaciones, Dataprep usa Dataflow o BigQuery de forma interna para el procesamiento de conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics o sin la necesidad de escribir código.

Funciones de Dataprep

Ediciones Starter, Professional y Enterprise

Transformación predictiva

Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intent de transformación de los datos a partir de la selección de datos de un usuario. Además, genera automáticamente un conjunto clasificado de sugerencias y patrones que coinciden con la selección.

Transformaciones enriquecidas

Aprovecha cientos de funciones de transformación para convertir los datos en los elementos que deseas. Con tan solo un clic, puedes aplicar agregaciones; dinamizar; anular la dinamización; realizar juntas, uniones, extracciones, cálculos, comparaciones, condiciones y combinaciones; usar expresiones regulares y mucho más.

Capacidad de procesamiento optimizada

Dataprep selecciona automáticamente el mejor motor de procesamiento subyacente de Google Cloud para transformar los datos lo más rápido posible. Según la localidad y el volumen de los datos, Dataprep aprovecha BigQuery (transformaciones ELT en el lugar) para preparar los datos, Dataflow o el motor de memoria en Dataprep para los pequeños volúmenes.

Creación de perfiles activa

Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y se puede visualizar información estadística clave en un formato dinámico y sencillo con las técnicas innovadoras de perfilado de Dataprep.

Reglas de calidad de los datos

Con estas reglas, se sugieren indicadores de calidad de los datos para supervisar y mejorar la exactitud, la integridad, la coherencia, la validez y la unicidad de los datos, lo que garantiza que tengas una vista integral de su claridad.

Colaboración

En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que se hagan copias de los trabajos de buena calidad para usarlas como plantillas en otros trabajos. Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.

Conectividad integral

Además de BigQuery, Cloud Storage, Microsoft Excel y la conectividad estándar de Hojas de cálculo de Google, debes enriquecer tus análisis de autoservicio con cientos de fuentes de datos como Salesforce, Oracle, Microsoft SQL Server, MySQL y PostgreSQL y mucho más.

Organización de canalizaciones de datos

Programa y automatiza tus trabajos de preparación de datos mediante la encadenación en un orden secuencial y condicional. Comunica a los usuarios los éxitos o los errores y activa tareas internas (como Cloud Functions). Aprovecha las API integrales para integrar Cloud Dataprep como parte de la solución de extremo a extremo de una empresa.

Funcionamiento a escala empresarial

Adopta una práctica de implementación continua con la importación o exportación de recetas en todas las ediciones y versiones, los parámetros de flujo, la configuración personalizada para Dataflow o BigQuery, el ajuste de rendimiento y las API avanzadas para automatizar los ciclos de vida y la supervisión del desarrollo de software.

Tipos comunes de datos

Transforma conjuntos de datos estructurados o no estructurados, almacenados en CSV, JSON, formatos de tablas relacionales o datos de aplicaciones SaaS de cualquier tamaño (desde megabytes hasta petabytes), con la misma facilidad y simplicidad.

Coincidencia de patrones

Usa la coincidencia de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz a fin de usarlos en la compilación de tus recetas. Además, en los pasos de tu receta puedes aplicar expresiones regulares o patrones de Dataprep para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Estandarización

Agrupa valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.

Muestreo

Para optimizar el rendimiento, Dataprep genera de forma automática una o más muestras de datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar con facilidad el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.

Seguridad avanzada

Amplía los estándares actuales de seguridad. Para ello, brinda control de acceso de datos individuales mediante una combinación de roles de Google IAM y derechos de acceso de BigQuery, Cloud Storage y Hojas de cálculo de Google a fin de determinar el acceso.

Arquitectura de la canalización de Dataprep ELT

A la izquierda, la columna Transferencia contiene datos sin procesar en BigQuery, Cloud Storage, Hojas de cálculo de Google, Microsoft Excel, bases de datos, aplicaciones y carga de archivos. El flujo se mueve hacia la derecha, a través de la columna Preparación y Almacenamiento en Cloud Dataprep y Dataflow, los datos se definen mejor en BigQuery y Cloud Storage. En esta columna, se encuentra Administración y automatización: Data Catalog, Cloud Functions y Cloud Composer. El flujo continúa directamente hacia la columna Análisis y AA, con BigQuery/BigQuery ML, Looker, Google Data Studio, servicios de BI para socios (logotipo de Qlik) y Cloud AI Platform.
Logotipo de Merkle

"Dataprep nos permite explorar nuevos conjuntos de datos con rapidez, y su flexibilidad cumple con todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% el tiempo de preparación".

Henry Culver, arquitecto de TI, Merkle

Leer la historia

Nuestros clientes

Precios

Dataprep es una aplicación web interactiva que permite a los usuarios interactuar con una muestra de sus datos a fin de definir reglas para prepararlos. Para la ejecución del flujo sobre el conjunto de datos completo, el flujo se puede ejecutar como un trabajo de Dataprep (con Dataflow).  Los precios se dividen en dos variables; diseño y ejecución. El precio del diseño se aplica según el proyecto para una cantidad de usuarios ilimitada. El precio de la ejecución consiste en el uso de Dataflow en los trabajos que se ejecutan en Dataprep. Obtén más información y revisa todos los detalles en nuestra página de precios en Google Cloud Marketplace.

Da el siguiente paso

Comienza a crear en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Sigue explorando

Da el siguiente paso

Comienza un nuevo proyecto, explora los instructivos interactivos y administra tu cuenta.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Obtén sugerencias y prácticas recomendadas