Mira on demand: Cumbre de datos de la nube de Google para conocer las innovaciones más recientes en estadísticas, IA, inteligencia empresarial y bases de datos.

Dataprep by Trifacta

Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar de manera visual los datos para el análisis y el aprendizaje automático.

Consulta la documentación de este producto.

El ícono de Dataprep se encuentra frente a una laptop abierta con una pila de páginas web a la derecha, una hoja de cálculo con el logotipo de Trifacta a la izquierda y un gráfico de barras en la nube detrás

Preparación inteligente de datos

Dataprep by Trifacta es un servicio inteligente de datos que permite explorar, limpiar y preparar de manera visual datos estructurados y no estructurados para el análisis, la elaboración de informes y el aprendizaje automático. Como Dataprep funciona sin servidores y a cualquier escala, no se requiere infraestructura para su implementación o administración. Cada entrada en la IU te sugiere y predice la siguiente transformación de datos ideal de modo que no tengas que escribir código.

Novedades

Monitor de computadora con datos en pantalla

Simplicidad sin servidores

Dataprep es un servicio integrado de socios que opera Trifacta, basado en su solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia del usuario optimizada que quita la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Dataprep está completamente administrado y ajusta la escala a pedido para satisfacer tus necesidades en aumento de preparación de datos, lo que permite que te enfoques en el análisis.

Gráfico estilizado con un ícono de cronómetro

Exploración rápida y detección de anomalías

Comprende y explora la información al instante con las distribuciones visuales de datos. Dataprep detecta automáticamente los esquemas, los tipos de datos, las uniones posibles y las anomalías, como valores faltantes, atípicos y duplicados. Olvídate de la tediosa tarea de evaluar la calidad de los datos y comienza a explorarlos y analizarlos de inmediato.

Página con texto y marcas de verificación azules en el margen derecho que emerge de una caja de cartón abierta. El ícono de Dataprep se encuentra a la izquierda.

Preparación de datos de forma fácil y eficiente

Con cada gesto en la IU, Dataprep te sugiere y predice automáticamente la siguiente transformación ideal de los datos. Luego de definir la secuencia de transformaciones, Dataprep usa Dataflow o BigQuery de forma interna para el procesamiento de conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics o sin la necesidad de escribir código.

Funciones de Dataprep

Ediciones Starter, Professional y Enterprise

Transformación predictiva

Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intento de transformación de los datos a partir de la selección de datos de un usuario. Además, genera automáticamente un conjunto clasificado de sugerencias y patrones que coinciden con la selección.

Transformaciones enriquecidas

Aprovecha cientos de funciones de transformación para convertir los datos en los elementos que deseas. Con tan solo un clic, puedes aplicar agregaciones; dinamizar; anular la dinamización; realizar juntas, uniones, extracciones, cálculos, comparaciones, condiciones y combinaciones; usar expresiones regulares y mucho más.

Capacidad de procesamiento optimizada

Dataprep selecciona automáticamente el mejor motor de procesamiento subyacente de Google Cloud para transformar los datos lo más rápido posible. Según la localidad y el volumen de los datos, Dataprep aprovecha BigQuery (transformaciones ELT en el lugar) para preparar los datos, Dataflow o el motor de memoria en Dataprep para los pequeños volúmenes.

Creación de perfiles activa

Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y se puede visualizar información estadística clave en un formato dinámico y sencillo con las técnicas innovadoras de perfilado de Dataprep.

Reglas de calidad de los datos

Con estas reglas, se sugieren indicadores de calidad de los datos para supervisar y mejorar la exactitud, la integridad, la coherencia, la validez y la unicidad de los datos, lo que garantiza que tengas una vista integral de su grado de limpieza.

Colaboración

En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que se hagan copias de los trabajos de buena calidad para usarlas como plantillas en otros trabajos. Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.

Conectividad integral

Además de BigQuery, Cloud Storage, Microsoft Excel y la conectividad estándar de Hojas de cálculo de Google, debes enriquecer tus análisis de autoservicio con cientos de fuentes de datos, como Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL y mucho más.

Organización de canalizaciones de datos

Programa y automatiza tus trabajos de preparación de datos a través de la encadenación en un orden secuencial y condicional. Comunica a los usuarios los éxitos o los errores y activa tareas internas (como Cloud Functions). Aprovecha las APIs integrales para incorporar Dataprep como parte de la solución de extremo a extremo de una empresa.

Funcionamiento a escala empresarial

Adopta una práctica de implementación continua con la importación o exportación de recetas entre diferentes ediciones y versiones, parámetros de flujo, configuraciones personalizadas para Dataflow o BigQuery, ajustes de rendimiento y APIs avanzadas para automatizar los ciclos de vida y la supervisión del desarrollo de software.

Tipos comunes de datos

Transforma conjuntos de datos estructurados o no estructurados, almacenados en CSV, JSON, formatos de tablas relacionales o datos de aplicaciones SaaS de cualquier tamaño (desde megabytes hasta petabytes), con la misma facilidad y simplicidad.

Coincidencia de patrones

Usa la coincidencia de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz a fin de usarlos en la compilación de tus recetas. Además, puedes aplicar expresiones regulares o patrones de Dataprep en los pasos de tu receta para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Estandarización

Agrupa valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.

Muestreo

Para optimizar el rendimiento, Dataprep genera automáticamente una o más muestras de datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar con facilidad el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.

Seguridad avanzada

Amplía los estándares actuales de seguridad. Para ello, brinda control de acceso de datos individuales con una combinación de roles de Google IAM y derechos de acceso de BigQuery, Cloud Storage y Hojas de cálculo de Google para determinar el acceso.

Arquitectura de la canalización ELT de Dataprep

A la izquierda, la columna Transferencia contiene datos sin procesar en BigQuery, Cloud Storage, Hojas de cálculo de Google, Microsoft Excel, bases de datos, aplicaciones y carga de archivos. El flujo se mueve hacia la derecha, a la columna Preparación y Almacenamiento, para pasar por Cloud Dataprep y Dataflow, y los datos se definen mejor en BigQuery y Cloud Storage. En esta columna, se encuentra la categoría Administración y automatización, que abarca Data Catalog, Cloud Functions y Cloud Composer. El flujo continúa hacia la derecha, a la columna Análisis y AA, que abarca BigQuery/BigQueryML, Looker, Google Data Studio, servicios de IE para socios (logotipo de Qlik) y Cloud AI Platform.
Logotipo de Merkle

“Dataprep nos permite explorar nuevos conjuntos de datos con rapidez, y su flexibilidad cumple con todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% el tiempo de preparación”.

Henry Culver, arquitecto de TI, Merkle

Leer la historia

Nuestros clientes

Precios

Consulta nuestra página de precios en Google Cloud Marketplace.

Da el siguiente paso

Comienza a crear en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Sigue explorando

Da el siguiente paso

Comienza un nuevo proyecto, explora los instructivos interactivos y administra tu cuenta.

¿Necesitas ayuda para comenzar?
Trabaja con un socio confiable
Obtén sugerencias y prácticas recomendadas