Dataprep by Trifacta
Un servicio inteligente de datos en la nube que permite limpiar, preparar y explorar de manera visual los datos para el análisis y el aprendizaje automático.
Consulta la documentación de este producto.
Preparación inteligente de datos
Novedades
Simplicidad sin servidores
Dataprep es un servicio integrado de socios que opera Trifacta, basado en su solución para la preparación de datos líder en la industria. Google y Trifacta trabajan juntos para brindar una experiencia del usuario optimizada que quita la necesidad de instalar software por adelantado, pagar licencias por separado o mantener costos operativos constantes. Dataprep está completamente administrado y ajusta la escala a pedido para satisfacer tus necesidades en aumento de preparación de datos, lo que permite que te enfoques en el análisis.
Exploración rápida y detección de anomalías
Comprende y explora la información al instante con las distribuciones visuales de datos. Dataprep detecta automáticamente los esquemas, los tipos de datos, las uniones posibles y las anomalías, como valores faltantes, atípicos y duplicados. Olvídate de la tediosa tarea de evaluar la calidad de los datos y comienza a explorarlos y analizarlos de inmediato.
Preparación de datos de forma fácil y eficiente
Con cada gesto en la IU, Dataprep te sugiere y predice automáticamente la siguiente transformación ideal de los datos. Luego de definir la secuencia de transformaciones, Dataprep usa Dataflow o BigQuery de forma interna para el procesamiento de conjuntos de datos estructurados o sin estructurar de cualquier tamaño, con la facilidad de lograrlo con tan solo algunos clics o sin la necesidad de escribir código.
Funciones de Dataprep
Ediciones Starter, Professional y Enterprise
Transformación predictiva
Dataprep usa un algoritmo de inferencia exclusivo para interpretar el intento de transformación de los datos a partir de la selección de datos de un usuario. Además, genera automáticamente un conjunto clasificado de sugerencias y patrones que coinciden con la selección.
Transformaciones enriquecidas
Aprovecha cientos de funciones de transformación para convertir los datos en los elementos que deseas. Con tan solo un clic, puedes aplicar agregaciones; dinamizar; anular la dinamización; realizar juntas, uniones, extracciones, cálculos, comparaciones, condiciones y combinaciones; usar expresiones regulares y mucho más.
Capacidad de procesamiento optimizada
Dataprep selecciona automáticamente el mejor motor de procesamiento subyacente de Google Cloud para transformar los datos lo más rápido posible. Según la localidad y el volumen de los datos, Dataprep aprovecha BigQuery (transformaciones ELT en el lugar) para preparar los datos, Dataflow o el motor de memoria en Dataprep para los pequeños volúmenes.
Creación de perfiles activa
Mira y explora los datos con las distribuciones visuales interactivas para ayudarte a descubrir, limpiar y transformar tus datos. Las representaciones visuales permiten interpretar grandes volúmenes de datos, y se puede visualizar información estadística clave en un formato dinámico y sencillo con las técnicas innovadoras de perfilado de Dataprep.
Reglas de calidad de los datos
Con estas reglas, se sugieren indicadores de calidad de los datos para supervisar y mejorar la exactitud, la integridad, la coherencia, la validez y la unicidad de los datos, lo que garantiza que tengas una vista integral de su grado de limpieza.
Colaboración
En entornos de trabajo en equipo, puede ser útil que varios usuarios trabajen en los mismos elementos o que se hagan copias de los trabajos de buena calidad para usarlas como plantillas en otros trabajos. Dataprep permite que los usuarios colaboren en el mismo flujo de objetos en tiempo real o que hagan copias para que otros las usen de forma independiente en su trabajo.
Conectividad integral
Además de BigQuery, Cloud Storage, Microsoft Excel y la conectividad estándar de Hojas de cálculo de Google, debes enriquecer tus análisis de autoservicio con cientos de fuentes de datos, como Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL y mucho más.
Organización de canalizaciones de datos
Programa y automatiza tus trabajos de preparación de datos a través de la encadenación en un orden secuencial y condicional. Comunica a los usuarios los éxitos o los errores y activa tareas internas (como Cloud Functions). Aprovecha las APIs integrales para incorporar Dataprep como parte de la solución de extremo a extremo de una empresa.
Funcionamiento a escala empresarial
Adopta una práctica de implementación continua con la importación o exportación de recetas entre diferentes ediciones y versiones, parámetros de flujo, configuraciones personalizadas para Dataflow o BigQuery, ajustes de rendimiento y APIs avanzadas para automatizar los ciclos de vida y la supervisión del desarrollo de software.
Tipos comunes de datos
Transforma conjuntos de datos estructurados o no estructurados, almacenados en CSV, JSON, formatos de tablas relacionales o datos de aplicaciones SaaS de cualquier tamaño (desde megabytes hasta petabytes), con la misma facilidad y simplicidad.
Coincidencia de patrones
Usa la coincidencia de patrones en columnas para identificar los patrones de datos que te interesen y mostrarlos en la interfaz a fin de usarlos en la compilación de tus recetas. Además, puedes aplicar expresiones regulares o patrones de Dataprep en los pasos de tu receta para ubicar patrones y transformar los datos que coincidan en tus conjuntos de datos.
Estandarización
Agrupa valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.
Muestreo
Para optimizar el rendimiento, Dataprep genera automáticamente una o más muestras de datos que se pueden ver y administrar en la aplicación cliente. Sin embargo, puedes cambiar con facilidad el tamaño de las muestras, el alcance del conjunto y el método mediante el cual se crean las muestras.
Seguridad avanzada
Amplía los estándares actuales de seguridad. Para ello, brinda control de acceso de datos individuales con una combinación de roles de Google IAM y derechos de acceso de BigQuery, Cloud Storage y Hojas de cálculo de Google para determinar el acceso.
Arquitectura de la canalización ELT de Dataprep
“Dataprep nos permite explorar nuevos conjuntos de datos con rapidez, y su flexibilidad cumple con todas nuestras necesidades de transformación. Ahora, el trabajo de preparación de datos en Merkle se realiza en minutos y no en horas o días, lo que acelera en un 90% el tiempo de preparación”.
Henry Culver, arquitecto de TI, Merkle
Leer la historiaNuestros clientes
Recursos
-
Comienza a usar la guía de inicio rápido de Dataprep
-
Actualizaciones y anuncios del producto de Dataprep
-
Interactúa con otros usuarios de Dataprep en Stack Overflow
-
Preguntas frecuentes sobre Dataprep by TrifactaObtén información sobre cómo Trifacta cumple las normas de seguridad, privacidad y protección de datos
-
Automatiza canalizaciones de Dataprep cuando llegan los archivos con Cloud Functions
-
Trabaja con el lab de autoaprendizaje de Dataprep
-
Automatización del AA con el AA de BigQuery, Dataprep y Cloud Composer
-
Construye un almacén de datos de marketing
-
Cómo transmitir datos de IoT Core a Dataprep
Precios
Consulta nuestra página de precios en Google Cloud Marketplace.
Comienza a crear en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.
Comienza un nuevo proyecto, explora los instructivos interactivos y administra tu cuenta.