Ver bajo demanda: Google Data Cloud Summit, donde podrás descubrir las últimas novedades sobre bases de datos, analíticas, inteligencia artificial e inteligencia empresarial.

Dataprep de Trifacta

Servicio inteligente de datos en la nube que te permite examinar, limpiar y preparar datos de forma visual para analizarlos y crear modelos de aprendizaje automático.

Consulta la documentación de este producto.

Icono de Dataprep delante de un portátil abierto con una pila de páginas web a la derecha, una hoja de cálculo con el logotipo de Trifacta a la izquierda y un gráfico de barras en la nube

Preparación inteligente de datos

Dataprep de Trifacta es un servicio de datos inteligente que sirve para examinar, limpiar y preparar datos estructurados y no estructurados de forma visual para procesos de análisis, creación de informes y aprendizaje automático. Dado que prescinde de servidores y funciona a cualquier escala, no hace falta desplegar ni gestionar ninguna infraestructura. Cada vez que introduces datos en la interfaz de usuario, este servicio predice y te sugiere la transformación que deberías llevar a cabo, por lo que no es necesario que escribas ningún código.

Novedades

Monitor de ordenador con datos en pantalla

Simplicidad sin servidor

Dataprep es un servicio de partners integrado operado porTrifacta, que se basa en su solución de preparación de datos líder en el sector. En Google, colaboramos estrechamente con Trifacta para ofrecer una experiencia de usuario fluida en la que no sea necesario instalar software de forma anticipada, adquirir licencias independientes ni incurrir en una sobrecarga operativa continua. En función del volumen de datos que debas preparar, puedes escalar bajo demanda este servicio totalmente gestionado y centrar tu atención únicamente en el análisis.

Gráfico estilizado con un icono de cronómetro

Mayor rapidez en el análisis de datos y en la detección de anomalías

Interpreta y examina los datos al momento gracias a las funciones visuales de distribución de datos. Dataprep detecta de forma automática esquemas, tipos de datos, posibles uniones y anomalías (como duplicados y valores que faltan o que son atípicos) para que ahorres tiempo, ya que te permite saltarte la evaluación de la calidad de los datos y pasar directamente a su examen y a su análisis.

Una página con textos y marcas de verificación azules en el margen derecho sale de una caja de cartón abierta. El icono de Dataprep se encuentra a la izquierda.

Preparación de datos fácil y potente

Para cada acción que realices en su interfaz, Dataprep sugiere y predice automáticamente cuál es la transformación de datos idónea. Una vez que hayas definido la secuencia de transformaciones, Dataprep utiliza Dataflow o BigQuery de forma interna, con lo que podrás procesar conjuntos de datos estructurados o sin estructurar de cualquier tamaño con solo unos clics y sin programación.

Características de Dataprep

Ediciones Starter, Professional y Enterprise.

Transformación predictiva

Dataprep utiliza un algoritmo de inferencia propio para interpretar el intent de transformación que implica la selección de datos del usuario. Entonces, genera automáticamente una lista ordenada con sugerencias y patrones adecuados para esa selección.

Transformaciones enriquecidas

Aprovecha los centenares de funciones de transformación para convertir los datos en el recurso que te interesa. Basta un clic para aplicar funciones de agregación, columnas dinámicas, anulación de columnas dinámicas, incorporación de columnas, incorporación de filas, extracción, cálculo, comparación, condición, combinación, expresión regular y muchas más.

Rendimiento de procesamiento optimizado

Dataprep selecciona automáticamente el mejor motor de procesamiento de Google Cloud subyacente para transformar los datos lo más rápido posible. De acuerdo con la localidad y el volumen de los datos, Dataprep utiliza BigQuery (transformaciones de ELT in situ) para preparar los datos, Dataflow o el motor en memoria de Dataprep de volúmenes pequeños.

Elaboración activa de perfiles

Consulta y examina tus datos mediante distribuciones visuales interactivas que facilitan el descubrimiento, la limpieza y la transformación. Las representaciones visuales ayudan a interpretar grandes volúmenes de datos, y las innovadoras técnicas de elaboración de perfiles de Dataprep reflejan información estadística clave en un formato dinámico e intuitivo.

Reglas de calidad de los datos

Las reglas de calidad de los datos sugieren indicadores de calidad para monitorizar y dar solución a la precisión, exhaustividad, coherencia, validez y exclusividad de los datos, lo que permite tener una visión pormenorizada de estos.

Colaboración

En entornos de trabajo en equipo, puede resultar útil que varios usuarios colaboren en los mismos recursos o que se creen copias de los trabajos de calidad óptima para utilizarlas como plantillas. Dataprep permite a los usuarios colaborar en tiempo real en los mismos objetos del flujo, así como generar copias para que las utilicen otros compañeros en trabajos distintos.

Conectividad completa

Además de la conectividad estándar de BigQuery, Cloud Storage, Microsoft Excel y Hojas de cálculo de Google, puedes optimizar tus analíticas de autoservicio con cientos de fuentes de datos, como Salesforce, Oracle, Microsoft SQL Server, MySQL o PostgreSQL, entre muchas otras.

Orquestación de flujos de procesamiento de datos

Programa y automatiza tus tareas de preparación de datos encadenándolas en orden secuencial y condicional. Informa a los usuarios de si los resultados son correctos o tienen errores, y activa tareas externas (como Cloud Functions). Aprovecha la gran variedad de APIs para integrar Dataprep como solución integral de empresa.

Operacionalización a escala empresarial

Adopta una práctica de despliegue continuo con la importación y exportación de recetas en diferentes ediciones y versiones, parámetros de flujo, configuración personalizada para Dataflow o BigQuery, ajustes de rendimiento y APIs avanzadas para automatizar los ciclos de vida y la monitorización del desarrollo de software.

Tipos de datos habituales

Transforma conjuntos de datos, tanto estructurados como sin estructurar, almacenados en formato CSV, JSON, de tabla relacional o de aplicaciones de software como servicio de cualquier tamaño, desde megabytes hasta petabytes: siempre te resultará igual de fácil manipularlos.

Coincidencia de patrones

Utiliza la coincidencia de patrones en columnas para identificar los patrones de datos que te interesan, mostrarlos en la interfaz y usarlos para crear tus recetas. También puedes aplicar expresiones regulares o patrones de Dataprep a los pasos de las recetas para localizar patrones y transformar los datos de tus conjuntos que coincidan.

Estandarización

Agrupa los valores según las similitudes en función de la ortografía o una pronunciación independiente del idioma y crea clústeres estandarizados de valores coherentes.

Muestreo

Para optimizar el rendimiento, Dataprep genera automáticamente una o varias muestras de los datos que se deben visualizar y manipular en la aplicación del cliente. No obstante, puedes cambiar fácilmente el tamaño de las muestras, su alcance y el método con el que se crean.

Seguridad avanzada

Amplía los estándares de seguridad actuales ofreciendo un control de acceso individual a los datos mediante una combinación de derechos de acceso entre los roles de gestión de identidades y accesos de Google y BigQuery, Cloud Storage y Hojas de cálculo de Google para determinar el acceso.

Arquitectura de flujo de procesamiento de ELT de Dataprep

A la izquierda, la columna Ingestión contiene datos sin procesar de BigQuery, Cloud Storage, Hojas de cálculo de Google, Microsoft Excel, Bases de datos, Aplicaciones y Subida de archivos. El flujo se mueve hacia la derecha, gracias a la columna Preparación y almacenamiento de Cloud Dataprep y Dataflow, los datos se ajustan mejor en BigQuery y en Cloud Storage. En esta columna se muestran Gobernanza y automatización: Data Catalog, Cloud Functions y Cloud Composer. Continuará directamente con la columna Análisis y aprendizaje automático, además de BigQuery/BigQueryML, Looker, Google Data Studio, servicios de Partner BI (el logotipo de Qlik) y Cloud AI Platform.
Logotipo de Merkle

"Dataprep nos permite consultar rápidamente nuevos conjuntos de datos, y su flexibilidad es capaz de satisfacer todas nuestras necesidades en cuanto a transformación de datos. Ahora, en Merkle completamos las tareas de preparación de datos en cuestión de minutos en lugar de horas o días; es decir, hemos reducido en un 90 % el tiempo de preparación".

Henry Culver, arquitecto de TI de Merkle

Leer testimonio

Nuestros clientes

Precios

Consulta nuestra página de precios en Google Cloud Marketplace.

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.

¿Necesitas ayuda para empezar?
Colabora con un partner de confianza
Sigue explorando nuestras soluciones

Ve un paso más allá

Pon en marcha tu próximo proyecto, descubre tutoriales interactivos y gestiona tu cuenta.

¿Necesitas ayuda para empezar?
Colabora con un partner de confianza
Lee consejos y prácticas recomendadas