Cloud Dataprep de Trifacta

Un servicio inteligente de datos en la nube que permite examinar, limpiar y preparar datos de forma visual para analizarlos y crear modelos de aprendizaje automático

Preparación inteligente de datos

Preparación inteligente de datos

Cloud Dataprep de Trifacta es un servicio de datos inteligente que sirve para examinar, limpiar y preparar datos estructurados y no estructurados de forma visual para procesos de análisis, creación de informes y aprendizaje automático. Dado que prescinde de servidores y funciona a cualquier escala, no hace falta desplegar ni gestionar ninguna infraestructura. Cada vez que introduces datos en la interfaz de usuario, la solución predice y te sugiere la transformación que deberías llevar a cabo a continuación, por lo que no es necesario que escribas ningún código. Además, gracias a la detección automática de esquemas, tipos de datos, posibles uniones y anomalías, te puedes saltar el lento proceso de elaborar perfiles de datos para centrarte en su análisis.

Simplicidad sin servidor

Simplicidad sin servidor

Cloud Dataprep es un servicio integrado y operado por un partner, Trifacta, que se basa en su solución de preparación de datos líder en el sector: Trifacta Wrangler. En Google, colaboramos estrechamente con este partner para ofrecer una experiencia de usuario fluida en la que no sea necesario instalar software de forma anticipada, adquirir licencias independientes ni incurrir en gastos operativos innecesarios. Se trata de un servicio totalmente gestionado que escala sus características en función del volumen de datos que necesitas preparar, por lo que puedes centrarte en el análisis.

Mayor rapidez en el análisis de datos y en la detección de anomalías

Mayor rapidez en el análisis de datos y en la detección de anomalías

Interpreta y examina datos al momento gracias a las funciones visuales de distribución de datos de Cloud Dataprep. El servicio detecta automáticamente esquemas, tipos de datos y posibles uniones y anomalías (como duplicados y valores que faltan o que son atípicos) para que puedas ahorrar tiempo, ya que te permite saltarte la fase de elaboración de perfiles y pasar directamente al análisis de los datos.

Preparación de datos fácil y potente

Preparación de datos fácil y potente

Cloud Dataprep responde a las acciones que realizas en su interfaz; así pues, sugiere y predice la transformación de datos idónea que deberías llevar a cabo. Una vez que hayas definido la secuencia de transformaciones, este servicio utiliza Cloud Dataflow de forma interna y te permite procesar conjuntos de datos estructurados o no estructurados de cualquier tamaño con solo unos clics y sin necesidad de códigos.

Clientes de Cloud Dataprep

Cloud Dataprep nos permite examinar nuevos conjuntos de datos rápidamente. Es un servicio muy flexible que cubre todas nuestras necesidades en materia de transformación de datos. Las tareas de preparación de datos que llevamos a cabo en Merkle se completan ahora en cuestión de minutos en lugar de horas o días, lo que ha supuesto que la velocidad de preparación de los datos haya aumentado en un 90 %.

Henry Culver, arquitecto de TI de Merkle

Arquitectura de Cloud Dataprep

Arquitectura de Cloud Dataprep

Características de Cloud Dataprep

Transformación predictiva

Cloud Dataprep utiliza un algoritmo de inferencia propio para interpretar los intentos de transformación que un usuario lleva a cabo en una selección de datos. Automáticamente, se genera una lista ordenada de sugerencias y patrones para que las selecciones se correspondan.

Parametrización

Ejecuta una receta en varias instancias de conjuntos de datos idénticos. Para ello, parametriza una variable de forma que se sustituyan las partes de la ruta de archivo que cambien con cada actualización. Esta variable se puede modificar según lo necesites en el momento de ejecutar tareas.

Colaboración

En entornos de trabajo colaborativo, puede resultar útil que varios usuarios trabajen en los mismos recursos o que se creen copias de un trabajo de calidad óptima para utilizarlo de referencia. Cloud Dataprep permite a los usuarios colaborar en tiempo real en los mismos objetos del flujo, así como generar copias para que otros compañeros las utilicen al realizar su trabajo.

Correspondencia de patrones

Utiliza la correspondencia de patrones en columnas para identificar patrones de datos que te interesen. Visualízalos en la interfaz y utilízalos en la creación de recetas. Además, tienes la posibilidad de aplicar expresiones regulares o patrones de Cloud Dataprep en los pasos de tus recetas. De esta forma, podrás determinar patrones y transformar los datos que coincidan en tus conjuntos de datos.

Elaboración de perfiles visuales

Consulta y examina tus datos mediante distribuciones visuales interactivas que te serán muy útiles en las tareas de descubrimiento, limpieza y transformación. Las representaciones visuales ayudan a interpretar grandes volúmenes de datos, y las innovadoras técnicas de elaboración de perfiles de Cloud Dataprep reflejan información estadística clave en un formato dinámico e intuitivo.

Muestreo

Para optimizar el rendimiento, Cloud Dataprep genera automáticamente una o varias muestras de los datos que se van a mostrar y manipular en la aplicación cliente. Sin embargo, puedes cambiar fácilmente el tamaño de las muestras, su alcance y el método con que se crean.

Programación

Programa la ejecución de recetas en tus flujos con carácter periódico o en función de las necesidades. Cuando la tarea programada se complete, podrás acceder a los datos limpios en la ubicación de salida que se haya especificado, donde estarán disponibles en el formato que indiques.

Correspondencia de destinos

Define esquemas de destino por medio de conjuntos de datos importados o creados, y asígnalos a una receta. Esto te ayudará a sistematizar y agilizar los procesos de preparación de datos. Los destinos se muestran en la página de transformación y se pueden aplicar a todo el conjunto de datos o a las columnas concretas con las que quieras trabajar.

Tipos de datos habituales

Transforma conjuntos de datos, tanto estructurados como no estructurados, almacenados en formato CSV, JSON o en tablas relacionales. Independientemente de su tamaño, desde megabytes hasta petabytes, te resultará muy sencillo manipularlos.

Integración con Google Cloud Platform

Procesa los datos almacenados en Cloud Storage, BigQuery o tu escritorio. Luego, exporta los datos limpios directamente a BigQuery o Cloud Storage para almacenarlos, analizarlos, visualizarlos o crear modelos de aprendizaje automático. Gracias a Gestión de Identidades y Accesos de Cloud, el acceso a los usuarios y la seguridad de los datos se gestionan a la perfección.

Precios de Cloud Dataprep

Cloud Dataprep es una aplicación web interactiva que permite a los usuarios trabajar sobre una muestra de sus datos para definir reglas de preparación. El uso de la aplicación para examinar muestras de datos, definir los pasos de los procesos de transformación y exportar las muestras transformadas es gratuito. Para aplicar el flujo en todo el conjunto de datos, se puede ejecutar como una tarea de Cloud Dataprep (mediante Google Cloud Dataflow). En nuestra guía de precios encontrarás información más detallada.

Recursos

Google Cloud

Primeros pasos

Aprendizaje y desarrollo

¿Acabas de aterrizar en GCP? Empieza a usar cualquiera de los productos de la plataforma con un crédito gratuito de 300 USD.

¿Necesitas más ayuda?

Nuestros expertos te ayudarán a crear la solución adecuada o a encontrar al partner que se ajuste mejor a tus necesidades.

Enviar comentarios sobre...

Cloud Dataprep by Trifacta