Dataplex
Olvídate de los silos de datos con el tejido de datos inteligente de Dataplex que permite a las organizaciones gestionar, monitorizar y gobernar los datos de forma centralizada en lagos de datos, almacenes de datos y data marts mediante controles coherentes. Gracias a todo esto, puedes acceder a datos de confianza y disfrutar de análisis potentes a escala.
-
Panel único para gestionar los datos en silos de datos
-
Seguridad y gobierno centralizados para disponer de propiedad distribuida de datos con control mundial
-
Búsqueda y descubrimiento unificados, en función del contexto empresarial, en datos distribuidos
-
Inteligencia de datos integrada para generar confianza en los datos y reducir el tiempo de acceso a información valiosa
-
Plataforma abierta compatible con herramientas de código abierto y un ecosistema de partners robusto
Ventajas
Libertad de elección
Disfruta de la libertad de almacenar los datos donde quieras por el mejor precio y rendimiento, así como de elegir las mejores herramientas de analíticas, de código abierto o nativas de la nube para acelerar el ciclo de vida de las analíticas de principio a fin.
Automatización inteligente
La inteligencia de datos integrada con las funciones de inteligencia artificial y aprendizaje automático de primera categoría de Google automatiza el descubrimiento de datos, la recogida de metadatos, la gestión del ciclo de vida, la calidad de los datos y el linaje para reducir los costes.
Gobierno unificado
Habilita la estandarización y la unificación de metadatos, las políticas de seguridad y el gobierno y la clasificación de datos para mantener la coherencia en todos los datos distribuidos.
Funciones principales
Características principales
Descubrimiento de datos simplificado
Automatiza el descubrimiento, la clasificación y los metadatos de los datos estructurados, semiestructurados y no estructurados que están almacenados en Google Cloud y en otras plataformas gracias a la inteligencia de datos integrada. Gestiona metadatos técnicos, operativos y empresariales de todos tus datos en un catálogo de datos unificado, flexible y potente. Busca, encuentra e interpreta fácilmente tus datos con la interfaz de búsqueda por facetas integrada que utiliza la misma tecnología de búsqueda que Gmail.
Organización de datos y gestión del ciclo de vida
Organiza de forma lógica los datos que abarcan varios servicios de almacenamiento en dominios específicos para empresas mediante lagos y zonas de datos de Dataplex. Gestiona, selecciona, categoriza y archiva tus datos fácilmente con un solo clic.
Seguridad y gobernanza centralizadas
Habilita la gestión, la monitorización y la auditoría centralizadas de políticas para la autorización y clasificación de datos en varios silos. Facilita la distribución distribuida de la información según los dominios de la empresa con monitorización y control mundiales.
Calidad y linaje de los datos integrados
Automatiza la calidad de los datos distribuidos y accede a ellos con confianza. Usa el linaje de datos capturado automáticamente para comprender mejor tus datos, rastrear dependencias y solucionar problemas de datos de forma eficaz.
Exploración de datos sin servidor
Realiza consultas interactivas de datos de alta calidad mediante un banco de trabajo de exploración de datos sin servidor y acceso con un solo clic a secuencias de comandos de Spark SQL y cuadernos de Jupyter. Colabora fácilmente entre equipos con las funciones integradas de publicación, uso compartido y búsqueda. Operación de tu trabajo con la programación con un solo clic desde el banco de trabajo.
"Tenemos petabytes de datos almacenados en Google Cloud a los que acceden 1000 usuarios internos cada día. Dataplex nos permite ofrecer una plataforma de datos autoservicio y específica del dominio empresarial con todos los datos distribuidos y con una propiedad de los datos descentralizada, pero con control y visibilidad centralizados. Estamos entusiasmados por adoptar Dataplex como componente central para crear una malla de datos unificada en nuestros datos de analíticas".
Saral Jain, director de Ingeniería de Snap Inc
Novedades
¿Quieres informarte más sobre Dataplex?
Documentación
Documentación
Cómo funciona Dataplex
Cuando identificas nuevas fuentes de datos, Dataplex recoge los metadatos de los datos estructurados y sin estructurar mediante controles integrados de calidad de los datos para mejorar la integridad.
Información general de Data Catalog
Descubre cómo Data Catalog optimiza el uso eficiente de los datos.
Cómo empezar a utilizar Dataplex
Organiza de forma lógica los datos almacenados en lagos y zonas, y automatiza su gestión y su gobierno para hacer analíticas a escala.
Buscar con Data Catalog
Usa Data Catalog para buscar en tus proyectos de Google Cloud distintos recursos de datos, como conjuntos de datos, tablas, vistas y temas de Pub/Sub.
Prácticas recomendadas de Dataplex
Sigue estas prácticas recomendadas para optimizar tu experiencia de Dataplex.
API de Dataplex
Usa las APIs de Dataplex para gestionar y gestionar de forma centralizada los datos distribuidos.
API de Data Catalog
Usa las APIs de Data Catalog para gestionar y enriquecer los datos de forma centralizada.
Usos
Usos
Crea una arquitectura de malla de datos específica de un dominio empresarial con datos de Cloud Storage y BigQuery con Dataplex. Habilita la propiedad descentralizada de los datos con una gestión, una monitorización y un gobierno de datos centralizados en toda tu empresa. Además, esos datos serán accesibles de forma segura mediante una amplia variedad de herramientas de analíticas y de ciencia de datos.
Busca y descubre fácilmente tus recursos de datos en silos de datos con un catálogo de datos totalmente gestionado y sin servidor en Dataplex. Gracias a las funciones integradas de Data Catalog para ingerir automáticamente metadatos técnicos, enriquecer los metadatos con el contexto empresarial pertinente y permitir que todos los usuarios de tu organización encuentren y comprendan fácilmente sus datos mediante una potente interfaz de búsqueda.
Precios
Precios
Los precios de Dataplex se basan en el pago por uso, por ejemplo:
- Procesamiento de Dataplex, que cubre la función de descubrimiento de datos de Dataplex
- Almacenamiento de metadatos del catálogo de datos
- Llamadas de lectura, escritura y búsqueda en la API de catálogo de datos
Los productos de inteligencia artificial de Cloud cumplen las políticas del acuerdo de nivel de servicio. Pueden ofrecer garantías de latencia o disponibilidad diferentes respecto a otros servicios de Google Cloud.