Dataplex
Olvídate de los sistemas aislados de datos con el tejido de datos inteligente de Dataplex, que permite a las organizaciones descubrir, administrar, supervisar y controlar de forma centralizada sus datos en todos los data lakes, los almacenes de datos y los data marts con controles coherentes y proporciona acceder a datos de confianza y potenciar las estadísticas a gran escala.
-
Panel único para la administración de datos entre sistemas aislados de datos
-
Seguridad y administración centralizadas que permiten la propiedad distribuida de datos con control global
-
Búsqueda unificada y descubrimiento de datos en función del contexto empresarial en datos distribuidos
-
Inteligencia de datos integrada para permitir la confianza en los datos y acelerar el tiempo de obtención de estadísticas
-
Una plataforma abierta compatible con herramientas de código abierto y un ecosistema de socios sólido
Ventajas
Libertad de elección
Obtén la libertad de almacenar datos donde quieras obtener el mejor precio y con el mejor rendimiento, a la vez que eliges las mejores herramientas estadísticas, código abierto o nativo de la nube para acelerar todo el ciclo de vida de estadísticas.
Automatización inteligente
Inteligencia de datos integrada, con las mejores funciones de IA y AA de Google que automatizan el descubrimiento de datos, la recopilación de metadatos, la administración del ciclo de vida de los datos y la calidad y el linaje de los datos para reducir los costos de administración.
Administración unificada
Habilita la estandarización y la unificación de los metadatos, las políticas de seguridad, la administración y la clasificación de datos para la coherencia entre los datos distribuidos.
Características clave
Características clave
Descubrimiento de datos simplificado
Automatiza el descubrimiento de datos, la clasificación y el enriquecimiento de metadatos de los datos estructurados, semiestructurados y no estructurados almacenados en Google Cloud y otras plataformas con inteligencia de datos integrada. Administra metadatos técnicos, operativos y empresariales para todos tus datos en un Data Catalog unificado, flexible y potente. Busca, encuentra y comprende tus datos con facilidad mediante una interfaz de búsqueda por facetas integrada con la misma tecnología de búsqueda de Gmail.
Organización de datos y administración del ciclo de vida
Organiza de manera lógica tus datos que abarcan varios servicios de almacenamiento en dominios específicos de la empresa mediante data lakes y zonas de datos de Dataplex. Administra, selecciona, clasifica y archiva tus datos fácilmente con un solo clic.
Seguridad y administración centralizadas
Habilita la supervisión, la auditoría y la administración central de políticas para la autorización y clasificación de datos en varios sistemas aislados de datos. Facilita la propiedad de los datos distribuidos según los dominios empresariales con supervisión y administración globales.
Calidad y linaje de los datos integrados
Automatiza la calidad de los datos distribuidos y permite el acceso a datos en los que puedes confiar. Usa el linaje de datos capturado automáticamente para comprender mejor tus datos, hacer un seguimiento de las dependencias y solucionar problemas de datos de forma eficaz.
Exploración de datos sin servidores
Consulta de forma interactiva datos completamente administrados y de alta calidad en un área de trabajo de exploración de datos sin servidores con acceso mediante un clic a las secuencias de comandos de Spark SQL y a los notebooks de Jupyter. Colabora con facilidad entre equipos mediante funciones integradas de publicación, uso compartido y búsqueda. Pon en funcionamiento tu trabajo con la programación de un clic desde el área de trabajo.
“Tenemos varios PB de datos almacenados en Google Cloud, a los que acceden 1,000 usuarios internos todos los días. Dataplex nos permite entregar una plataforma de datos de autoservicio específica del dominio empresarial mediante datos distribuidos, con propiedad descentralizada de datos, pero administración y visibilidad centralizadas. Estamos muy entusiasmados por adoptar Dataplex como componente central para compilar una malla de datos unificada en todos nuestros datos de estadísticas”.
Saral Jain, director de Ingeniería, Snap Inc
Novedades
¿Quieres obtener más información sobre Dataplex?
Documentación
Documentación
Cómo funciona Dataplex
A medida que identificas nuevas fuentes de datos, Dataplex recopila los metadatos de los datos estructurados y no estructurados mediante verificaciones de calidad de los datos integradas para mejorar la integridad.
Descripción general de Data Catalog
Descubre cómo Data Catalog potencia el uso eficiente de tus datos.
Cómo comenzar a usar Dataplex
Organiza de manera lógica tus datos almacenados en data lakes y zonas, y automatiza la administración y la administración de los datos en función de las estadísticas a gran escala.
Cómo buscar con el Data Catalog
Usa Data Catalog para realizar búsquedas de recursos de datos, como conjuntos de datos, tablas, vistas y temas de Pub/Sub en tus proyectos de Google Cloud.
Prácticas recomendadas sobre Dataplex
Sigue estas prácticas recomendadas para optimizar tu experiencia de Dataplex.
API de Dataplex
Usa las APIs de Dataplex para administrar y controlar de forma centralizada los datos distribuidos.
API de Data Catalog
Usa las APIs de Data Catalog para administrar y enriquecer los metadatos de tus datos distribuidos de forma centralizada.
Casos de uso
Casos de uso
Compila una arquitectura de malla de datos específica del dominio empresarial para todos los datos en Cloud Storage y BigQuery mediante Dataplex. Habilita la propiedad descentralizada de datos mientras mantienes la administración, la supervisión y la administración de los datos en tu empresa, y haz que estos sean accesibles de manera segura para una variedad de herramientas de ciencia de datos y estadísticas.
Busca y descubre con facilidad los recursos de datos en tus sistemas aislados de datos utilizando Data Catalog completamente administrado y sin servidores en Dataplex. Data Catalog proporciona funciones incorporadas para transferir metadatos técnicos de forma automática, enriquecer los metadatos con un contexto empresarial relevante y permitir que todos los usuarios de tu organización encuentren y comprendan fácilmente sus datos mediante una potente interfaz de búsqueda por facetas.
Precios
Precios
Los precios de Dataplex se basan en el uso de pago por uso, incluidos los siguientes:
- Procesamiento de Dataplex, que abarca la función de descubrimiento de datos en Dataplex
- Almacenamiento de metadatos de Data Catalog
- Llamadas a la API de lectura, escritura y búsqueda de Data Catalog
Los productos de IA de Cloud satisfacen las políticas de nuestros ANS. Es posible que ofrezcan garantías de latencia o disponibilidad distintas de otros servicios de Google Cloud.