Data Catalog

Servicio de descubrimiento de datos y gestión de metadatos muy escalable y totalmente gestionado.

Los nuevos clientes reciben 300 USD en crédito gratuito para gastar en Google Cloud durante la prueba gratuita. Todos los clientes obtienen hasta 1 MiB de almacenamiento de metadatos ingeridos o empresariales y 1 millón de llamadas a la API gratis.

Probar Google Cloud gratis
  • action/check_circle_24px Creado con Sketch

    Localiza tus datos con una interfaz de búsqueda por facetas sencilla pero potente.

  • action/check_circle_24px Creado con Sketch

    Sincroniza los metadatos técnicos automáticamente y crea etiquetas esquematizadas para los metadatos empresariales.

  • action/check_circle_24px Creado con Sketch

    Etiqueta los datos sensibles automáticamente gracias a la integración de Cloud Data Loss Prevention (Cloud DLP).

  • action/check_circle_24px Creado con Sketch

    Consigue acceso al momento y, luego, escala sin tener que configurar ni gestionar ninguna infraestructura.

Ventajas

Simplifica el descubrimiento de datos a cualquier escala

Todos los usuarios del equipo pueden localizar o etiquetar datos accediendo a la API o con la potente interfaz de usuario, creada con la misma tecnología de búsqueda que utiliza Gmail. Como Data Catalog es un servicio totalmente gestionado, no tienes que hacer nada para empezar a utilizarlo ni para escalarlo.

Ofrece una vista unificada de todos los conjuntos de datos

Interpreta los recursos de datos que tienes en Google Cloud y en otros entornos. Gracias a las integraciones con BigQuery, Pub/Sub, Cloud Storage y numerosos conectores, dispones de una vista unificada y un mecanismo de etiquetado de los metadatos tanto técnicos como empresariales.

Proporciona una base para el gobierno de datos

Aplica políticas de seguridad de datos y mantén el cumplimiento mediante las integraciones con Cloud IAM y Cloud DLP. Estas garantizan que solo las personas adecuadas accedan a los datos correctos y que los datos sensibles estén protegidos.

Características principales

Características principales

Sin servidor

Es un servicio escalable y totalmente gestionado para administrar metadatos que no requiere configurar ni gestionar ningún tipo de infraestructura; así, te puedes centrar en el negocio.

Metadatos como servicio

Este servicio de gestión de metadatos cataloga los recursos de datos mediante API personalizadas y la interfaz de usuario para proporcionar una vista unificada de los datos estén donde estén.

Catálogo central

El sistema flexible y potente de catalogación captura tanto los metadatos técnicos (automáticamente) como los empresariales (por etiquetas) en un formato estructurado.

Ver todas las características

Novedades

Novedades

Suscríbete para recibir newsletters de Google Cloud con novedades sobre productos, información de eventos, ofertas especiales y mucho más.

Documentación

Documentación

Guía de inicio rápido
Guía de inicio rápido para etiquetar conjuntos de datos

Forma un conjunto de datos de BigQuery, crea una plantilla de etiqueta con un esquema, busca la entrada de Data Catalog que corresponde a tu tabla y vincula a esta la etiqueta.

Tutorial
Buscar con Data Catalog

Usa Data Catalog para buscar en tus proyectos de Google Cloud distintos recursos de datos, como conjuntos de datos, tablas, vistas y temas de Pub/Sub.

Aspectos básicos de Google Cloud
Restringir el acceso con la seguridad a nivel de columna de BigQuery

En esta página se explica cómo usar la seguridad a nivel de columna de BigQuery para restringir el acceso a los datos de las columnas de esta herramienta.

Tutorial
Acceder a conectores on‑premise de metadatos en GitHub

Accede al código compartido que utilizan los conectores de Data Catalog, así como a enlaces al código de muestra de los conectores.

Usos

Usos

Uso
Ingerir metadatos de recursos de RDBMS on‑premise

Aunque puedes utilizar la API de Data Catalog para crear conectores propios con los que ingerir metadatos de la fuente de datos que escojas, te ofrecemos algunos conectores de código abierto que están listos para usar y permiten ingerir metadatos de varias fuentes de datos populares, como MySQL, PostgreSQL, Hive, Teradata, Oracle, SQL Server o Redshift, entre otras. En cuanto los recursos están en Data Catalog, puedes buscarlos y etiquetarlos.

Integraciones de Data Catalog con Google Cloud y conectores de código abierto
Uso
Ingerir metadatos de sistemas de inteligencia empresarial

Puedes utilizar la API de Data Catalog para ingerir metadatos de cualquier recurso de inteligencia empresarial. Ofrecemos conectores de código abierto y listos para usar con Looker y Tableau, de modo que puedas descubrirlos y etiquetarlos directamente en Data Catalog.

Todas las características

Todas las características

Servicio sin servidor Es un servicio escalable y totalmente gestionado para administrar metadatos que no requiere configurar ni gestionar ningún tipo de infraestructura; así, te puedes centrar en el negocio.
Metadatos como servicio Este servicio de gestión de metadatos cataloga los recursos de datos mediante API personalizadas y la interfaz de usuario para proporcionar una vista unificada de los datos estén donde estén.
Catálogo central El sistema flexible y potente de catalogación captura tanto los metadatos técnicos (automáticamente) como los empresariales (por etiquetas) en un formato estructurado.
Búsqueda y descubrimiento La interfaz de usuario, sencilla e intuitiva, facilita la rápida localización de recursos de datos gracias a las potentes funciones de búsqueda estructurada con la tecnología de búsqueda de Google que utilizan Gmail y Drive.
Metadatos esquematizados Como admite etiquetas esquematizadas (por ejemplo, Enum, Bool o DateTime) y no solo etiquetas simples de texto, proporciona a las organizaciones metadatos empresariales enriquecidos y organizados.
Integración con Cloud DLP Descubre y clasifica datos sensibles y ofrece información valiosa para simplificar el proceso de gobierno de datos.
Conectores on‑premise Ingiere en Data Catalog los metadatos técnicos de recursos de datos ajenos a Google Cloud para disfrutar de una vista unificada de todos tus recursos de datos.
Integración con Cloud IAM Proporciona controles de nivel de acceso y respeta las listas de control de acceso (LCA) originales de lectura, escritura y búsqueda de los recursos de datos, por lo que ofrece un control de acceso preparado para la empresa.
Gobierno Ofrece una sólida base de seguridad y cumplimiento gracias a las integraciones con Cloud DLP y Cloud IAM.

Precios

Precios

Las tarifas de Data Catalog se basan en el consumo tanto de espacio de almacenamiento de los metadatos como de llamadas a las API. El espacio de almacenamiento incluye todos los metadatos nuevos que se hayan guardado en Data Catalog, incluidos los siguientes:

• Metadatos empresariales, como etiquetas y plantillas de etiquetas de Data Catalog

• Esquemas de conjuntos de archivos de Cloud Storage vinculados a temas de Pub/Sub

• Metadatos de tipos personalizados almacenados en Data Catalog, etc.

El espacio de almacenamiento de metadatos no incluye los metadatos técnicos que almacenan otros servicios de Google Cloud, como las tablas de conjuntos de datos y los nombres de columnas guardados en BigQuery. Consulta la documentación de Data Catalog para ver los precios detallados y ejemplos tanto del espacio de almacenamiento de metadatos como de las llamadas a las API.  

Partners

Partners e integraciones

Nuestras colaboraciones estratégicas contribuyen a crear un ecosistema fuerte y permiten que los clientes disfruten de una experiencia unificada al descubrir datos en la nube híbrida con la plataforma que prefieran.