En este documento, se describe cómo importar metadatos de Dataplex Catalog desde un sistema de terceros a Dataplex con los métodos de la API de importación de metadatos y tu propia canalización. Los metadatos de Dataplex Catalog contienen entradas y sus aspectos.
Si, en cambio, deseas usar una canalización de orquestación administrada por Google Cloud para extraer e importar metadatos, te sugerimos que uses una canalización de conectividad administrada. Con una canalización de conectividad administrada, puedes usar tu propio conector que extrae los metadatos y genera un resultado en un formato que los métodos de la API de importación de metadatos (el archivo de importación de metadatos) pueden usar como entrada. Luego, usa flujos de trabajo para organizar las tareas de la canalización.
Puedes ejecutar los siguientes tipos de trabajos de importación de metadatos:
- Sincronización completa de las entradas con importación incremental de sus aspectos. Es compatible con entradas personalizadas.
- Importación incremental solo de aspectos. Es compatible con los aspectos que pertenecen a entradas personalizadas y del sistema. En el caso de las entradas personalizadas, puedes modificar los aspectos opcionales y los obligatorios. En el caso de las entradas del sistema, puedes modificar aspectos opcionales.
Pasos de alto nivel
Para importar metadatos con la API de importación de metadatos, sigue estos pasos generales:
Determina el alcance del trabajo.
Además, comprende cómo Dataplex aplica la lógica de comparación y el modo de sincronización para las entradas y los aspectos.
Crea uno o más archivos de importación de metadatos que definan los datos que se importarán.
Guarda los archivos de importación de metadatos en un bucket de Cloud Storage.
Ejecuta un trabajo de importación de metadatos.
En los pasos de esta página, se supone que conoces los aspectos de Dataplex Catalog, incluidos los grupos de entradas, los tipos de entradas y los tipos de aspectos. Para obtener más información, consulta Descripción general de Dataplex Catalog.
Antes de comenzar
Antes de importar metadatos, completa las tareas de esta sección.
Roles obligatorios
Para garantizar que la
cuenta de servicio de Dataplex
tenga los permisos necesarios para acceder al bucket de Cloud Storage, pídele
a tu administrador que otorgue a la cuenta de servicio de Dataplex el rol de IAM de
Visualizador de objetos de almacenamiento (roles/storage.objectViewer
)
y el permiso storage.buckets.get
en el bucket.
Para obtener los permisos que necesitas para administrar trabajos de metadatos, pídele a tu administrador que te otorgue los siguientes roles de IAM:
-
Modifica las entradas y sus aspectos en un trabajo de metadatos de sincronización de entradas completa:
-
Usuario de Tipo de entrada de Dataplex (
roles/dataplex.entryTypeUser
) en el tipo de entrada o en el proyecto en el que se define el tipo de entrada -
Usuario de Tipos de aspecto de Dataplex (
roles/dataplex.aspectTypeUser
) en el tipo de aspecto o el proyecto en el que se define el tipo de aspecto
-
Usuario de Tipo de entrada de Dataplex (
-
Modifica los aspectos obligatorios en una tarea de metadatos de solo aspectos:
-
Usuario de Tipo de entrada de Dataplex (
roles/dataplex.entryTypeUser
) en el tipo de entrada o en el proyecto en el que se define el tipo de entrada -
Usuario de Tipos de aspecto de Dataplex (
roles/dataplex.aspectTypeUser
) en el tipo de aspecto o el proyecto en el que se define el tipo de aspecto
-
Usuario de Tipo de entrada de Dataplex (
-
Modifica los aspectos opcionales en un trabajo de metadatos solo de aspectos:
Usuario de tipos de aspecto de Dataplex (
roles/dataplex.aspectTypeUser
) en el tipo de aspecto o el proyecto en el que se define. Ten en cuenta que, cuando modificas aspectos opcionales en un trabajo de metadatos solo de aspectos, no necesitas permisos para el tipo de entrada asociado. -
Crea trabajos de metadatos:
-
Importador de grupo de entradas de Dataplex (
roles/dataplex.entryGroupImporter
) en el proyecto o el recurso -
Propietario de entradas de Dataplex (
roles/dataplex.entryOwner
) en el proyecto o el recurso
-
Importador de grupo de entradas de Dataplex (
-
Ver trabajos de metadatos: Visualizador de trabajos de metadatos de Dataplex (
roles/dataplex.metadataJobViewer
) en el proyecto -
Crear, ver y cancelar trabajos de metadatos: Propietario de trabajos de metadatos de Dataplex (
roles/dataplex.metadataJobOwner
) en el proyecto
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea recursos Google Cloud
Prepara los siguientes Google Cloud recursos:
- Crea un grupo de entradas para las entradas que deseas importar.
- Crea tipos de aspectos para los aspectos que deseas importar.
- Crea tipos de entrada para las entradas que deseas importar.
- Si ejecutas un trabajo de metadatos solo de aspectos, crea entradas para los aspectos que deseas importar.
- Crea un bucket de Cloud Storage para almacenar tus archivos de importación de metadatos.
Componentes de un trabajo de metadatos
Cuando importes metadatos, ten en cuenta los siguientes componentes de un trabajo de metadatos:
- Alcance del trabajo: Es el grupo de entrada, los tipos de entrada y los tipos de aspecto que se incluirán en el trabajo.
- Modo de sincronización: Indica cómo se actualizan las entradas y los aspectos del trabajo.
- Archivo de importación de metadatos: Es un archivo que define los valores que se establecerán para las entradas y los aspectos de la tarea. Puedes proporcionar varios archivos de importación de metadatos en la misma tarea de metadatos. Guardas los archivos en Cloud Storage.
- Lógica de comparación: Indica cómo Dataplex determina qué entradas y aspectos modificar.
Alcance del trabajo
El alcance del trabajo define el grupo de entradas, los tipos de entradas y los tipos de aspectos que deseas incluir en un trabajo de metadatos. Cuando importas metadatos, modificas las entradas y los aspectos que pertenecen a los recursos dentro del alcance de la tarea.
Para definir el alcance del trabajo, sigue estos lineamientos:
Grupo de entrada: Especifica un solo grupo de entrada para incluirlo en el trabajo. La tarea solo modifica las entradas y los aspectos que pertenecen a este grupo de entradas. El grupo de entrada y el trabajo deben estar en la misma región.
Tipos de entrada: Especifica uno o más tipos de entrada para incluir en la tarea. La tarea solo modifica las entradas y los aspectos que pertenecen a estos tipos de entrada. La ubicación de un tipo de entrada debe coincidir con la ubicación del trabajo o ser global.
Tipos de aspectos: Especifica uno o más tipos de aspectos para incluirlos en el trabajo. La tarea solo modifica los aspectos que pertenecen a estos tipos de aspectos. La ubicación de un tipo de aspecto debe coincidir con la ubicación del trabajo o el tipo de aspecto debe ser global.
Especificas el alcance del trabajo cuando creas un trabajo de metadatos.
Modo de sincronización
El modo de sincronización especifica cómo se actualizan las entradas y los aspectos en un trabajo de metadatos. Proporcionas un modo de sincronización para las entradas y los aspectos. Según los recursos que desees importar, se admiten las siguientes combinaciones de modos de sincronización.
Objetivo | Modo de sincronización de entrada | Modo de sincronización de aspecto | Resultados |
---|---|---|---|
Importa entradas y sus aspectos | FULL |
INCREMENTAL |
Se modifican todas las entradas del alcance del trabajo. Si existe una entrada en Dataplex, pero no se incluye en el archivo de importación de metadatos, esta se borrará cuando ejecutes el trabajo de metadatos. Un aspecto solo se modifica si el archivo de importación de metadatos incluye una referencia al aspecto en el campo |
Importar solo aspectos | NONE |
INCREMENTAL |
Los aspectos se modifican si forman parte del alcance del trabajo y si el archivo de importación de metadatos incluye una referencia a los aspectos en el campo No se modifican los otros metadatos que pertenecen a las entradas del alcance de la tarea. |
Especificas el modo de sincronización cuando creas un trabajo de metadatos.
Archivo de importación de metadatos
El archivo de importación de metadatos es una colección de las entradas y los aspectos que deseas modificar. Define los valores que se establecerán para todos los campos que pertenecen a estas entradas y aspectos. Prepara el archivo antes de ejecutar un trabajo de metadatos.
Se aplican los siguientes lineamientos generales:
- Puedes proporcionar varios archivos de importación de metadatos en el mismo trabajo de metadatos.
Cuando ejecutas un trabajo de metadatos de sincronización de entradas completas, las entradas que proporcionas en el archivo reemplazan por completo todas las entradas existentes de los recursos que se encuentran dentro del alcance del trabajo. Esto significa que debes incluir valores para todas las entradas de un trabajo, no solo los valores que deseas agregar o actualizar. Para obtener una lista de las entradas actuales de tu proyecto que puedes usar como punto de partida, usa el método de la API de
entries.list
.Debes proporcionar un archivo de importación de metadatos como parte de un trabajo de metadatos. Si quieres borrar todos los datos existentes de las entradas que se encuentran dentro del alcance de la tarea, proporciona un archivo de importación de metadatos vacío.
Todas las entradas y los aspectos que incluyas en el archivo deben pertenecer a los grupos de entradas, los tipos de entradas y los tipos de aspectos que definas en el alcance del trabajo.
Usa los lineamientos detallados de las siguientes secciones para crear un archivo de importación de metadatos.
Estructura del archivo
Cada línea del archivo de importación de metadatos contiene un objeto JSON que corresponde a un elemento de importación. Un elemento de importación es un objeto que describe los valores que se deben modificar para una entrada y sus aspectos adjuntos.
Puedes proporcionar varios elementos de importación en un solo archivo de importación de metadatos. Sin embargo, no proporciones el mismo elemento de importación más de una vez en un trabajo de metadatos. Usa un carácter de línea nueva (0x0a
) para separar cada elemento de importación.
Un archivo de importación de metadatos con un carácter de nueva línea entre cada elemento de importación se ve como el siguiente ejemplo:
{ "entry": { "name": "entry 1", #Information about entry 1 }
{ "entry": { "name": "entry 2", #Information about entry 2 }
Estructura de un elemento de importación
Cada elemento de importación del archivo de importación de metadatos puede incluir los siguientes campos (consulta ImportItem
). El siguiente ejemplo tiene formato con saltos de línea para facilitar la lectura, pero cuando guardes el archivo, incluye un carácter de nueva línea solo después de cada elemento de importación. No incluyas saltos de línea entre los campos de un solo elemento de importación.
{
"entry": {
"name": "ENTRY_NAME",
"entryType": "ENTRY_TYPE",
"entrySource": {
"resource": "RESOURCE",
"system": "SYSTEM",
"platform": "PLATFORM",
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION",
"createTime": "ENTRY_CREATE_TIMESTAMP",
"updateTime": "ENTRY_UPDATE_TIMESTAMP"
},
"aspects": {
"ASPECT": {
"data": {
"KEY": "VALUE"
},
"aspectSource": {
"createTime": "ASPECT_CREATE_TIMESTAMP",
"updateTime": "ASPECT_UPDATE_TIMESTAMP"
}
},
# Additional aspect maps
},
"parentEntry": "PARENT_ENTRY",
"fullyQualifiedName": "FULLY_QUALIFIED_NAME"
},
"updateMask": "UPDATE_MASK_FIELDS",
"aspectKeys": [
"ASPECT_KEY",
# Additional aspect keys
],
}
Reemplaza lo siguiente:
entry
: Es la información sobre una entrada y sus aspectos adjuntos. En un trabajo de metadatos solo de aspectos, Dataplex ignora todos los campos opcionales de una entrada, excepto los mapas de aspectos.- ENTRY_NAME: Es el nombre de recurso relativo de la entrada, en el formato
projects/PROJECT_ID_OR_NUMBER/locations/LOCATION_ID/entryGroups/ENTRY_GROUP_ID/entries/ENTRY_ID
. - ENTRY_TYPE: Es el nombre de recurso relativo del tipo de entrada que se usó para crear esta entrada, en el formato
projects/PROJECT_ID_OR_NUMBER/locations/LOCATION_ID/entryTypes/ENTRY_TYPE_ID
. entrySource
: Es la información del sistema de origen sobre el recurso de datos que representa la entrada:- RESOURCE: Es el nombre del recurso en el sistema de origen.
- SYSTEM: Es el nombre del sistema de origen.
- PLATFORM: Es la plataforma que contiene el sistema de origen.
- DISPLAY_NAME: Un nombre visible fácil de usar.
- DESCRIPTION: Es una descripción de la entrada.
- ENTRY_CREATE_TIMESTAMP: La hora en la que se creó la entrada en el sistema de origen.
- ENTRY_UPDATE_TIMESTAMP: Es la hora en la que se actualizó la entrada en el sistema de origen.
aspects
: Los aspectos que se adjuntan a la entrada. El objetoaspect
y sus datos se denominan mapa de aspectos.ASPECT: Es un aspecto que se adjunta a la entrada. Según cómo se adjunte el aspecto a la entrada, usa uno de los siguientes formatos:
- Si el aspecto está adjunto directamente a la entrada, proporciona el nombre del recurso relativo de su tipo de aspecto, en el formato
PROJECT_ID_OR_NUMBER.LOCATION_ID.ASPECT_TYPE_ID
. - Si el aspecto está adjunto a la ruta de acceso de la entrada, proporciona la ruta de acceso del tipo de aspecto en el formato
PROJECT_ID_OR_NUMBER.LOCATION_ID.ASPECT_TYPE_ID@PATH
.
- Si el aspecto está adjunto directamente a la entrada, proporciona el nombre del recurso relativo de su tipo de aspecto, en el formato
KEY y VALUE: El contenido del aspecto, según su plantilla de metadatos de tipo de aspecto. El contenido debe estar codificado como UTF-8. El tamaño máximo del campo es de 120 KB. El diccionario
data
es obligatorio, incluso si está vacío.ASPECT_CREATE_TIMESTAMP: Es la hora en la que se creó el aspecto en el sistema de origen.
ASPECT_UPDATE_TIMESTAMP: Es la hora en la que se actualizó el aspecto en el sistema de origen.
PARENT_ENTRY: Es el nombre del recurso de la entrada superior.
FULLY_QUALIFIED_NAME: Es un nombre para la entrada al que puede hacer referencia un sistema externo. Consulta Nombres completamente calificados.
- ENTRY_NAME: Es el nombre de recurso relativo de la entrada, en el formato
UPDATE_MASK_FIELDS: Los campos que se actualizarán, en rutas que se relacionan con el recurso
Entry
. Separa cada campo con una coma.En un trabajo de sincronización de entradas completa, Dataplex incluye las rutas de acceso de todos los campos de una entrada que se pueden modificar, incluidos los aspectos. El campo
updateMask
se ignora cuando se crea o se vuelve a crear una entrada.En una tarea de metadatos de solo aspecto, establece este valor en
aspects
.ASPECT_KEY: Los aspectos que se modificarán. Admite las siguientes sintaxis:
ASPECT_TYPE_REFERENCE
: Coincide con el tipo de aspecto de los aspectos que se adjuntan directamente a la entrada.ASPECT_TYPE_REFERENCE@PATH
: coinciden con el tipo de aspecto y la ruta de acceso especificada.ASPECT_TYPE_REFERENCE@*
: Coincide con el tipo de aspecto para todas las rutas.*@PATH
: Coincide con todos los tipos de aspectos en la ruta especificada.
Reemplaza
ASPECT_TYPE_REFERENCE
por una referencia al tipo de aspecto, en el formatoPROJECT_ID_OR_NUMBER.LOCATION_ID.ASPECT_TYPE_ID
.En un trabajo de sincronización de entradas completas, si dejas este campo vacío, se considera que se especifican exactamente aquellos aspectos que están presentes en la entrada especificada. Dataplex agrega de forma implícita las claves para todos los aspectos requeridos de una entrada.
Requisitos de los archivos
El archivo de importación de metadatos tiene los siguientes requisitos:
- El archivo debe tener el formato de líneas JSON, que es un archivo JSON delimitado por saltos de línea. Usa un carácter de salto de línea (
0x0a
) para separar cada elemento de importación. - El archivo debe usar la codificación de caracteres UTF-8.
- Las extensiones de archivo compatibles son
.jsonl
y.json
. - El tamaño de cada archivo de importación de metadatos debe ser inferior a 1 GiB. El tamaño total máximo para todos los datos de la tarea de metadatos es de 3 GB. Esto incluye todos los archivos y metadatos asociados con la tarea.
- Las entradas y los aspectos que especifiques en el archivo deben ser parte del alcance del trabajo de metadatos.
- El archivo debe subirse a un bucket de Cloud Storage. No guardes el archivo en una carpeta llamada
CLOUD_STORAGE_URI/deletions/
.
Lógica de comparación
Dataplex determina qué entradas y aspectos modificar comparando los valores y las marcas de tiempo que proporcionas en el archivo de importación de metadatos con los valores y las marcas de tiempo que existen en tu proyecto.
En un nivel alto, Dataplex actualiza los valores de tu proyecto cuando al menos un cambio propuesto en el archivo de importación de metadatos cambiará el estado de tu proyecto cuando se ejecute la tarea, sin introducir datos desactualizados. Se debe hacer referencia al cambio propuesto en el campo de máscara de actualización o en el campo de claves de aspecto del archivo de importación de metadatos.
La lógica de comparación varía según el tipo de trabajo de metadatos que ejecutes.
Trabajo de sincronización de entradas completas
En un trabajo de metadatos de sincronización de entradas completas, para cada entrada que forma parte del alcance del trabajo, Dataplex realiza una de las siguientes acciones:
- Crea una entrada y aspectos adjuntos. Si el archivo de importación de metadatos incluye una entrada que no existe en tu proyecto, Dataplex crea la entrada y los aspectos adjuntos.
- Borra una entrada y los aspectos adjuntos. Si existe una entrada en tu proyecto, pero el archivo de importación de metadatos no la incluye, Dataplex borra la entrada y sus aspectos adjuntos de tu proyecto.
Actualiza una entrada y los aspectos adjuntos. Si existe una entrada en el archivo de importación de metadatos y en tu proyecto, Dataplex evalúa las marcas de tiempo de la fuente de entrada y las marcas de tiempo de la fuente de aspectos que están asociadas con la entrada para determinar qué valores modificar. Luego, Dataplex realiza una o más de las siguientes acciones:
- Vuelve a crear la entrada. Si la marca de tiempo de creación de la fuente de entrada en el archivo de importación de metadatos es más reciente que la marca de tiempo correspondiente en tu proyecto, Dataplex vuelve a crear la entrada en tu proyecto.
- Actualiza la entrada. Si la marca de tiempo de actualización de la fuente de la entrada en el archivo de importación de metadatos es más reciente que la marca de tiempo correspondiente en tu proyecto, Dataplex actualiza la entrada en tu proyecto.
- Crea un aspecto. Si un aspecto no existe en tu proyecto y se incluye en un mapa de aspectos, el campo de máscara de actualización y el campo de claves de aspectos en el archivo de importación de metadatos, Dataplex lo crea.
- Borra un aspecto. Si existe un aspecto en tu proyecto y se incluye en el campo de máscara de actualización y en el campo de claves de aspecto del archivo de importación de metadatos, pero no se incluye en un mapa de aspectos, Dataplex borra el aspecto.
Actualiza un aspecto. Si existe un aspecto en tu proyecto y se incluye en un mapa de aspectos, el campo de máscara de actualización y el campo de claves de aspectos en el archivo de importación de metadatos, y la marca de tiempo de actualización de la fuente de aspectos en el archivo de importación de metadatos es más reciente que la marca de tiempo correspondiente en tu proyecto, Dataplex actualiza el aspecto.
Si no se proporciona una marca de tiempo de actualización de la fuente de aspectos en el archivo de importación de metadatos, pero la entrada correspondiente está marcada para una actualización, Dataplex también actualiza el aspecto.
Sin embargo, si al menos un aspecto del archivo de importación de metadatos tiene una marca de tiempo más antigua que la correspondiente a tu proyecto, Dataplex no realizará ninguna actualización para la entrada adjunta.
Trabajo de solo aspecto
En un trabajo de metadatos solo de aspectos, para cada aspecto que forma parte del alcance del trabajo, Dataplex hace una de las siguientes acciones:
- Crea un aspecto. Si un aspecto no existe en tu proyecto y se incluye en un mapa de aspectos, el campo de máscara de actualización y el campo de claves de aspectos en el archivo de importación de metadatos, Dataplex lo crea.
Borra un aspecto. En el caso de los aspectos opcionales, si el aspecto existe en tu proyecto y se incluye en el campo de máscara de actualización y en el campo de claves de aspectos del archivo de importación de metadatos, pero no se incluye en un mapa de aspectos, Dataplex borra el aspecto.
No se pueden borrar los aspectos obligatorios.
Actualiza un aspecto. Si existe un aspecto en tu proyecto y se incluye en un mapa de aspectos, el campo de máscara de actualización y el campo de claves de aspectos en el archivo de importación de metadatos, y la marca de tiempo de actualización de la fuente de aspectos en el archivo de importación de metadatos es más reciente que la marca de tiempo correspondiente en tu proyecto, Dataplex actualiza el aspecto.
Si no se proporciona una marca de tiempo de actualización de la fuente de aspectos en el archivo de importación de metadatos, Dataplex también actualiza el aspecto.
Dataplex actualiza los aspectos según la marca de tiempo de actualización de la fuente de aspectos, independientemente de la marca de tiempo de actualización de la fuente de entrada correspondiente.
Crea un archivo de importación de metadatos
Antes de importar metadatos, crea un archivo de importación de metadatos para tu trabajo. Sigue estos pasos:
- Prepara un archivo de importación de metadatos siguiendo los lineamientos que se describieron anteriormente en este documento.
- Sube el archivo a un bucket de Cloud Storage.
Puedes proporcionar varios archivos de importación de metadatos en el mismo trabajo de metadatos. Para proporcionar varios archivos, guárdalos en el mismo bucket de Cloud Storage. Cuando ejecutas el trabajo, especificas un bucket, no un archivo específico. Dataplex importa metadatos de todos los archivos que se guardan en el bucket, incluidos los archivos que se encuentran en subcarpetas.
Ejecuta un trabajo de importación de metadatos
Después de crear un archivo de importación de metadatos, ejecuta un trabajo de importación de metadatos con la API.
REST
Para importar metadatos, usa el método metadataJobs.create
.
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- PROJECT_NUMBER: Tu Google Cloud número de proyecto o ID de proyecto.
- LOCATION_ID: Es la Google Cloud ubicación, como
us-central1
. - METADATA_JOB_ID: es opcional. El ID del trabajo de metadatos.
CLOUD_STORAGE_URI: Es el URI del bucket o la carpeta de Cloud Storage que contiene los archivos de importación de metadatos. Para obtener más información sobre los requisitos de los archivos, consulta Archivo de importación de metadatos.
- ENTRY_GROUP: Es el nombre de recurso relativo del grupo de entrada que está dentro del alcance del trabajo, en el formato
projects/PROJECT_ID_OR_NUMBER/locations/LOCATION_ID/entryGroups/ENTRY_GROUP_ID
. Proporciona solo un grupo de entradas. Para obtener más información, consulta Alcance del trabajo. ENTRY_TYPE: Es el nombre de recurso relativo de un tipo de entrada que está dentro del alcance del trabajo, en el formato
projects/PROJECT_ID_OR_NUMBER/locations/LOCATION_ID/entryTypes/ENTRY_TYPE_ID
. Para obtener más información, consulta Alcance del trabajo.- ASPECT_TYPE: Es el nombre de recurso relativo de un tipo de aspecto que está dentro del alcance del trabajo, en el formato
projects/PROJECT_ID_OR_NUMBER/locations/LOCATION_ID/aspectTypes/ASPECT_TYPE_ID
. Es opcional cuando se crea un trabajo de sincronización de entradas completas y obligatorio cuando se crea un trabajo solo de aspectos. Para obtener más información, consulta Alcance del trabajo. - ENTRY_SYNC_MODE: Es el modo de sincronización de entrada, como
FULL
oNONE
. Para obtener más información, consulta Modo de sincronización. - LOG_LEVEL: El nivel de registros que se capturarán, como
INFO
oDEBUG
. Para obtener más información, consulta Visualiza los registros de trabajo y soluciona problemas.
Método HTTP y URL:
POST https://dataplex.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION_ID/metadataJobs?metadataJobId=METADATA_JOB_ID
Cuerpo JSON de la solicitud:
{ "type": IMPORT, "import_spec": { "source_storage_uri": gs://CLOUD_STORAGE_URI/, "scope": { "entryGroups": [ ENTRY_GROUP ], "entry_types": [ ENTRY_TYPE ], "aspect_types": [ ASPECT_TYPE ] }, "entry_sync_mode": ENTRY_SYNC_MODE, "aspect_sync_mode": INCREMENTAL, "log_level": LOG_LEVEL } }
Para enviar tu solicitud, expande una de estas opciones:
La respuesta identifica una operación de larga duración.
Obtén detalles sobre un trabajo de metadatos
Para obtener información sobre un trabajo de metadatos, como el estado y la cantidad de entradas que se modificaron, sigue los pasos que se indican a continuación. Para obtener más información sobre cómo solucionar problemas de un trabajo que falló, consulta la sección Cómo ver los registros de trabajo y solucionar problemas de este documento.
REST
Para obtener información sobre un trabajo de metadatos, usa el método metadataJobs.get
.
Obtén una lista de trabajos de metadatos
Puedes obtener una lista de los trabajos de metadatos más recientes. Los trabajos más antiguos que alcanzaron un estado terminal se borran periódicamente del sistema.
REST
Para obtener una lista de los trabajos de metadatos más recientes, usa el método metadataJobs.list
.
Cancela un trabajo de metadatos
Puedes cancelar un trabajo de metadatos que no quieras ejecutar.
REST
Para cancelar un trabajo de metadatos, usa el
método metadataJobs.cancel
.
Cómo ver los registros de trabajos y solucionar problemas
Usa Cloud Logging para ver los registros de un trabajo de metadatos. Para obtener más información, consulta Supervisa los registros de Dataplex.
El nivel de registro se configura cuando creas un trabajo de metadatos. Los siguientes niveles de registro están disponibles:
INFO
: Proporciona registros a nivel general del trabajo. Incluye registros agregados sobre los elementos de importación, pero no especifica qué elemento de importación tiene un error.DEBUG
: Proporciona registros detallados para cada elemento de importación. Usa el registro a nivel de depuración para solucionar problemas con elementos de importación específicos. Por ejemplo, usa el registro a nivel de depuración para identificar los recursos que faltan en el ámbito del trabajo, las entradas o los aspectos que no se ajustan al tipo de entrada o al tipo de aspecto asociados, o bien otros parámetros de configuración incorrectos con el archivo de importación de metadatos.
Errores de validación
Dataplex valida los archivos de importación de metadatos en función de los metadatos actuales de tu proyecto. Si hay un problema de validación, el estado del trabajo podría mostrar uno de los siguientes estados:
FAILED
: Ocurre cuando el archivo de importación de metadatos tiene un error. Dataplex no importa ningún metadato y el trabajo falla. Estos son algunos ejemplos de errores en el archivo de importación de metadatos:- Un elemento del archivo no se puede analizar en un elemento de importación válido.
- Una entrada o un aspecto del archivo pertenece a un grupo de entradas, un tipo de entrada o un tipo de aspecto que no forma parte del alcance del trabajo
- Se especifica el mismo nombre de entrada más de una vez en el trabajo
- Un tipo de aspecto que se especifica en un mapa de aspectos o en las claves de aspectos no usa el formato PROJECT_ID_OR_NUMBER.LOCATION_ID.ASPECT_TYPE_ID@OPTIONAL_PATH.
- Se marcó un aspecto obligatorio para su eliminación
SUCCEEDED_WITH_ERRORS
: Ocurre cuando el archivo de importación de metadatos se puede analizar correctamente, pero importar un elemento del archivo causaría que una entrada de tu proyecto esté en un estado incoherente. Dataplex ignora estas entradas, pero importa el resto de los metadatos del archivo.
Usa los registros de trabajo para solucionar el error.
¿Qué sigue?
- Cómo buscar recursos de datos en Dataplex Catalog
- Administra los aspectos y enriquece los metadatos
- Administra las entradas y transfiere fuentes personalizadas