Crea y usa análisis del perfil de datos

En esta página, se muestra cómo crear un análisis de perfil de datos con la consola de Google Cloud, Google Cloud CLI o la API de REST.

Para obtener más información sobre los análisis de perfiles de datos de Dataplex, consulta Acerca de la creación de perfiles de datos.

Antes de comenzar

En la consola de Google Cloud, habilita la API de Dataplex.

Habilitar la API

Permisos

Para generar perfiles de las tablas de BigQuery, necesitas los siguientes permisos:

A fin de ejecutar un análisis de perfil de datos en una tabla de BigQuery, necesitas permiso para leer la tabla y crear un trabajo de BigQuery en el proyecto usado para analizar la tabla.

Nota: Dataplex no crea un trabajo de BigQuery en el proyecto. Sin embargo, necesitas este permiso si quieres crear un trabajo DryRun y verificar los permisos de la tabla.
Si la tabla de BigQuery y el análisis del perfil de datos están en proyectos diferentes, debes otorgar permiso de lectura a la cuenta de servicio de Dataplex en la tabla de BigQuery correspondiente.

Nota: Si aún no creaste análisis de perfiles de datos o de calidad de los datos o no tienes un lake de Dataplex en el proyecto de BigQuery, ejecuta el siguiente comando para crear un identificador de servicio: gcloud beta services identity create --service=dataplex.googleapis.com. Este comando muestra un identificador de servicio de Dataplex si existe.
Si los datos de BigQuery están organizados en un lago de Dataplex, para crear un análisis de perfil de datos, necesitas los roles roles/dataplex.metadataReader y roles/dataplex.viewer de Dataplex. Esto otorga los siguientes permisos:
- dataplex.lakes.list
- dataplex.lakes.get
- dataplex.zones.list
- dataplex.zones.get
- dataplex.entities.list
- dataplex.entities.get
- dataplex.operations.get
Si analizas una tabla externa de BigQuery desde Cloud Storage, asigna a la cuenta de servicio de Dataplex la función de visualizador de objetos de Cloud Storage (roles/storage.objectViewer) o los siguientes permisos para el bucket:
- storage.buckets.get
- storage.objects.get
Si deseas publicar los resultados del análisis del perfil de datos en las páginas de BigQuery y Data Catalog en la consola de Google Cloud para las tablas de origen, debes tener la función de IAM de editor de datos de BigQuery (roles/bigquery.dataEditor) o el permiso bigquery.tables.update en la tabla.
Para exportar los resultados del análisis a una tabla de BigQuery, la cuenta de servicio de Dataplex necesita la función de editor de datos de BigQuery (roles/bigquery.dataEditor). Esto otorga los siguientes permisos:
- bigquery.datasets.get
- bigquery.tables.create
- bigquery.tables.get
- bigquery.tables.getData
- bigquery.tables.update
- bigquery.tables.updateData
Si necesitas acceder a las columnas protegidas por las políticas de acceso a nivel de columnas de BigQuery, asigna los permisos de la cuenta de servicio de Dataplex para esas columnas. El usuario que crea o actualiza un análisis de datos también necesita permisos para las columnas.
Si una tabla tiene habilitadas las políticas de acceso a nivel de fila de BigQuery, solo puedes analizar las filas visibles para la cuenta de servicio de Dataplex. Ten en cuenta que los privilegios de acceso del usuario individual no se evalúan para las políticas a nivel de fila.

Roles y permisos del análisis de datos

Para usar la creación de perfiles de datos, un administrador del proyecto asigna una función predefinida con permisos ya otorgados o otorga permisos individuales. Las funciones son las siguientes:

roles/dataplex.dataScanAdmin: Acceso completo a DataScan recursos.
roles/dataplex.dataScanEditor: Acceso de escritura a recursos de DataScan.
roles/dataplex.dataScanViewer: Acceso de lectura a DataScan recursos, sin incluir los resultados.
roles/dataplex.dataScanDataViewer: Acceso de lectura a los recursos de DataScan, incluidos los resultados.

En la siguiente tabla, se enumeran los permisos de análisis de datos:

Nombre del permiso	Otorga permiso para hacer lo siguiente:
`dataplex.datascans.create`	Crea una `DataScan`
`dataplex.datascans.delete`	Borra una `DataScan`
`dataplex.datascans.get`	Ver `DataScan` detalles, excepto los resultados
`dataplex.datascans.getData`	Ver detalles de `DataScan`, incluidos los resultados
`dataplex.datascans.list`	Enumerar `DataScan`
`dataplex.datascans.run`	Ejecuta un `DataScan`
`dataplex.datascans.update`	Actualizar la descripción de un `DataScan`
`dataplex.datascans.getIamPolicy`	Consulta los permisos de IAM actuales en el análisis
`dataplex.datascans.setIamPolicy`	Configurar permisos de IAM en el análisis

Crea un análisis de perfil de datos

Console

En la consola de Google Cloud, ve a la página Perfil.

Ir al perfil de Dataplex
Haz clic en Crear análisis de perfil de datos.
Ingresa un Nombre visible.
Si quieres cambiar el ID de análisis generado automáticamente, proporciona el tuyo. Consulta la convención de nombres de recursos.
Ingresa una Descripción (opcional).
En el campo Tabla, haz clic en Explorar.
Selecciona una tabla y haz clic en Seleccionar.
En el campo Alcance, elige Incrementalidad o Datos completos.
- Si eliges Datos incrementales, en el campo Columna de marca de tiempo, selecciona una columna de tipo DATE o TIMESTAMP de la tabla de BigQuery que aumente monótonamente y se pueda usar para identificar registros nuevos. Para las tablas particionadas en una columna de tipo DATE o TIMESTAMP, recomendamos usar la columna de partición como el campo de marca de tiempo.
Para aplicar el muestreo al análisis de tu perfil de datos, selecciona un porcentaje de muestreo en la lista Tamaño del muestreo.
- Elige un valor porcentual entre 0.0% y 100.0% con hasta 3 dígitos decimales.
- Para conjuntos de datos más grandes, elige un porcentaje de muestreo más bajo. Por ejemplo, para una tabla de ~1 PB, si ingresas un valor entre 0.1% y 1.0%, Dataplex muestra entre 1 y 10 TB de datos.
- Necesitas al menos 100 registros en los datos de muestra para obtener un resultado.
- Para los análisis de datos incrementales, Dataplex aplica el muestreo al incremento más reciente.
Para filtrar por fila, haz clic en Filtros y selecciona Filtrar filas.
- Ingresa una expresión de SQL válida que se pueda usar en una cláusula WHERE en la sintaxis de SQL estándar de BigQuery. Por ejemplo: col1 >= 0.
- El filtro puede ser una combinación de condiciones de SQL en varias columnas. Por ejemplo: col1 >= 0 AND col2 < 10.
Opcional: Haz clic en Filtros. Selecciona la casilla de verificación Filtrar columnas.

a. En el campo Incluir columnas, haz clic en Explorar.
- Especifica las columnas que se incluirán en el análisis de perfil. Marca las casillas y haz clic en Seleccionar para seleccionar las columnas que desees.
b. En el campo Excluir columnas, haz clic en Explorar.
- Especifica las columnas que deseas excluir del análisis de perfil. Marca las casillas y haz clic en Seleccionar para seleccionar las columnas que desees.
Nota: Puedes usar Incluir columnas, Excluir columnas o ambas. Si usas ambos campos, Dataplex primero selecciona las columnas según tu entrada en el campo Incluir columnas y, luego, excluye las columnas según tu entrada en el campo Excluir columnas.
Opcional: Publica los resultados del análisis del perfil de datos en las páginas de BigQuery y Data Catalog en la consola de Google Cloud para la tabla de origen. Haz clic en la casilla de verificación Publicar resultados en la IU de BigQuery y Dataplex Catalog.

Puedes ver los resultados de análisis más recientes en la pestaña Perfil de datos de las páginas de BigQuery y Data Catalog de la tabla de origen. Para permitir que los usuarios accedan a los resultados del análisis publicados, consulta Comparte los resultados publicados.

Es posible que la opción de publicación no esté disponible en los siguientes casos:
- No tienes los permisos necesarios en la tabla.
- Otro análisis de calidad de los datos está configurado para publicar resultados.
Si quieres obtener más información sobre los permisos necesarios para ver los resultados publicados, consulta Permisos.
Exporta los resultados del análisis a una tabla estándar de BigQuery (opcional). Haz clic en Explorar para seleccionar un conjunto de datos de BigQuery existente a fin de almacenar los resultados del análisis del perfil de datos.

Si la tabla especificada no existe, Dataplex la crea por ti. Si usas una tabla existente, asegúrate de que sea compatible con el esquema de tabla que se describe más adelante en esta sección.

Nota: Puedes compartir la misma tabla de resultados para guardar o exportar resultados de varios análisis de perfiles de datos.
Opcional: Agrega etiquetas. Las etiquetas son pares key:value que te permiten agrupar objetos relacionados o con otros recursos de Google Cloud.
En Opciones de programación, elige una de las siguientes opciones:
- Repetir: Ejecuta el trabajo de análisis del perfil de datos de forma programada: diaria, semanal, mensual o personalizada. Especifica la frecuencia con la que se debe ejecutar el análisis y el momento en que se debe ejecutar. Si eliges ser personalizado, usa el formato cron para especificar el programa.
- A pedido: Crea tu análisis de perfil de datos y ejecútalo en cualquier momento con la acción Ejecutar ahora.
Haz clic en Crear.

gcloud

Para crear un análisis de perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans create data-profile DATASCAN \
--location=LOCATION \
--data-source-entity=DATA_SOURCE_ENTITY
| --data-source-resource=DATA_SOURCE_RESOURCE

Reemplaza las siguientes variables:

DATASCAN: Es el nombre del análisis del perfil de datos.
LOCATION: La región de Google Cloud en la que se creará el análisis del perfil de datos.
DATA_SOURCE_ENTITY: La entidad de Dataplex que contiene los datos para el análisis del perfil de datos. Por ejemplo, projects/test-project/locations/test-location/lakes/test-lake/zones/test-zone/entities/test-entity
DATA_SOURCE_RESOURCE: Es el nombre del recurso que contiene los datos del análisis del perfil de datos. Por ejemplo, //bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de API para crear un análisis de perfil de datos.

Crea varios análisis de perfiles de datos

Console

En la consola de Google Cloud, ve a la página Perfil.

Ir al perfil de Dataplex
Haz clic en Crear varios análisis de perfiles.
Ingresa un prefijo de ID. Dataplex genera automáticamente los ID de análisis mediante el prefijo proporcionado y los sufijos únicos.
Ingresa una Descripción para todos los análisis del perfil de datos.
En el campo Conjunto de datos, haz clic en Explorar. Selecciona un conjunto de datos para elegir las tablas. Haz clic en Seleccionar.
Si el conjunto de datos es multirregional, selecciona una región en la que deseas crear los análisis del perfil de datos.
Selecciona Opciones de configuración comunes:
1. En el campo Alcance, elige Incrementalidad o Datos completos.
  
  Nota: Si eliges datos incrementales, solo puedes seleccionar tablas que estén particionadas en una columna de tipo DATE o TIMESTAMP.
2. Para aplicar el muestreo a los análisis de tu perfil de datos, selecciona un porcentaje de muestreo en la lista Tamaño del muestreo.
  
  Elige un valor porcentual entre 0.0% y 100.0% con hasta 3 dígitos decimales.
3. Para mostrar los resultados de todos los análisis, selecciona Publicación. Puedes ver los resultados en la pestaña Perfil de los detalles de la tabla de BigQuery o Data Catalog. Asegúrate de tener los permisos bigquery.tables.update en las tablas de origen.
  
  Nota: Debes elegir tablas que no tengan análisis existentes que publiquen sus resultados.
4. En Opciones de programación, elige una de las siguientes opciones:
  1. Repetir: Ejecuta los trabajos de análisis de tu perfil de datos de forma programada. Especifica la frecuencia con la que se ejecutará el análisis (diaria, semanal, mensual o personalizada) y en qué momento. Si eliges ser personalizado, usa el formato cron para especificar el programa.
  2. A pedido: Crea tus trabajos de análisis del perfil de datos y ejecútalos en cualquier momento haciendo clic en Ejecutar.
En la opción Elegir tablas, haz clic en Explorar. Elige una o más de las tablas que deseas analizar. Haz clic en Seleccionar.
Seleccione Configuración adicional:
1. Para guardar los resultados de los análisis del perfil de datos en la tabla de BigQuery que elijas, elige una tabla en Exporta los resultados del análisis a la tabla de BigQuery. Dataplex copia y guarda automáticamente los resultados en esta tabla para cada trabajo de análisis.
  1. Haz clic en Explorar para seleccionar un conjunto de datos.
    
    Nota: La cuenta de servicio de Dataplex debe poder crear y escribir en una tabla de este conjunto de datos.
  2. Ingresa una tabla de BigQuery para guardar los resultados. Puede ser una tabla existente que usen otros análisis de perfiles de datos de Dataplex para guardar los resultados. Si no existe esa tabla con el nombre especificado, Dataplex crea la tabla.
2. Agrega etiquetas para anotar tu análisis de perfil de datos.
Haz clic en Ejecutar análisis para crear y ejecutar todos los análisis. Esta opción solo está disponible para análisis a pedido.
Haz clic en Crear para crear todos los análisis.

gcloud

No compatible.

REST

No compatible.

Exportar esquema de tabla

Si deseas exportar los resultados del análisis del perfil de datos a una tabla de BigQuery existente, asegúrate de que sea compatible con el siguiente esquema de tabla:

nombre de la columna	Tipo de datos de la columna	Nombre del subcampo (si corresponde)	Tipo de datos del subcampo	Modo	Ejemplo
data_profile_scan	`struct/record`	`resource_name`	`string`	anulable	`//dataplex.googleapis.com/projects/test-project/locations/europe-west2/datascans/test-datascan`
		`project_id`	`string`	anulable	`test-project`
		`location`	`string`	anulable	`us-central1`
		`data_scan_id`	`string`	anulable	`test-datascan`
data_source	`struct/record`	`resource_name`	`string`	anulable	Caso de entidad: `//dataplex.googleapis.com/projects/test-project/locations/europe-west2/lakes/test-lake/zones/test-zone/entities/test-entity` Caso de tabla: `//bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table`
		`dataplex_entity_project_id`	`string`	anulable	`test-project`
		`dataplex_entity_project_number`	`integer`	anulable	`123456789012`
		`dataplex_lake_id`	`string`	anulable	(Válido solo si la fuente es una entidad) `test-lake`
		`dataplex_zone_id`	`string`	anulable	(Válido solo si la fuente es una entidad) `test-zone`
		`dataplex_entity_id`	`string`	anulable	(Válido solo si la fuente es una entidad) `test-entity`
		`table_project_id`	`string`	anulable	`dataplex-table`
		`table_project_number`	`int64`	anulable	`345678901234`
		`dataset_id`	`string`	anulable	(Válido solo si la fuente es una tabla) `test-dataset`
		`table_id`	`string`	anulable	(Válido solo si la fuente es una tabla) `test-table`
data_profile_job_id	`string`			anulable	`caeba234-cfde-4fca-9e5b-fe02a9812e38`
data_profile_job_configuration	`json`	`trigger`	`string`	anulable	`ondemand`/`schedule`
		`incremental`	`boolean`	anulable	`true`/`false`
		`sampling_percent`	`float`	anulable	(0-100) `20.0` (indica un 20%)
		`row_filter`	`string`	anulable	`col1 >= 0 AND col2 < 10`
		`column_filter`	`json`	anulable	`{"include_fields":["col1","col2"], "exclude_fields":["col3"]}`
job_labels	`json`			anulable	`{"key1":value1}`
job_start_time	`timestamp`			anulable	`2023-01-01 00:00:00 UTC`
job_end_time	`timestamp`			anulable	`2023-01-01 00:00:00 UTC`
job_rows_scanned	`integer`			anulable	`7500`
column_name	`string`			anulable	`column-1`
column_type	`string`			anulable	`string`
column_mode	`string`			anulable	`repeated`
percent_null	`float`			anulable	(0.0-100.0) `20.0` (indica 20%)
percent_unique	`float`			anulable	(0.0-100.0) `92.5`
min_string_length	`integer`			anulable	(Válido solo si el tipo de columna es string) `10`
max_string_length	`integer`			anulable	(Válido solo si el tipo de columna es string) `4`
average_string_length	`float`			anulable	(Válido solo si el tipo de columna es string) `7.2`
min_value	`float`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
max_value	`float`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
average_value	`float`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
standard_deviation	`float`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
quartile_lower	`integer`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
quartile_median	`integer`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
quartile_upper	`integer`			anulable	(Válido solo si el tipo de columna es numérico: número entero/flotante)
top_n	`struct/record - repeated`	`value`	`string`	anulable	`"4009"`
		`count`	`integer`	anulable	`20`
		`percent`	`float`	anulable	`10` (indica un 10%)

Exportar configuración de la tabla

Sigue estos lineamientos para exportar a tablas BigQueryExport:

Para el campo resultsTable, usa el formato: //bigquery.googleapis.com/projects/{project-id}/datasets/{dataset-id}/tables/{table-id}.
Usar una tabla estándar de BigQuery
Si la tabla no existe cuando se crea o se actualiza el análisis, Dataplex la crea por ti.
De forma predeterminada, la tabla se particiona en la columna job_start_time todos los días.
Si deseas particionar la tabla en otras configuraciones o si no quieres la partición, vuelve a crear la tabla con el esquema y las configuraciones requeridos y, luego, proporciona la tabla creada previamente como la tabla de resultados.
Asegúrate de que la tabla de resultados esté en la misma ubicación que la tabla de origen.
Si VPC-SC está configurado en el proyecto, la tabla de resultados debe estar en el mismo perímetro de VPC-SC que la tabla de origen.
Si la tabla se modifica durante la etapa de ejecución del análisis, el trabajo en ejecución actual se exporta a la tabla de resultados anterior y el cambio de la tabla se aplica a partir del siguiente trabajo de análisis.
No modifiques el esquema de la tabla. Si necesitas columnas personalizadas, crea una vista en la tabla.
Para reducir costos, configura un vencimiento en la partición según tu caso de uso. Para obtener más información, consulta cómo configurar el vencimiento de la partición.

Ejecuta un análisis del perfil de datos

Console

En la consola de Google Cloud, ve a la página Perfil de Dataplex. Ir al perfil
Haz clic en el análisis del perfil de datos para ejecutarlo.
Haz clic en Ejecutar ahora.

gcloud

Para ejecutar un análisis del perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans run DATASCAN \
--location=LOCATION

Reemplaza las siguientes variables:

DATASCAN: Es el nombre del análisis del perfil de datos.
LOCATION: Es la región de Google Cloud en la que se creó el análisis de perfil de datos.

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de APIs para ejecutar tu análisis de perfil de datos.

Visualiza los resultados del trabajo de análisis del perfil de datos

Console

Todos los análisis del perfil de datos que crees aparecerán en la página Perfil.

Para ver los resultados detallados de un análisis, haz clic en su nombre.

En la sección Descripción general, se muestran las ejecuciones de análisis, la hora de cada ejecución, la cantidad de registros de la tabla analizados y el estado del trabajo.
La sección Configuración de análisis del perfil contiene detalles sobre el análisis.

gcloud

Para ver los resultados de un trabajo de análisis de perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans jobs describe JOB \
--location=LOCATION \
--datascan=DATASCAN \
--view=FULL

Reemplaza las siguientes variables:

JOB: El ID de tarea del trabajo de análisis del perfil de datos.
LOCATION: Es la región de Google Cloud en la que se creó el análisis de perfil de datos.
DATASCAN: Es el nombre del análisis de perfil de datos al que pertenece el trabajo.
--view=FULL: Para ver el resultado del trabajo de análisis, especifica FULL.

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de APIs para ver los resultados de un análisis de un perfil de datos.

Consulta el trabajo de análisis de perfil de datos más reciente

Console

En la pestaña Resultados del trabajo más recientes, cuando hay al menos una ejecución que se completó de forma correcta, se proporciona información sobre el trabajo más reciente. Enumera las columnas de la tabla analizada y las estadísticas sobre las columnas que se encontraron en el análisis.

gcloud

Para ver el análisis de perfil de datos exitoso más reciente, ejecuta el siguiente comando:

gcloud dataplex datascans describe DATASCAN \
--location=LOCATION \
--view=FULL

Reemplaza las siguientes variables:

DATASCAN: Es el nombre del análisis de perfil de datos para el que se verá el trabajo más reciente.
LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
--view=FULL: Para ver el resultado del trabajo de análisis, especifica FULL.

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de APIs para ver el trabajo de análisis más reciente.

Ver todos los trabajos de análisis de perfil de datos

Dataplex guarda el historial de análisis del perfil de datos de los últimos 300 trabajos o del año pasado, lo que ocurra primero.

Console

La pestaña Historial de trabajos proporciona información sobre los trabajos anteriores. Enumera todos los trabajos, la cantidad de registros analizados en cada trabajo, el estado del trabajo, el tiempo de ejecución del trabajo y mucho más.

Para ver la información detallada sobre un trabajo, haz clic en cualquiera de los trabajos en ID de trabajo.

gcloud

Para ver todos los trabajos de un análisis de perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans jobs list \
--location=LOCATION \
--datascan=DATASCAN

Reemplaza las siguientes variables:

LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
DATASCAN: Es el nombre del análisis de perfil de datos para ver todos los trabajos.

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de API para ver todos los trabajos de análisis.

Cuando creas un análisis de perfil de datos, si eliges publicar los resultados del análisis en las páginas de BigQuery y Data Catalog en la consola de Google Cloud, los resultados del análisis más reciente estarán disponibles en la pestaña Perfil de datos de esas páginas.

Puedes permitir que los usuarios de tu organización accedan a los resultados del análisis publicados. Para otorgar acceso a los resultados del análisis, sigue estos pasos:

En la consola de Google Cloud, ve a la página Perfil.

Ir al perfil de Dataplex
Haz clic en el análisis de perfil de datos del que deseas compartir los resultados.
Ve a la pestaña Permisos.
Haz clic en Grant access.
En el campo Principales nuevas, agrega la principal a la que deseas otorgar acceso.
En el campo Selecciona un rol, elige Dataplex DataScan DataViewer.
Haz clic en Guardar.

Para quitar el acceso a los resultados de análisis publicados de una principal, sigue estos pasos:

En la consola de Google Cloud, ve a la página Perfil.

Ir al perfil de Dataplex
Haz clic en el análisis de perfil de datos del que deseas compartir los resultados.
Ve a la pestaña Permisos.
Selecciona la principal para la que deseas quitar el rol Dataplex DataScan DataViewer.
Haga clic en Quitar acceso.
Haz clic en Confirmar.

Actualizar un análisis de perfil de datos

Console

En la consola de Google Cloud, ve a la página Perfil.

Ir al perfil de Dataplex
En la fila con el análisis que deseas editar, haz clic en > Editar.
Edite los valores.
Haz clic en Guardar.

gcloud

Para actualizar un análisis de perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans update data-profile DATASCAN \
--location=LOCATION \
--description=DESCRIPTION

Reemplaza las siguientes variables:

DATASCAN: Es el nombre del análisis del perfil de datos que se actualizará.
LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
DESCRIPTION: Es la descripción nueva del análisis del perfil de datos.

Para conocer los campos de especificación que se deben actualizar, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de API para editar un análisis de perfil de datos.

Borrar un análisis de perfil de datos

Console

En la consola de Google Cloud, ve a la página Perfil. Ve a Perfil de Dataplex.
Haz clic en el análisis que quieres borrar.
Haz clic en Borrar.

gcloud

Para borrar un análisis de perfil de datos, ejecuta el siguiente comando:

gcloud dataplex datascans delete \
DATASCAN --location=LOCATION \
--async

Reemplaza las siguientes variables:

DATASCAN: Es el nombre del análisis del perfil de datos que se borrará.
LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.

Para ver argumentos opcionales, consulta la referencia de la CLI de gcloud.

REST

Usa el Explorador de APIs para borrar tu análisis del perfil de datos.

Próximos pasos

Obtén más información sobre la generación de perfiles de datos.
Obtén más información sobre la calidad automática de los datos.
Obtén información para usar la calidad automática de los datos.

Crea y usa análisis del perfil de datos

Antes de comenzar

Permisos

Roles y permisos del análisis de datos

Crea un análisis de perfil de datos

Console

gcloud

REST

Crea varios análisis de perfiles de datos

Console

gcloud

REST

Exportar esquema de tabla

Exportar configuración de la tabla

Ejecuta un análisis del perfil de datos

Console

gcloud

REST

Visualiza los resultados del trabajo de análisis del perfil de datos

Console

gcloud

REST

Consulta el trabajo de análisis de perfil de datos más reciente

Console

gcloud

REST

Ver todos los trabajos de análisis de perfil de datos

Console

gcloud

REST

Compartir los resultados publicados

Actualizar un análisis de perfil de datos

Console

gcloud

REST

Borrar un análisis de perfil de datos

Console

gcloud

REST

Próximos pasos