En esta página, se describe cómo estimar el costo de la creación de perfiles de datos de BigQuery en un proyecto. Si deseas crear una estimación para una organización o carpeta, consulta Estimar el costo de la creación de perfiles de datos para una organización o carpeta.
Si deseas obtener más información sobre la creación de perfiles de datos de BigQuery, consulta Perfiles de datos para datos de BigQuery.
Descripción general
Antes de comenzar a generar perfiles de datos, puedes ejecutar una estimación para comprender cuántos datos de BigQuery tienes y cuánto podría costar generar perfiles de esos datos. Para ejecutar una estimación, créala.
Cuando crees una estimación, especifica el recurso (organización, carpeta o proyecto) que contiene los datos para los que deseas generar perfiles. Puedes establecer filtros para ajustar la selección de datos. También puedes establecer las condiciones que se deban cumplir antes de que la protección de datos sensibles genere el perfil de una tabla. La protección de datos sensibles basa la estimación en la forma, el tamaño y el tipo de los datos en el momento en que creas la estimación.
Cada estimación incluye detalles como la cantidad de tablas coincidentes que se encuentran en el recurso, el tamaño total de todas esas tablas y el costo estimado de generar perfiles del recurso una vez y por mes.
Para obtener más información sobre cómo se calculan los precios, consulta Precios de la creación de perfiles de datos.
Precios de estimación
Crear una estimación es sin costo.
Retención
Todas las estimaciones se borran automáticamente después de 28 días.
Antes de comenzar
Si quieres obtener los permisos que necesitas para crear y administrar estimaciones de costos de la creación de perfiles de datos,
pídele a tu administrador que te otorgue el
rol de IAM de Administrador de DLP (roles/dlp.admin
) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.
Es posible que también puedas obtener los permisos necesarios a través de los roles personalizados o de otros roles predefinidos.
Asegúrate de que la API de Cloud Data Loss Prevention esté habilitada en tu proyecto:
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
-
Si quieres obtener los permisos que necesitas para crear y administrar estimaciones de costos de la creación de perfiles de datos, pídele a tu administrador que te otorgue el rol de IAM de Administrador de DLP (
roles/dlp.admin
) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.Es posible que también puedas obtener los permisos necesarios a través de los roles personalizados o de otros roles predefinidos.
Crear una estimación
Ve a la página Crear estimación del perfil de datos.
Elige tu proyecto.
En las siguientes secciones, se proporciona más información sobre los pasos de la página Crea una estimación del perfil de datos. Al final de cada sección, haz clic en Continuar.
Selecciona un recurso para analizarlo
Asegúrate de que la opción Analizar todo el proyecto esté seleccionada.Filtros y condiciones de entrada
Puedes omitir esta sección si deseas incluir todas las tablas de BigQuery del proyecto en tu estimación.En esta sección, crearás filtros para especificar determinados subconjuntos de tus datos que deseas incluir en la estimación o excluir de ella. Para los subconjuntos que incluyes en la estimación, también especificas las condiciones que debe cumplir una tabla del subconjunto para que se incluya en la estimación.
Para establecer filtros y condiciones, sigue estos pasos:
- Haz clic en Agregar filtros y condiciones.
En la sección Filtros, debes definir uno o más filtros que especifiquen qué tablas están dentro del alcance de la estimación.
Especifica, al menos, una de las siguientes opciones:
- Un ID del proyecto o una expresión regular que especifica uno o más proyectos.
- ID de un conjunto de datos o expresión regular que especifica uno o más conjuntos de datos.
- Un ID de tabla o una expresión regular que especifica una o más tablas.
Las expresiones regulares deben seguir la sintaxis RE2.
Por ejemplo, si deseas que todas las tablas de un conjunto de datos se incluyan en el filtro, especifica el ID del conjunto de datos y deja los otros dos campos en blanco.
Si deseas agregar más filtros, haz clic en Agregar filtro y repite este paso.
Si los subconjuntos de datos que definen tus filtros deben excluirse de la estimación, desactiva Incluir las tablas que coinciden en mi estimación. Si desactivas esta opción, se ocultarán las condiciones que se describen en el resto de esta sección.
Opcional: En la sección Condiciones, especifica la condición que deben cumplir las tablas coincidentes para que se las incluya en la estimación. Si omites este paso, la protección de datos sensibles incluye todas las tablas compatibles que coinciden con tus filtros, sin importar sus tamaños y edades.
Configura las siguientes opciones:
Condiciones mínimas: Para excluir tablas pequeñas o nuevas de la estimación, establece un recuento mínimo de filas o una antigüedad de la tabla.
Condición de tiempo: Para excluir tablas anteriores, activa la condición de tiempo. Luego, elige una fecha y una hora. Se excluirá de la estimación cualquier tabla creada en esa fecha o antes.
Por ejemplo, si estableces la condición de hora como 5/4/22, 11:59 p.m., la protección de datos sensibles excluye de la estimación las tablas creadas el 4 de mayo de 2022 a las 11:59 p.m. o antes.
Tablas para generar perfiles: Si deseas especificar los tipos de tablas que se incluirán en la estimación, selecciona Incluir solo las tablas de uno o varios tipos especificados. Luego, selecciona los tipos de tablas que deseas incluir.
Si no activas esta condición o no seleccionas ningún tipo de tabla, la protección de datos sensibles incluirá todas las tablas compatibles en la estimación.
Supongamos que tienes la siguiente configuración:
Condiciones mínimas
- Cantidad mínima de filas: 10 filas
- Duración mínima: 24 horas
Condición de tiempo
- Marca de tiempo: 4/5/22, 11:59 p.m.
Tablas para generar perfiles
La opción Solo incluir tablas de uno o más tipos especificados está seleccionada. En la lista de tipos de tablas, solo se selecciona Profile BigLake Tables.
En este caso, la protección de datos sensibles excluye cualquier tabla creada a partir del 4 de mayo de 2022 a las 11:59 p.m. Entre las tablas creadas después de esta fecha y hora, la protección de datos sensibles solo genera perfiles de las tablas de BigLake que tienen 10 filas o tienen al menos 24 horas de antigüedad.
Haz clic en Listo.
Si deseas agregar más filtros y condiciones, haz clic en Agregar filtros y condiciones y repite los pasos anteriores.
El último elemento de la lista de filtros y condiciones siempre es el que está etiquetado como Filtros y condiciones predeterminados. Esta configuración predeterminada se aplica a las tablas de tu proyecto que no coinciden con ninguno de los filtros y las condiciones que creaste.
Si deseas ajustar los filtros y las condiciones predeterminados, haz clic en
Editar filtros y condiciones y ajusta la configuración según sea necesario.
Establece la ubicación para almacenar la estimación
En la lista Ubicación del recurso, selecciona la región en la que deseas almacenar esta estimación.
El lugar en el que eliges almacenar la estimación no afecta los datos que se analizarán. Tampoco afecta el lugar en el que se almacenarán los perfiles de datos más adelante. Los datos se analizan en la misma región en la que están almacenados (como se establece en BigQuery). Para obtener más información, consulta Consideraciones de residencia de datos.
Revisa tu configuración y haz clic en Crear.
La protección de datos sensibles crea la estimación y la agrega a la lista de estimaciones. Luego, ejecuta la estimación.
Según la cantidad de datos que haya en el recurso, una estimación puede tardar hasta 24 horas en completarse. Mientras tanto, puedes cerrar la página de protección de datos sensibles y volver a consultar más tarde. Cuando la estimación esté lista, aparecerá una notificación en la consola de Google Cloud.
Ver una estimación
Vaya a la lista de estimaciones.
Haz clic en la estimación que quieres ver. La estimación contiene lo siguiente:
- La cantidad de tablas en el recurso, menos cualquier tabla que hayas excluido a través de filtros y condiciones.
- Cantidad total de datos a los que equivalen las tablas.
- La cantidad de unidades de suscripción necesarias para generar perfiles de esta cantidad de datos cada mes.
- El costo del descubrimiento inicial, que es el costo aproximado de generar perfiles de las tablas que se encontraron. Esta estimación se basa solo en un resumen de los datos actuales y no considera cuánto crecen tus datos en un período determinado.
- Estimaciones de costos adicionales para generar perfiles solo de tablas con menos de 6, 12 o 24 meses de antigüedad. Estas estimaciones adicionales se proporcionan para mostrarte cómo limitar aún más la cobertura de los datos puede ayudarte a controlar el costo de la generación de perfiles de datos.
- El costo mensual estimado de generar perfiles de tus datos, suponiendo que el uso mensual de BigQuery es el mismo que el de este mes
- Un gráfico en el que se muestra el crecimiento de BigQuery a lo largo del tiempo.
- Los detalles de configuración que estableciste
Gráfico de estimación
Cada estimación incluye un gráfico que muestra el crecimiento histórico de tus datos de BigQuery. Puedes usar esta información para estimar el costo mensual de la generación de perfiles de datos.
¿Qué sigue?
- Obtén más información sobre los precios de los perfiles de datos.
- Obtén más información sobre los perfiles de datos de BigQuery.
- Obtén más información para generar perfiles de datos en una organización o carpeta.
- Obtén información para generar perfiles de datos en un solo proyecto.