En esta página, se describe cómo estimar el costo de generar perfiles de datos de BigQuery en un proyecto. Si deseas crear una estimación para una organización o carpeta, consulta Cómo calcular el costo de generar perfiles de datos en una organización o carpeta.
Si deseas obtener más información para crear perfiles de datos de BigQuery, consulta Perfiles de datos para datos de BigQuery.
Descripción general
Antes de comenzar a generar perfiles de datos, puedes ejecutar una estimación para comprender la cantidad de datos de BigQuery que tienes y cuánto podría costar generar perfiles de esos datos. Para ejecutar una estimación, debes crear una.
Cuando creas una estimación, especificas el recurso (organización, carpeta o proyecto) que contiene los datos de los que deseas crear un perfil. Puedes establecer filtros para ajustar la selección de datos. También puedes establecer las condiciones que se deben cumplir antes de que la protección de datos sensibles genere el perfil de una tabla. La Protección de datos sensibles basa la estimación en la forma, el tamaño y el tipo de los datos en el momento en que creas la estimación.
Cada estimación incluye detalles como la cantidad de tablas coincidentes que se encuentran en el recurso, el tamaño total de todas esas tablas y el costo estimado de crear perfiles del recurso una vez y de forma mensual.
Para obtener más información sobre cómo se calculan los precios, consulta Precios de la generación de perfiles de datos.
Precios de la estimación
La creación de una estimación es sin costo.
Retención
Cada estimación se borra automáticamente después de 28 días.
Antes de comenzar
Para obtener los permisos que necesitas para crear y administrar estimaciones de costos de perfilado de datos,
pídele a tu administrador que te otorgue el rol de IAM de
administrador de DLP (roles/dlp.admin
) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Asegúrate de que la API de Cloud Data Loss Prevention esté habilitada en tu proyecto:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
Para obtener los permisos que necesitas para crear y administrar estimaciones de costos de perfilado de datos, pídele a tu administrador que te otorgue el rol de IAM de administrador de DLP (
roles/dlp.admin
) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea una estimación
Ve a la página Crear una estimación del perfil de datos.
Elige tu proyecto.
En las siguientes secciones, se proporciona más información sobre los pasos de la página Crear estimación de perfil de datos. Al final de cada sección, haz clic en Continuar.
Selecciona un recurso para analizarlo
Asegúrate de que esté seleccionada la opción Scan entire project.Filtros y condiciones de entrada
Puedes omitir esta sección si deseas incluir todas las tablas de BigQuery del proyecto en tu estimación.En esta sección, crearás filtros para especificar ciertos subconjuntos de tus datos que deseas incluir o excluir de la estimación. Para los subconjuntos que incluyas en la estimación, también debes especificar las condiciones que debe cumplir una tabla del subconjunto para que se incluya en la estimación.
Para establecer filtros y condiciones, sigue estos pasos:
- Haz clic en Agregar filtros y condiciones.
En la sección Filtros, defines uno o más filtros que especifican qué tablas están dentro del alcance de la estimación.
Especifica al menos uno de los siguientes elementos:
- Un ID del proyecto o una expresión regular que especifique uno o más proyectos.
- Un ID de conjunto de datos o una expresión regular que especifique uno o más conjuntos de datos.
- Un ID de tabla o una expresión regular que especifique una o más tablas.
Las expresiones regulares deben seguir la sintaxis RE2.
Por ejemplo, si deseas que todas las tablas de un conjunto de datos se incluyan en el filtro, especifica el ID de ese conjunto de datos y deja los otros dos campos en blanco.
Si deseas agregar más filtros, haz clic en Agregar filtro y repite este paso.
Si los subconjuntos de datos que definen tus filtros deben excluirse de la estimación, desactiva Incluir las tablas que coinciden en mi estimación. Si desactivas esta opción, se ocultarán las condiciones que se describen en el resto de esta sección.
Opcional: En la sección Condiciones, especifica las condiciones que deben cumplir las tablas coincidentes para que se incluyan en la estimación. Si omites este paso, la Protección de datos sensibles incluirá todas las tablas compatibles que coincidan con tus filtros, independientemente de su tamaño y antigüedad.
Configura las siguientes opciones:
Condiciones mínimas: Para excluir tablas pequeñas o nuevas de la estimación, establece un recuento mínimo de filas o una antigüedad de la tabla.
Condición de tiempo: Para excluir tablas anteriores, activa la condición de tiempo. Luego, elige una fecha y hora. Cualquier tabla creada hasta esa fecha se excluye de la estimación.
Por ejemplo, si configuras la condición de hora en 4/5/22, 11:59 p.m., la Protección de datos sensibles excluirá de la estimación todas las tablas creadas el 4 de mayo de 2022 o antes a esa hora.
Tablas para generar perfiles: Para especificar los tipos de tablas que se incluirán en la estimación, selecciona Solo incluir las tablas de uno o más tipos especificados. Luego, selecciona los tipos de tablas que deseas incluir.
Si no activas esta condición o no seleccionas ningún tipo de tabla, la Protección de datos sensibles incluirá todas las tablas compatibles en la estimación.
Supongamos que tienes la siguiente configuración:
Condiciones mínimas
- Cantidad mínima de filas: 10 filas
- Duración mínima: 24 horas
Condición de hora
- Marca de tiempo: 4/5/22, 11:59 p.m.
Tablas para generar perfiles
Se selecciona la opción Solo incluir las tablas de uno o más tipos especificados. En la lista de tipos de tablas, solo se selecciona Profile BigLake tables.
En este caso, Sensitive Data Protection excluye todas las tablas creadas el 4 de mayo de 2022 a las 11:59 p.m. o antes. Entre las tablas creadas después de esta fecha y hora, la Protección de datos sensibles solo genera perfiles de las tablas de BigLake que tengan 10 filas o tengan al menos 24 horas de antigüedad.
Haz clic en Listo.
Si deseas agregar más filtros y condiciones, haz clic en Agregar filtros y condiciones y repite los pasos anteriores.
El último elemento de la lista de filtros y condiciones siempre es el etiquetado como Filtros y condiciones predeterminados. Este parámetro de configuración predeterminado se aplica a las tablas de tu proyecto que no coinciden con ninguno de los filtros ni las condiciones que creaste.
Si quieres ajustar los filtros y las condiciones predeterminados, haz clic en
Editar filtros y condiciones, y ajusta la configuración según sea necesario.
Establece la ubicación para almacenar la estimación
En la lista Ubicación del recurso, selecciona la región en la que deseas almacenar esta estimación.
El lugar donde elijas almacenar tu estimación no afecta los datos que se analizarán. Además, no afecta dónde se almacenan los perfiles de datos más adelante. Tus datos se analizan en la misma región en la que se almacenan (como se establece en BigQuery). Para obtener más información, consulta Consideraciones sobre la residencia de los datos.
Revisa tu configuración y haz clic en Crear.
Sensitive Data Protection crea la estimación y la agrega a la lista de estimaciones. Luego, ejecuta la estimación.
Según la cantidad de datos que haya en el recurso, una estimación puede tardar hasta 24 horas en completarse. Mientras tanto, puedes cerrar la página de Protección de datos sensibles y volver más tarde. Aparecerá una notificación en la consola de Google Cloud cuando la estimación esté lista.
Cómo ver una estimación
Ve a la lista de estimaciones.
Haz clic en la estimación que deseas ver. La estimación contiene lo siguiente:
- Es la cantidad de tablas en el recurso, menos las que excluyes con filtros y condiciones.
- Es la cantidad total de datos a los que equivalen las tablas.
- Es la cantidad de unidades de suscripción necesarias para generar perfiles de esta cantidad de datos todos los meses.
- El costo del descubrimiento inicial, que es el costo aproximado de perfilar las tablas que se encontraron. Esta estimación se basa solo en un resumen de los datos actuales y no considera cuánto crecen tus datos en un período determinado.
- Estimaciones de costos adicionales para generar perfiles solo de tablas que tienen menos de 6, 12 o 24 meses de antigüedad. Estas estimaciones adicionales se proporcionan para mostrarte cómo limitar aún más la cobertura de tus datos puede ayudarte a controlar el costo de la generación de perfiles de datos.
- Es el costo mensual estimado de crear perfiles de tus datos, asumiendo que tu uso de BigQuery cada mes es el mismo que el de este mes.
- Un gráfico que muestra el crecimiento de tu BigQuery a lo largo del tiempo.
- Los detalles de configuración que estableciste
Gráfico de estimaciones
Cada estimación incluye un gráfico que muestra el crecimiento histórico de tus datos de BigQuery. Puedes usar esta información para estimar tu costo mensual de generación de perfiles de datos.
¿Qué sigue?
- Obtén información sobre los precios de la generación de perfiles de datos.
- Obtén más información sobre los perfiles de datos para datos de BigQuery.
- Obtén información para generar perfiles de datos en una organización o carpeta.
- Obtén información para generar perfiles de datos en un solo proyecto.