Evalúa tus necesidades de gestión de riesgos de datos

En esta serie de documentos se ofrecen estrategias para evaluar y mitigar los riesgos relacionados con los datos en tu organización. También describe y compara dos servicios de protección de datos sensibles que te ayudan a obtener más información sobre tu postura de seguridad de datos actual.

Objetivos de la gestión de riesgos de datos

La gestión de riesgos de datos implica almacenar, tratar y usar los datos de tu empresa con los niveles de riesgo adecuados. Cuando gestione los riesgos de los datos, le recomendamos que se plantee los siguientes objetivos:

  • Tus datos se descubren y clasifican correctamente.
  • Se comprenden correctamente los riesgos de exposición de datos.
  • Los datos están protegidos mediante controles adecuados o se han mitigado los riesgos mediante la ofuscación.

Al evaluar tus cargas de trabajo de datos, puedes empezar haciéndote estas preguntas:

  • ¿Qué tipo de datos gestiona esta carga de trabajo? ¿Alguno de ellos es sensible?
  • ¿Estos datos se exponen correctamente? Por ejemplo, ¿se restringe el acceso a los datos a los usuarios adecuados, en el entorno adecuado y con un fin aprobado?
  • ¿Se puede reducir el riesgo de estos datos mediante estrategias de minimización y ofuscación de datos?

Si adoptas un enfoque fundamentado y basado en los riesgos, podrás sacar el máximo partido a tus datos sin poner en riesgo la privacidad de tus usuarios.

Ejemplo de análisis

En este ejemplo, supongamos que tu equipo de datos está intentando crear un modelo de aprendizaje automático basado en los comentarios de los clientes en las reseñas de productos.

¿Qué tipo de datos gestiona esta carga de trabajo? ¿Alguno de ellos es sensible?

En la carga de trabajo de datos, has detectado que la clave principal utilizada es la dirección de correo del cliente. Las direcciones de correo de los clientes suelen contener sus nombres. Además, las reseñas de productos reales contienen datos no estructurados (o de formato libre) enviados por el cliente. Los datos no estructurados pueden contener instancias intermitentes de datos sensibles, como números de teléfono y direcciones.

¿Estos datos se exponen correctamente?

Has descubierto que solo el equipo del producto puede acceder a los datos. Sin embargo, quieres compartir los datos con tu equipo de analíticas de datos para que puedan usarlos y crear un modelo de aprendizaje automático. Exponer los datos a más personas también significa exponerlos a más entornos de desarrollo en los que se almacenarán y tratarán. Has determinado que el riesgo de exposición aumentará.

¿Se puede reducir el riesgo de estos datos mediante estrategias de minimización y ofuscación de datos?

Sabes que el equipo de analíticas no necesita ninguna información personal identificable (IPI) sensible del conjunto de datos. Sin embargo, deben agregar los datos por cliente. Necesitan una forma de determinar qué reseñas pertenecen al mismo cliente. Para satisfacer esta necesidad, decides tokenizar toda la información personal identificable estructurada (las direcciones de correo de los clientes) para mantener la integridad referencial de tus datos. También decides inspeccionar los datos no estructurados (las reseñas) y enmascarar los datos sensibles intermitentes que contengan.

Siguientes pasos