이제 Cloud Data Loss Prevention(Cloud DLP)은 민감한 정보 보호에 포함됩니다. API 이름은 Cloud Data Loss Prevention API(DLP API)로 그대로 유지됩니다. 민감한 정보 보호를 구성하는 서비스에 대한 자세한 내용은 민감한 정보 보호 개요를 참조하세요.
이 문서에서는 조직의 데이터 위험을 평가하고 완화하기 위한 전략을 제공합니다. 또한 현재 데이터 보안 상태에 대해 자세히 알아볼 수 있는 두 가지 Sensitive Data Protection 서비스에 대해 설명하고 비교합니다.
데이터 위험 관리의 목표
데이터 위험을 관리하려면 비즈니스에 적절한 위험 수준 내에서 데이터를 저장, 처리, 사용하는 것이 필요합니다. 데이터 위험 관리를 수행할 때, 다음과 같은 목표를 달성하려고 노력하는 것이 좋습니다.
데이터가 올바르게 검색되고 분류됩니다.
데이터 노출 위험을 올바르게 이해합니다.
데이터가 적절한 제어 조치로 보호되거나 난독화를 통해 위험이 제거됩니다.
데이터 워크로드를 평가할 때 다음과 같은 질문으로 시작할 수 있습니다.
이 워크로드가 처리하는 데이터 종류는 무엇이며 그 중 민감한 정보가 있나요?
이 데이터가 적절하게 노출되나요? 예를 들어 데이터 액세스가 적절한 환경에서 적절한 사용자에게 승인된 목적으로 제한되나요?
데이터 수집 최소화 및 난독화 전략을 통해 이 데이터의 위험을 줄일 수 있나요?
충분한 정보를 바탕으로 위험 기반 접근 방식을 사용하면 사용자의 개인 정보를 침해하지 않고도 데이터를 최대한 활용할 수 있습니다.
분석 예시
이 예에서는 데이터팀이 제품 리뷰의 고객 의견을 기반으로 머신러닝 모델을 빌드하려고 한다고 가정해 보겠습니다.
이 워크로드가 처리하는 데이터 종류는 무엇이며 그 중 민감한 정보가 있나요?
데이터 워크로드에서 사용된 기본 키가 고객 이메일 주소인 것으로 확인되었습니다. 고객 이메일 주소에는 고객 이름이 포함되는 경우가 많습니다.
또한 실제 제품 리뷰에는 고객이 제출한 구조화되지 않은 데이터(또는 자유 형식 데이터)가 포함됩니다. 구조화되지 않은 데이터에는 전화번호, 주소와 같은 민감한 정보의 간헐적인 인스턴스가 포함될 수 있습니다.
이 데이터가 제대로 노출되나요?
제품팀만 데이터에 액세스할 수 있는 것으로 확인되었습니다. 하지만 데이터 분석팀에서 머신러닝 모델을 빌드하는 데 사용할 수 있도록 데이터를 공유하려고 합니다. 데이터를 더 많은 사람들에게 노출시키는 것은 이 데이터가 저장되고 처리될 더 많은 개발 환경에 노출시킨다는 것을 의미합니다. 노출 위험이 증가할 것으로 판단했습니다.
데이터 수집 최소화 및 난독화 전략을 통해 이 데이터의 위험을 줄일 수 있나요?
분석팀은 데이터 세트의 실제 민감한 개인 식별 정보(PII)는 필요로 하지 않습니다. 하지만 고객별로 데이터를 집계해야 합니다. 동일한 고객의 리뷰를 파악할 방법이 필요합니다. 이 문제를 해결하기 위해 데이터의 참조 무결성을 유지하기 위해 고객 이메일 주소와 같은 모든 구조화된 PII를 토큰화하기로 결정합니다. 또한 구조화되지 않은 데이터인 리뷰를 검사하고 그 안에 있는 간헐적인 민감한 정보를 마스킹하기로 결정합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[],[],null,["# Evaluate your data risk management needs\n\nThis series of documents provides strategies for evaluating and mitigating data\nrisk in your organization. It also describes and compares two\nSensitive Data Protection services that help you learn more about your\ncurrent data security posture.\n\nObjectives of data risk management\n----------------------------------\n\nManaging data risk involves storing, processing, and using your data within the\nappropriate risk levels for your business. When you perform data risk\nmanagement, we recommend that you aim for the following objectives:\n\n- Your data is properly discovered and classified.\n- Risk of data exposure is properly understood.\n- Data is protected by appropriate controls or de-risked through obfuscation.\n\nAs you evaluate your data workloads you can start by asking these\nquestions:\n\n- What kind of data does this workload handle and is any of it sensitive?\n- Is this data properly exposed? For example, is access to the data restricted to the right users, in the right environment, and for an approved purpose?\n- Can the risk of this data be reduced through data minimization and obfuscation strategies?\n\nTaking a well-informed and risk-based approach can help you make the most of\nyour data without compromising the privacy of your users.\n\nExample analysis\n----------------\n\nFor this example, suppose your data team is trying to build a machine learning\nmodel based on customer feedback in product reviews.\n\n### What kind of data does this workload handle and is any of it sensitive?\n\nIn the data workload, you found that the primary key used is the customer email\naddress. Customer email addresses often contain the customers' names.\nAdditionally, the actual product reviews contain unstructured data (or *freeform\ndata*) submitted by the customer. Unstructured data can contain intermittent\ninstances of sensitive data like phone numbers and addresses.\n\n### Is this data properly exposed?\n\nYou found that the data is accessible only to the product team. However, you\nwant to share the data to your data analytics team, so that they can use it to\nbuild a machine learning model. Exposing the data to more people also means\nexposing it to more development environments where this data will be stored and\nprocessed. You determined that the exposure risk will increase.\n\n### Can the risk of this data be reduced through data minimization and obfuscation strategies?\n\nYou know that the analytics team doesn't need any of the actual sensitive\npersonally identifiable information (PII) in the dataset. However, they need\nto aggregate the data per customer. They need a way to determine which reviews\nbelong to the same customer. To address this need, you decide to tokenize all\nthe structured PII---the customer email addresses---to keep the\nreferential integrity of your data. You also decide to inspect the unstructured\ndata---the reviews---and mask any intermittent sensitive data within it.\n\nWhat's next\n-----------\n\n- [Compare Sensitive Data Protection services that help you learn about your\n data](/sensitive-data-protection/docs/learn-about-your-data) (next document in this series)"]]