이제 Cloud Data Loss Prevention(Cloud DLP)은 민감한 정보 보호에 포함됩니다. API 이름은 Cloud Data Loss Prevention API(DLP API)로 그대로 유지됩니다. 민감한 정보 보호를 구성하는 서비스에 대한 자세한 내용은 민감한 정보 보호 개요를 참조하세요.
스캔 결과는 일치를 나타낼 가능성에 따라 분류됩니다.
민감한 정보 보호는 데이터의 일부가 지정된 infoType과 일치할 가능성을 나타내는 버케팅된 가능성 표현을 사용합니다.
가능성 작동 방식
Sensitive Data Protection 스캔을 구성할 때 Sensitive Data Protection이 스캔을 수행할 infoType을 설정합니다. 스캔 결과를 좁히려면 요청에서 최소 가능성 수준을 설정하면 됩니다.
스캔 중에 감지된 각 잠재적 일치 항목(발견 항목)에 대해 Sensitive Data Protection이 가능성 수준을 할당합니다. 발견 항목의 가능성 수준은 발견 항목이 검사하려는 infoType과 일치할 가능성을 설명합니다. 예를 들어 Sensitive Data Protection은 이메일 주소와 비슷한 발견 항목에 LIKELY의 가능성을 할당할 수 있습니다.
Sensitive Data Protection이 결과를 반환하면 요청에 설정한 최소 가능성 수준보다 가능성이 낮은 발견 항목을 필터링합니다. 예를 들어 최소 가능성을 POSSIBLE로 설정하면 POSSIBLE, LIKELY, VERY_LIKELY로 평가된 결과만 표시됩니다. 최소 가능성을 VERY_LIKELY로 설정하면 가장 적은 수의 결과를 얻을 수 있습니다.
가능성 수준
다음 표에는 Sensitive Data Protection이 발견 항목에 할당할 수 있는 가능성 값이 나와 있습니다.
ENUM
설명
VERY_UNLIKELY
다음과 같은 특징이 있습니다.
약한 신호
상황별 단서 없음
지정된 infoType의 부정적 신호
UNLIKELY
다음과 같은 특징이 있습니다.
하나 이상의 약한 신호
다른 infoType의 더 강력한 신호
POSSIBLE
다음과 같은 특징이 있습니다.
지정된 infoType에 대한 하나 이상의 신호 신호에는 체크섬 전달이 포함될 수 있습니다.
강력한 상황별 단서와 고유하고 구체적인 형식이 없습니다.
LIKELY
지정된 infoType에 대해 하나 이상의 강력한 신호가 있는 특성을 나타냅니다.
신호에는 체크섬 전달, 강력한 상황별 단서, 고유하고 구체적인 형식이 포함될 수 있습니다.
VERY_LIKELY
지정된 infoType에 대해 많은 강력한 신호가 있는 특성을 나타냅니다.
신호에는 체크섬 전달, 강력한 상황별 단서, 고유하고 구체적인 형식이 포함될 수 있습니다.
스캔 결과의 최소 가능성 수준 선택
일반적으로 Sensitive Data Protection 요청에서 최소 가능성 수준을 높게 설정하면 결과에 거짓양성 수가 줄어듭니다(노이즈라고도 함). 하지만 결과에서 더 많은 실제 양성이 제외될 수도 있습니다. 최소 가능성 수준을 선택하려면 재현율과 정밀도 간의 적절한 균형을 찾아야 합니다.
예를 들어 문서에 10개의 상세 주소가 있고 Sensitive Data Protection이 5개의 상세 주소를 식별했다고 가정해 보겠습니다. 하지만 Sensitive Data Protection에서 식별된 발견 항목 중에는 실제로 주소가 4개밖에 없습니다.
재현율은 총 관련 인스턴스 수 중 참양성 인스턴스 수입니다. 이 예시에서 재현율은 4/10입니다.
정밀도는 Sensitive Data Protection이 식별하는 총 인스턴스 수 중 참양성 인스턴스 수입니다. 이 예시에서 정밀도는 4/5입니다.
이 예에서는 정밀도가 높지만 재현율은 비교적 낮습니다.
설정한 최소 가능성 수준은 스캔 결과에서 얻는 재현율 및 정밀도 수준에 영향을 미칩니다. 다음 표에서는 각 최소 가능성 수준이 유용한 경우와 각 수준에서 재현율과 정밀도가 어떻게 달라지는지 설명합니다.
최소 가능성 수준
설명
LIKELIHOOD_UNSPECIFIED
기본값 POSSIBLE과 동일합니다.
VERY_UNLIKELY
재현율이 가장 높아야 하는 경우 유용합니다. 이 최소 가능성 수준은 가장 많은 노이즈를 생성합니다.
UNLIKELY
재현율이 높아야 하는 경우 유용합니다. 이 최소 가능성 수준은 약간의 노이즈를 생성합니다.
POSSIBLE
정밀도와 재현율의 균형을 원하는 경우 유용합니다.
LIKELY
재현율이 약간 떨어지지만 정밀도가 가장 높아야 하는 경우 유용합니다.
VERY_LIKELY
재현율이 떨어지지만 정밀도가 가장 높아야 하는 경우 유용합니다.
기본 최소 가능성
요청에서 최소 가능성을 설정하지 않거나 LIKELIHOOD_UNSPECIFIED로 설정하면 민감한 정보 보호는 가능성이 POSSIBLE 이상인 발견 항목만 반환합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[],[],null,["# Match likelihood\n\nScan results are categorized based on how likely they are to represent a match.\nSensitive Data Protection uses a bucketized\nrepresentation of likelihood, which is intended to indicate how likely it is\nthat a piece of data matches a given [infoType](/sensitive-data-protection/docs/infotypes-reference \"InfoTypes reference\").\n\nHow likelihood works\n--------------------\n\nWhen you configure a Sensitive Data Protection scan, you set the infoTypes\nthat you want Sensitive Data Protection to scan for. To narrow the scan\nresults, you can [set a *minimum likelihood level* in your\nrequest](#choose-min-likelihood).\n\nFor each potential match (*finding* ) that is detected during the scan,\nSensitive Data Protection assigns a likelihood level. The likelihood level of\na finding describes how likely it is that the finding matches an infoType that\nyou're scanning for. For example, Sensitive Data Protection might assign\na likelihood of `LIKELY` to a finding that looks like an email address.\n\nWhen Sensitive Data Protection returns the results, it filters out any\nfindings that have a lower likelihood than the minimum likelihood level that you\nset in your request. For example, if you set the minimum likelihood to\n`POSSIBLE`, you get only the findings that were evaluated as `POSSIBLE`,\n`LIKELY`, and `VERY_LIKELY`. If you set the minimum likelihood to `VERY_LIKELY`,\nyou get the smallest number of findings.\n| **Tip:** In your request, you can set the same minimum likelihood level for all infoTypes that you're scanning for. Alternatively, you can [set specific\n| minimum likelihood levels for specific\n| infoTypes](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#FIELDS.min_likelihood_per_info_type).\n\nLikelihood levels\n-----------------\n\nThe following table lists the possible likelihood values that\nSensitive Data Protection can assign to a finding.\n\nChoosing a minimum likelihood level for the scan results\n--------------------------------------------------------\n\nIn general, when you set a higher minimum likelihood level in your\nSensitive Data Protection request, the results have a lower number of false\npositives (sometimes called *noise* ). However, the results can also exclude more\ntrue positives. Choosing a minimum likelihood level involves finding the right\nbalance between [recall and\nprecision](https://en.wikipedia.org/wiki/Precision_and_recall).\n\nFor example, suppose that there are 10 street addresses in a document and\nSensitive Data Protection identified 5 street addresses. However,\namong the findings that Sensitive Data Protection identified, there are\nactually only 4 street addresses.\n\n- *Recall* is the number of true positive instances out of the total number of relevant instances. In this example, the recall is 4/10.\n- *Precision* is the number of true positive instances out of the total number of instances that Sensitive Data Protection identifies. In this example, the precision is 4/5.\n\nIn this example, the precision is high but the recall is relatively low.\n\nThe minimum likelihood level that you set affects the level of recall and\nprecision that you get in your scan results. The following table describes when\neach minimum likelihood level is useful and how recall and precision vary at\neach level.\n\nDefault minimum likelihood\n--------------------------\n\nIf you don't set a minimum likelihood in your request, or if you set it to\n`LIKELIHOOD_UNSPECIFIED`, Sensitive Data Protection returns only the findings with\na likelihood of `POSSIBLE` and higher."]]