텍스트 검토는 '유해한 카테고리'와 민감하다고 간주될 수 있는 주제 등 안전 속성 목록에 대한 문서를 분석합니다. 문서의 텍스트를 검토하려면 moderateText
메서드를 호출합니다.
moderateText
메서드에 대해 반환되는 카테고리의 전체 목록은 여기에서 찾아볼 수 있습니다.
안전 속성 | 설명 |
---|---|
유해 | 무례하거나 모욕적이거나 부당한 콘텐츠 |
혐오 | ID 또는 보호 속성을 대상으로 하는 부정적이거나 유해한 댓글 |
폭력 | 개인 또는 그룹에 대한 폭력을 묘사하는 시나리오 또는 유혈 콘텐츠에 대한 일반적인 설명을 묘사 |
성적 콘텐츠 | 성행위 또는 기타 외설적인 콘텐츠에 대한 참조가 포함 |
모욕 | 한 사람 또는 여러 그룹에 대한 욕설, 분노 또는 부정적인 댓글 |
욕설 | 저주와 같은 외설적이거나 저속한 언어 |
사망, 피해 및 참사 | 인간의 죽음, 참사, 사고, 재해, 자해 |
총기 및 무기 | 검, 총, 개인 무기, 탄약, 권총집 등의 액세서리를 언급하는 콘텐츠 |
공공안전 | 구제책을 제공하고 공공 안전을 보장하는 서비스 및 조직 |
건강 | 건강 상태 즉, 질병, 장애, 의학 치료, 약물, 백신, 의료 관행 및 지원 그룹을 포함한 치료용 리소스가 포함 |
종교 및 신앙 | 초자연 법칙 및 존재 가능성을 다루는 신념 체계 즉, 종교, 신앙, 믿음, 영적 수행, 교회, 예배 장소. 점성학 및 오컬트 포함 |
불법 약물 | 유흥 및 불법 약물: 마약 용품 및 재배, 마약 상점 등. 일반적으로 기분 전환용으로 사용되는 약물(예: 마리화나)의 의학적 사용이 포함 |
전쟁 및 분쟁 | 전쟁, 군사적 충돌, 많은 사람들이 관련된 중대한 물리적 충돌. 전쟁이나 분쟁과 직접적인 관련이 없더라도 군 복무에 대한 논의는 포함 |
금융 | 은행, 대출, 신용, 투자, 보험 등 소비자 및 비즈니스 금융 서비스 |
정치 | 정치 뉴스 및 미디어, 사회, 정부, 공공 정책에 대한 토론 |
법률 | 법률 회사, 법률 정보, 주요 법률 자료, 준법 서비스, 법적 간행물 및 기술, 전문가 증인, 소송 컨설턴트, 기타 법률 서비스 제공업체를 포함한 법률 관련 콘텐츠 |
안전 속성 신뢰도 점수
각 안전 속성에는 지정된 신뢰도 점수가 0.00~1.00으로 표시되어 해당 카테고리에 속하는 입력 또는 응답의 가능성을 나타냅니다.
샘플 응답
{
"moderationCategories": [
{
"name": "Toxic",
"confidence": 0.10
},
{
"name": "Insult",
"confidence": 0.12
},
{
"name": "Profanity",
"confidence": 0.07
},
{
"name": "Derogatory",
"confidence": 0.04
},
{
"name": "Sexual",
"confidence": 0.00
},
{
"name": "Death, Harm & Tragedy",
"confidence": 0.00
},
{
"name": "Violent",
"confidence": 0.00
},
{
"name": "Firearms & Weapons",
"confidence": 0.00
},
{
"name": "Public Safety",
"confidence": 0.01
},
{
"name": "Health",
"confidence": 0.01
},
{
"name": "Religion & Belief",
"confidence": 0.00
},
{
"name": "Illicit Drugs",
"confidence": 0.01
},
{
"name": "War & Conflict",
"confidence": 0.02
},
{
"name": "Politics",
"confidence": 0.01
},
{
"name": "Finance",
"confidence": 0.00
},
{
"name": "Legal",
"confidence": 0.00
}
]
}
신뢰도 기준 테스트
Google의 안전 필터를 테스트하고 비즈니스에 맞는 신뢰도 기준을 정의할 수 있습니다. 이러한 기준을 사용하면 Google의 사용 정책 또는 서비스 약관을 위반하는 콘텐츠를 감지하고 적절한 조치를 취할 수 있습니다.
신뢰도 점수는 예측일 뿐입니다. 안정성 또는 정확성을 위해 점수에 의존해서는 안 됩니다. Google은 비즈니스 결정을 위해 이러한 점수를 해석하거나 사용할 책임이 없습니다.
가능성과 심각도의 차이점
신뢰도 점수는 콘텐츠가 심각도가 아닌 지정된 카테고리에 속해 있음을 나타냅니다. 일부 콘텐츠는 심각도의 유해성이 높더라도 안전하지 않을 가능성이 낮을 수 있으므로 이를 고려하는 것이 중요합니다. 예를 들어 다음 문장을 비교해보겠습니다.
- 로봇이 나를 때렸습니다.
- 로봇이 나를 베었습니다.
문장 1은 안전하지 않을 가능성이 더 높을 수 있지만 폭력 측면에서는 문장 2가 더 심각하다고 생각할 수 있습니다.
따라서 최종 사용자에 대한 해를 최소화하면서 사용 사례에 적합한 차단 수준을 신중하게 테스트하고 고려하는 것이 중요합니다.
언어 지원
언어 | ISO-639-1 | 지원 |
---|---|---|
영어 | es | 예 |
스페인어 | es | 예 |
포르투갈어 | pt | 예 |
프랑스어 | fr | 예 |
이탈리아어 | it | 예 |
독일어 | de | 예 |
중국어 | zh | 예 |
일본어 | ja | 예 |
한국어 | ko | 예 |
네덜란드어 | nl | 제한됨 |
러시아어 | ru | 제한됨 |
힌디어 | hi | 제한됨 |
인도네시아어 | id | 제한됨 |
아랍어 | ar | 제한됨 |
텍스트 검토 방법
이 섹션에서는 문서에서 텍스트를 검토하는 방법을 보여줍니다. 문서마다 별도의 요청을 제출해야 합니다.
다음은 문자열로 제공된 텍스트를 검토하는 예입니다.
프로토콜
문서에서 콘텐츠를 검토하려면 documents:moderateText
REST 메서드에 POST
요청을 하고 다음 예시와 같이 적절한 요청 본문을 제공해야 합니다.
이 예시에서는 gcloud auth application-default print-access-token
명령어를 사용하여 Google Cloud Platform gcloud CLI를 사용하는 프로젝트용으로 설정된 서비스 계정에 대한 액세스 토큰을 얻습니다.
gcloud CLI를 설치하고 서비스 계정을 통해 프로젝트를 설정하는 방법에 대한 안내는 빠른 시작을 참조하세요.
curl -X POST \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ -H "Content-Type: application/json; charset=utf-8" \ --data "{ 'document':{ 'type':'PLAIN_TEXT', 'content':'Shut up!' } }" "https://language.googleapis.com/v1/documents:moderateText"
Cloud Storage에서 텍스트 검토
다음은 Cloud Storage에서 텍스트 파일에 저장된 텍스트를 검토하는 예입니다.
프로토콜
Cloud Storage에 저장된 문서의 콘텐츠를 검토하려면 documents:moderateText
REST 메서드에 POST
요청을 하고 다음 예시와 같이 적절한 요청 본문 및 문서 경로를 제공해야 합니다.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ https://language.googleapis.com/v1/documents:moderateText -d "{ 'document':{ 'type':'PLAIN_TEXT', 'gcsContentUri':'gs://<bucket-name>/<object-name>' } }"