Model Armor는 LLM 애플리케이션의 프롬프트와 대답을 검사합니다. 모니터링 대시보드는 이 스크리닝 프로세스에서 생성된 데이터, 측정항목, 시각화를 제공합니다. 이러한 통계를 사용하여 Model Armor가 AI 애플리케이션을 보호하고, 시도된 프롬프트 인젝션 및 기타 악성 활동을 식별하는 방법을 파악하세요.
시작하기 전에
필수 권한
모니터링 대시보드에 액세스하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
이 사전 정의된 역할에는 모니터링 대시보드에 액세스하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.
필수 권한
모니터링 대시보드에 액세스하려면 다음 권한이 필요합니다.
-
monitoring.monitoredResourceDescriptors.list
-
monitoring.metricDescriptors.list
커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.
모니터링 대시보드에 액세스
Google Cloud 콘솔에서 Model Armor 페이지로 이동합니다.
Model Armor를 활성화한 프로젝트가 표시되었는지 확인합니다.
Monitoring 탭으로 이동합니다.
이 페이지에서 다음을 수행할 수 있습니다.
- 선택한 날짜 및 시간의 상호작용을 확인합니다.
- 연결된 템플릿 또는 층 설정, 위치, 통합 지점, 입력 유형을 기반으로 상호작용을 필터링합니다.
- 데이터를 PNG 또는 CSV 파일로 다운로드합니다.
- 동향 차트를 사용하여 시간 경과에 따른 위반을 추적합니다.
- 프로젝트 전반에서 사용되는 템플릿을 확인합니다.
관련 로그를 검사하여 선택한 날짜와 시간의 로그를 확인합니다. 이렇게 하려면 > 관련 로그 검사를 클릭합니다.
차트 옵션 더보기관련 로그를 검사하려면 템플릿과 층 설정에서 로깅을 사용 설정해야 하며 로그를 볼 수 있는 IAM 권한이 있어야 합니다.
주요 측정항목
모니터링 대시보드의 주요 측정항목은 다음과 같습니다.
- 스캔된 총 상호작용: Model Armor에서 분석한 프롬프트 및 대답의 총량입니다.
- 플래그가 지정된 상호작용: Model Armor 템플릿 또는 최소 기준 설정에서 구성된 정책을 하나 이상 위반한 상호작용의 수입니다.
- 차단된 상호작용: 차단된 상호작용 수입니다 (검사 및 차단 모드에서 모델 아머를 구성한 경우).
- 카테고리별 위반:
- 모든 감지기: 모든 감지기에 의해 위반된 콘텐츠입니다.
- 민감한 정보 위반: 개인 식별 정보(PII), 금융 데이터 또는 정의한 맞춤 데이터 유형이 있습니다.
- 책임감 있는 AI: 증오심 표현, 위험한 콘텐츠, 괴롭힘, 음란물 등 안전 필터를 위반하는 콘텐츠
다음 단계
- Model Armor에 대해 알아보기
- Model Armor 템플릿에 대해 알아보기
- Model Armor 최소 기준 설정에 대해 알아보기
- Model Armor 엔드포인트에 대해 알아보기
- 프롬프트 및 응답 정리
- Model Armor 감사 로깅에 대해 알아보기
- Model Armor 로깅 구성
- Model Armor 문제 해결하기