이 페이지는 Cloud Translation API를 통해 번역되었습니다.

안전 및 콘텐츠 필터

Gemini 2.5 Flash와 같은 Google의 생성형 AI 모델은 안전을 우선시하도록 설계되었습니다. 하지만 특히 선정적인 프롬프트가 작성되는 경우 유해한 대답이 생성될 수 있습니다. 안전을 강화하고 오용을 최소화하기 위해 잠재적으로 유해한 대답을 차단하도록 콘텐츠 필터를 구성할 수 있습니다.

이 페이지에서는 각 안전 및 콘텐츠 필터 유형을 설명하고 주요 안전 개념을 간략하게 설명합니다. 구성 가능한 콘텐츠 필터의 경우 각 유해 카테고리의 차단 기준점을 구성하여 프롬프트와 대답이 차단되는 빈도를 제어하는 방법을 보여줍니다. 구성 가능한 콘텐츠 필터를 프로그래밍하는 방법을 보여주는 예시도 제공됩니다.

안전 및 콘텐츠 필터는 유해한 출력을 방지하는 장벽 역할을 하지만 모델의 동작에 직접적인 영향을 미치지는 않습니다. 모델 조종에 관한 자세한 내용은 안전을 위한 시스템 요청 사항을 참조하세요.

안전하지 않은 프롬프트

Vertex AI의 Gemini API는 다음 enum 코드 중 하나를 제공하여 프롬프트가 거부된 이유를 설명합니다.

Enum	필터 유형	설명
`PROHIBITED_CONTENT`	구성 불가능한 안전 필터	프롬프트에 포함된 금지된 콘텐츠(일반적으로 아동 성적 학대 콘텐츠)로 인해 프롬프트가 신고되어 차단되었습니다.
`BLOCKED_REASON_UNSPECIFIED`	해당 사항 없음	프롬프트 차단 이유가 지정되지 않았습니다.
`OTHER`	해당 사항 없음	이 enum은 프롬프트를 차단하는 기타 모든 이유를 나타냅니다. Vertex AI의 Gemini API는 일부 언어만 지원합니다. 지원되는 언어 목록은 Gemini 언어 지원을 참조하세요.

자세한 내용은 BlockedReason을 참조하세요.

다음은 프롬프트 피드백에 대한 Vertex AI의 Gemini API 출력 예시입니다. 프롬프트가 차단되면 promptFeedback에 blockReason이 포함됩니다. 프롬프트가 차단되지 않으면 다음 예와 같이 promptFeedback가 비어 있습니다.

{
  "promptFeedback": {
  },
  "usageMetadata": {
    "promptTokenCount": 7,
    "totalTokenCount": 7
  }
}

다음 예는 PROHIBITED_CONTENT가 포함되어 차단된 프롬프트를 보여줍니다.

{
  "promptFeedback": {
    "blockReason": "PROHIBITED_CONTENT"
  },
  "usageMetadata": {
    "promptTokenCount": 7,
    "totalTokenCount": 7
  }
}

다음 예시에서는 지정되지 않은 이유로 차단된 프롬프트를 보여줍니다.

{
  "promptFeedback": {
    "blockReason": "BLOCKED_REASON_UNSPECIFIED"
  },
  "usageMetadata": {
    "promptTokenCount": 7,
    "totalTokenCount": 7
  }
}

안전하지 않은 대답

다음 필터는 잠재적으로 안전하지 않은 대답을 감지하고 차단할 수 있습니다.

아동 성적 학대 콘텐츠(CSAM) 및 개인 식별 정보(PII)를 차단하는 구성 불가능한 안전 필터
유해 카테고리 목록과 사용자가 구성한 차단 기준점을 기반으로 안전하지 않은 콘텐츠를 차단하는 구성 가능한 콘텐츠 필터. 사용 사례와 비즈니스에 적합한 기준에 따라 이러한 각 유형의 유해에 대한 차단 기준점을 구성할 수 있습니다. 자세한 내용은 구성 가능한 콘텐츠 필터를 참조하세요.
소스 자료의 인용을 제공하는 인용 필터. 자세한 내용은 인용 필터를 참조하세요.

LLM은 토큰이라는 텍스트 단위로 대답을 생성합니다. 자연스러운 중지 지점에 도달하거나 필터 중 하나가 대답을 차단하면 모델에서 토큰 생성을 중지합니다. Vertex AI의 Gemini API는 다음 enum 코드 중 하나를 제공하여 토큰 생성이 중지된 이유를 설명합니다.

Enum	필터 유형	설명
`STOP`	해당 사항 없음	이 enum은 모델이 자연스러운 중단 지점 또는 제공된 중지 시퀀스에 도달했음을 나타냅니다.
`MAX_TOKENS`	해당 사항 없음	모델이 요청에 지정된 최대 토큰 수에 도달하여 토큰 생성이 중지되었습니다.
`SAFETY`	구성 가능한 콘텐츠 필터	대답이 유해한 콘텐츠로 신고되어 토큰 생성이 중지되었습니다.
`RECITATION`	인용 필터	인용 가능성으로 인해 토큰 생성이 중지되었습니다.
`SPII`	구성 불가능한 안전 필터	민감한 개인 식별 정보(SPII) 콘텐츠로 인해 대답이 신고되어 토큰 생성이 중지되었습니다.
`PROHIBITED_CONTENT`	구성 불가능한 안전 필터	대답에 포함된 금지된 콘텐츠(일반적으로 아동 성적 학대 콘텐츠)로 인해 대답이 신고되어 토큰 생성이 중지되었습니다.
`FINISH_REASON_UNSPECIFIED`	해당 사항 없음	종료 이유가 지정되지 않았습니다.
`OTHER`	해당 사항 없음	이 enum은 토큰 생성을 중지하는 기타 모든 이유를 나타냅니다. 일부 언어에서는 토큰 생성이 지원되지 않습니다. 지원되는 언어 목록은 Gemini 언어 지원을 참조하세요.

자세한 내용은 FinishReason을 참조하세요.

필터가 대답을 차단하면 대답의 Candidate.content 필드가 무효화됩니다. 모델에 피드백을 제공하지 않습니다.

구성 가능한 콘텐츠 필터

콘텐츠 필터는 유해 목록에 대해 콘텐츠를 평가합니다. 콘텐츠 필터는 유해 카테고리별로 콘텐츠가 유해할 확률에 따른 점수 하나와 유해 콘텐츠의 심각도에 따른 또 다른 점수 하나를 할당합니다.

구성 가능한 콘텐츠 필터에는 모델 버전과 독립된 버전 관리가 없습니다. Google에서는 이전에 출시된 버전의 모델에 대해 구성 가능한 콘텐츠 필터를 업데이트하지 않습니다. 하지만 향후 버전의 모델에서 구성 가능한 콘텐츠 필터를 업데이트할 수 있습니다.

유해 카테고리

콘텐츠 필터는 다음 유해 카테고리를 기준으로 콘텐츠를 평가합니다.

유해 카테고리	정의
증오심 표현	ID 또는 보호 속성을 대상으로 하는 부정적이거나 유해한 댓글
괴롭힘	다른 사람을 대상으로 위협하거나 협박하거나 괴롭히거나 모욕하는 댓글
선정적	성행위 또는 기타 외설적인 콘텐츠에 대한 참조가 포함
위험한 콘텐츠	유해한 상품, 서비스, 활동 홍보 및 이에 대한 액세스 지원

확률 점수와 심각도 점수 비교

확률 안전 점수는 모델 대답이 해당 유해 카테고리와 관련이 있을 가능성을 반영합니다. 0.0~1.0 사이의 신뢰도 점수(소수점 1자리에서 반올림)가 연결되어 있습니다. 신뢰도 점수는 NEGLIGIBLE, LOW, MEDIUM, HIGH의 네 가지 신뢰도 수준으로 이산화됩니다.

심각도 점수는 모델 대답이 얼마나 유해할 수 있는지를 나타냅니다. 0.0~1.0 사이의 심각도 점수(소수점 이하 1자리에서 반올림)가 연결되어 있습니다. 심각도 점수는 NEGLIGIBLE, LOW, MEDIUM, HIGH의 네 가지 수준으로 이산화됩니다.

콘텐츠의 확률 점수는 낮고 심각도 점수는 높을 수 있고, 확률 점수는 높고 심각도 점수는 낮을 수도 있습니다.

콘텐츠 필터 구성 옵션

Vertex AI의 Gemini API 또는 Google Cloud 콘솔을 사용하여 콘텐츠 필터를 구성할 수 있습니다.

Vertex AI의 Gemini API

Vertex AI의 Gemini API는 두 가지 '피해 차단' 메서드를 제공합니다.

SEVERITY: 이 메서드는 확률 점수와 심각도 점수를 모두 사용합니다.
PROBABILITY: 이 메서드는 확률 점수만 사용합니다.

기본 방법은 SEVERITY입니다. gemini-1.5-flash 및 gemini-1.5-pro보다 오래된 모델의 경우 기본 메서드는 PROBABILITY입니다. 자세한 내용은 HarmBlockMethod API 참조를 참조하세요.

Vertex AI의 Gemini API는 다음과 같은 '피해 차단' 기준점을 제공합니다.

BLOCK_LOW_AND_ABOVE: 확률 점수 또는 심각도 점수가 LOW, MEDIUM 또는 HIGH인 경우 차단합니다.
BLOCK_MEDIUM_AND_ABOVE: 확률 점수 또는 심각도 점수가 MEDIUM 또는 HIGH인 경우 차단합니다.
BLOCK_ONLY_HIGH: 확률 점수 또는 심각도 점수가 HIGH인 경우 차단합니다.
HARM_BLOCK_THRESHOLD_UNSPECIFIED: 기본 기준점을 사용하여 차단합니다.
OFF: 자동 대답 차단이 없으며 메타데이터가 반환되지 않습니다. gemini-2.5-flash 및 이후 모델의 경우 OFF가 기본값입니다.
BLOCK_NONE: BLOCK_NONE 설정은 자동 대답 차단을 삭제합니다. 대신 반환된 점수로 자체 콘텐츠 가이드라인을 구성할 수 있습니다. 이 필드는 정식 모델 버전의 일부 사용자에게만 제공되는 제한된 필드입니다.

예를 들어 다음 Python 코드는 위험한 콘텐츠 카테고리의 피해 차단 기준점을 BLOCK_ONLY_HIGH로 설정하는 방법을 보여줍니다.

generative_models.SafetySetting(
  category=generative_models.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
  threshold=generative_models.HarmBlockThreshold.BLOCK_ONLY_HIGH,
),

이렇게 하면 위험한 콘텐츠로 분류된 대부분의 콘텐츠가 차단됩니다. 자세한 내용은 HarmBlockThreshold API 참조를 참조하세요.

Python, Node.js, Java, Go, C#, REST의 엔드 투 엔드 예시는 콘텐츠 필터 구성 예시를 참조하세요.

Google Cloud 콘솔

Google Cloud 콘솔을 사용하면 각 콘텐츠 속성의 기준점을 구성할 수 있습니다. 콘텐츠 필터는 확률 점수만 사용합니다. 심각도 점수를 사용할 수 있는 옵션은 없습니다.

Google Cloud 콘솔은 다음과 같은 기준점 값을 제공합니다.

사용 안함(기본값): 자동 대답 차단이 적용되지 않습니다.
소수 차단: 확률 점수가 HIGH인 경우 차단합니다.
일부 차단: 확률 점수가 MEDIUM 또는 HIGH인 경우 차단합니다.
대부분 차단: 확률 점수가 LOW, MEDIUM 또는 HIGH인 경우 차단합니다.

예를 들어 위험한 콘텐츠 카테고리에 대해 차단 설정을 소수 차단으로 설정하면 위험한 콘텐츠일 가능성이 높은 모든 항목이 차단됩니다. 가능성이 낮은 모든 항목은 허용됩니다.

기준점을 설정하려면 다음 단계를 참조하세요.

콘솔의 Vertex AI 섹션에서 Google Cloud Vertex AI Studio 페이지로 이동합니다.

Vertex AI Studio로 이동
새 프롬프트 만들기에서 버튼 중 하나를 클릭하여 프롬프트 디자인 페이지를 엽니다.
안전 설정을 클릭합니다.

안전 설정 대화상자 창이 열립니다.
각 유해 카테고리에 대해 원하는 기준 값을 구성합니다.
저장을 클릭합니다.

차단된 대답의 출력 예시

다음은 위험한 콘텐츠가 포함되어 구성 가능한 콘텐츠 필터에 의해 대답이 차단된 경우의 Vertex AI의 Gemini API 출력 예시입니다.

{
  "candidates": [{
    "finishReason": "SAFETY",
    "safetyRatings": [{
      "category": "HARM_CATEGORY_HATE_SPEECH",
      "probability": "NEGLIGIBLE",
      "probabilityScore": 0.11027937,
      "severity": "HARM_SEVERITY_LOW",
      "severityScore": 0.28487435
    }, {
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "probability": "HIGH",
      "blocked": true,
      "probabilityScore": 0.95422274,
      "severity": "HARM_SEVERITY_MEDIUM",
      "severityScore": 0.43398145
    }, {
      "category": "HARM_CATEGORY_HARASSMENT",
      "probability": "NEGLIGIBLE",
      "probabilityScore": 0.11085559,
      "severity": "HARM_SEVERITY_NEGLIGIBLE",
      "severityScore": 0.19027223
    }, {
      "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
      "probability": "NEGLIGIBLE",
      "probabilityScore": 0.22901751,
      "severity": "HARM_SEVERITY_NEGLIGIBLE",
      "severityScore": 0.09089675
    }]
  }],
  "usageMetadata": {
    "promptTokenCount": 38,
    "totalTokenCount": 38
  }
}

콘텐츠 필터 구성 구현

다음 예시에서는 Vertex AI의 Gemini API를 사용하여 콘텐츠 필터를 구성하는 방법을 보여줍니다.

Python

설치

pip install --upgrade google-genai

자세한 내용은 SDK 참고 문서를 참조하세요.

Vertex AI에서 생성형 AI SDK를 사용하도록 환경 변수를 설정합니다.

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    HarmCategory,
    HarmBlockThreshold,
    HttpOptions,
    SafetySetting,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

system_instruction = "Be as mean as possible."

prompt = """
    Write a list of 5 disrespectful things that I might say to the universe after stubbing my toe in the dark.
"""

safety_settings = [
    SafetySetting(
        category=HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
        threshold=HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
    ),
    SafetySetting(
        category=HarmCategory.HARM_CATEGORY_HARASSMENT,
        threshold=HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
    ),
    SafetySetting(
        category=HarmCategory.HARM_CATEGORY_HATE_SPEECH,
        threshold=HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
    ),
    SafetySetting(
        category=HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT,
        threshold=HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
    ),
]

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=prompt,
    config=GenerateContentConfig(
        system_instruction=system_instruction,
        safety_settings=safety_settings,
    ),
)

# Response will be `None` if it is blocked.
print(response.text)
# Example response:
#     None

# Finish Reason will be `SAFETY` if it is blocked.
print(response.candidates[0].finish_reason)
# Example response:
#     FinishReason.SAFETY

# For details on all the fields in the response
for each in response.candidates[0].safety_ratings:
    print('\nCategory: ', str(each.category))
    print('Is Blocked:', True if each.blocked else False)
    print('Probability: ', each.probability)
    print('Probability Score: ', each.probability_score)
    print('Severity:', each.severity)
    print('Severity Score:', each.severity_score)
# Example response:
#
#     Category:  HarmCategory.HARM_CATEGORY_HATE_SPEECH
#     Is Blocked: False
#     Probability:  HarmProbability.NEGLIGIBLE
#     Probability Score:  2.547714e-05
#     Severity: HarmSeverity.HARM_SEVERITY_NEGLIGIBLE
#     Severity Score: None
#
#     Category:  HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT
#     Is Blocked: False
#     Probability:  HarmProbability.NEGLIGIBLE
#     Probability Score:  3.6103818e-06
#     Severity: HarmSeverity.HARM_SEVERITY_NEGLIGIBLE
#     Severity Score: None
#
#     Category:  HarmCategory.HARM_CATEGORY_HARASSMENT
#     Is Blocked: True
#     Probability:  HarmProbability.MEDIUM
#     Probability Score:  0.71599233
#     Severity: HarmSeverity.HARM_SEVERITY_MEDIUM
#     Severity Score: 0.30782545
#
#     Category:  HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT
#     Is Blocked: False
#     Probability:  HarmProbability.NEGLIGIBLE
#     Probability Score:  1.5624657e-05
#     Severity: HarmSeverity.HARM_SEVERITY_NEGLIGIBLE
#     Severity Score: None

Go

Go를 설치하거나 업데이트하는 방법을 알아보세요.

자세한 내용은 SDK 참고 문서를 참조하세요.

Vertex AI에서 생성형 AI SDK를 사용하도록 환경 변수를 설정합니다.

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

import (
	"context"
	"fmt"
	"io"

	"google.golang.org/genai"
)

// generateTextWithSafety shows how to apply safety settings to a text generation request.
func generateTextWithSafety(w io.Writer) error {
	ctx := context.Background()

	client, err := genai.NewClient(ctx, &genai.ClientConfig{
		HTTPOptions: genai.HTTPOptions{APIVersion: "v1"},
	})
	if err != nil {
		return fmt.Errorf("failed to create genai client: %w", err)
	}

	systemInstruction := &genai.Content{
		Parts: []*genai.Part{
			{Text: "Be as mean as possible."},
		},
		Role: "user",
	}

	prompt := "Write a list of 5 disrespectful things that I might say to the universe after stubbing my toe in the dark."

	safetySettings := []*genai.SafetySetting{
		{Category: genai.HarmCategoryDangerousContent, Threshold: genai.HarmBlockThresholdBlockLowAndAbove},
		{Category: genai.HarmCategoryHarassment, Threshold: genai.HarmBlockThresholdBlockLowAndAbove},
		{Category: genai.HarmCategoryHateSpeech, Threshold: genai.HarmBlockThresholdBlockLowAndAbove},
		{Category: genai.HarmCategorySexuallyExplicit, Threshold: genai.HarmBlockThresholdBlockLowAndAbove},
	}

	config := &genai.GenerateContentConfig{
		SystemInstruction: systemInstruction,
		SafetySettings:    safetySettings,
	}
	modelName := "gemini-2.5-flash"
	resp, err := client.Models.GenerateContent(ctx, modelName,
		[]*genai.Content{{Parts: []*genai.Part{{Text: prompt}}, Role: "user"}},
		config,
	)
	if err != nil {
		return fmt.Errorf("failed to generate content: %w", err)
	}

	fmt.Fprintln(w, resp.Text())

	if len(resp.Candidates) > 0 {
		fmt.Fprintln(w, "Finish Reason:", resp.Candidates[0].FinishReason)

		for _, rating := range resp.Candidates[0].SafetyRatings {
			fmt.Fprintf(w, "\nCategory: %v\nIs Blocked: %v\nProbability: %v\nProbability Score: %v\nSeverity: %v\nSeverity Score: %v\n",
				rating.Category,
				rating.Blocked,
				rating.Probability,
				rating.ProbabilityScore,
				rating.Severity,
				rating.SeverityScore,
			)
		}
	}

	// Example response:
	// Category: HARM_CATEGORY_HATE_SPEECH
	// Is Blocked: false
	// Probability: NEGLIGIBLE
	// Probability Score: 8.996795e-06
	// Severity: HARM_SEVERITY_NEGLIGIBLE
	// Severity Score: 0.04771039
	//
	// Category: HARM_CATEGORY_DANGEROUS_CONTENT
	// Is Blocked: false
	// Probability: NEGLIGIBLE
	// Probability Score: 2.2431707e-06
	// Severity: HARM_SEVERITY_NEGLIGIBLE
	// Severity Score: 0
	//
	// Category: HARM_CATEGORY_HARASSMENT
	// Is Blocked: false
	// Probability: NEGLIGIBLE
	// Probability Score: 0.00026123362
	// Severity: HARM_SEVERITY_NEGLIGIBLE
	// Severity Score: 0.022358216
	//
	// Category: HARM_CATEGORY_SEXUALLY_EXPLICIT
	// Is Blocked: false
	// Probability: NEGLIGIBLE
	// Probability Score: 6.1352006e-07
	// Severity: HARM_SEVERITY_NEGLIGIBLE
	// Severity Score: 0.020111412

	return nil
}

REST

환경을 설정하면 REST를 사용하여 텍스트 프롬프트를 테스트할 수 있습니다. 다음 샘플은 요청을 게시자 모델 엔드포인트에 전송합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

LOCATION: 요청을 처리하는 리전입니다. 사용 가능한 옵션은 다음과 같습니다.
클릭하여 사용 가능한 리전의 일부 목록 펼치기
- us-central1
- us-west4
- northamerica-northeast1
- us-east4
- us-west1
- asia-northeast3
- asia-southeast1
- asia-northeast1
PROJECT_ID: 프로젝트 ID입니다.
MODEL_ID: 사용할 멀티모달 모델의 모델 ID(예: gemini-2.5-flash)
ROLE: 콘텐츠와 연결된 대화의 역할입니다. 싱글턴 사용 사례에서도 역할을 지정해야 합니다. 허용되는 값은 다음과 같습니다.
- USER: 전송한 콘텐츠를 지정합니다.
- MODEL: 모델의 응답을 지정합니다.
TEXT: 프롬프트에 포함할 텍스트 안내입니다.
SAFETY_CATEGORY: 기준점을 구성할 안전 카테고리입니다. 허용되는 값은 다음과 같습니다.
클릭하여 안전 카테고리 펼치기
- HARM_CATEGORY_SEXUALLY_EXPLICIT
- HARM_CATEGORY_HATE_SPEECH
- HARM_CATEGORY_HARASSMENT
- HARM_CATEGORY_DANGEROUS_CONTENT
THRESHOLD: 확률에 따라 지정된 안전 카테고리에 속할 수 있는 응답 차단의 기준점입니다. 허용되는 값은 다음과 같습니다.
클릭하여 차단 기준점 펼치기
- BLOCK_NONE
- BLOCK_ONLY_HIGH
- BLOCK_MEDIUM_AND_ABOVE(기본)
- BLOCK_LOW_AND_ABOVE
BLOCK_LOW_AND_ABOVE는 가장 많이 차단하며 BLOCK_ONLY_HIGH는 가장 적게 차단합니다.

HTTP 메서드 및 URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:streamGenerateContent

JSON 요청 본문:

{
  "contents": {
    "role": "ROLE",
    "parts": { "text": "TEXT" }
  },
  "safetySettings": {
    "category": "SAFETY_CATEGORY",
    "threshold": "THRESHOLD"
  },
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:streamGenerateContent"

PowerShell

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:streamGenerateContent" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

[{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": " The picture shows a table with a white tablecloth. On the table are two cups of coffee, a bowl of blueberries, and five scones with blueberries. There"
          }
        ]
      },
      "safetyRatings": [
        {
          "category": "HARM_CATEGORY_HARASSMENT",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_HATE_SPEECH",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
          "probability": "NEGLIGIBLE"
        }
      ]
    }
  ]
}
,
{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": " are also some pink flowers on the table. The background is a dark blue color. The picture is taken from a top-down perspective."
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        {
          "category": "HARM_CATEGORY_HARASSMENT",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_HATE_SPEECH",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
          "probability": "NEGLIGIBLE"
        },
        {
          "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
          "probability": "NEGLIGIBLE"
        }
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 262,
    "candidatesTokenCount": 59,
    "totalTokenCount": 321
  }
}

curl 명령어 예시

LOCATION="us-central1"
MODEL_ID="gemini-2.5-flash"
PROJECT_ID="test-project"

curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_ID}:streamGenerateContent -d \
$'{
  "contents": {
    "role": "user",
    "parts": { "text": "Hello!" }
  },
  "safety_settings": [
    {
      "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
      "threshold": "OFF"
    },
    {
      "category": "HARM_CATEGORY_HATE_SPEECH",
      "threshold": "BLOCK_LOW_AND_ABOVE"
    },
    {
      "category": "HARM_CATEGORY_HARASSMENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
    {
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_ONLY_HIGH"
    }
  ]
}'

탈옥 분류기

일부 프롬프트는 안전 가이드라인, 윤리적 제약, 의도된 운영 지침을 우회하려고 시도하여 잠재적으로 유해하거나, 편향되거나, 부적절한 출력을 생성합니다. 탈옥 분류기는 모델의 방어를 우회하려는 프롬프트를 감지하고 구성에 따라 차단합니다. 이 필터는 기본적으로 사용 중지되어 있습니다. 사용 설정하려면 JAILBREAK의 차단 기준점을 다음 값 중 하나로 설정합니다.

BLOCK_NONE
BLOCK_LOW_AND_ABOVE
BLOCK_MEDIUM_AND_ABOVE
BLOCK_ONLY_HIGH

다음 코드는 이 브레이크아웃 필터를 사용 설정하는 방법을 보여줍니다.

generative_models.SafetySetting(
    category=generative_models.HarmCategory.JAILBREAK,
    threshold=generative_models.HarmBlockThreshold.BLOCK_ONLY_HIGH,
)

콘텐츠가 탈옥 분류기에 의해 차단되면 다음과 같은 결과가 표시됩니다.

{
  prompt_feedback: { # [15B]
    block_reason: JAILBREAK
    safety_ratings: [ # [118]
      { # 0 [118]
        category: HARM_CATEGORY_JAILBREAK
        blocked: true
        severity: HARM_SEVERITY_MEDIUM
        severity_score: 0.76953125
      }
    ]
  }
}

HarmBlockMethod를 PROBABILITY으로 설정하면 safety_ratings에 severity 및 severity_score 대신 probability 및 probability_score이 포함됩니다. 프롬프트가 차단되거나 플래그가 지정되지 않은 경우에도 모델은 HarmBlockMethod에 따라 안전 등급을 반환합니다.

결제

다른 Gemini 안전 필터와 마찬가지로 브레이크스루 분류기를 사용하는 것은 무료입니다.

인용 필터

Vertex AI의 생성형 코드 기능은 독창적인 콘텐츠를 만들기 위한 것입니다. Gemini는 기존 콘텐츠가 길게 복제될 가능성을 제한하도록 설계되었습니다. Gemini 기능이 웹페이지에서 상당 부분을 인용하는 경우 Gemini는 해당 페이지를 인용으로 표시합니다.

여러 웹페이지에서 동일한 콘텐츠가 발견되는 경우가 있습니다. 이러한 경우 Gemini에서는 인기 있는 소스를 가리키려고 합니다. 코드 저장소에 대한 인용의 경우 관련 오픈소스 라이선스를 언급할 수도 있습니다. 라이선스 요구사항 준수는 사용자 책임입니다.

인용 필터의 메타데이터에 대해 알아보려면 인용 API 참조를 참고하세요.

권장사항

콘텐츠 필터는 안전하지 않은 콘텐츠를 방지하는 데 도움이 되지만, 때로는 무해한 콘텐츠를 차단하거나 유해한 콘텐츠를 놓칠 수 있습니다. Gemini 2.5 Flash와 같은 고급 모델은 필터 없이도 안전한 대답을 생성하도록 설계되었습니다. 다양한 필터 설정을 테스트하여 안전성과 적절한 콘텐츠 허용 간의 알맞은 균형을 찾아보세요.

다음 단계

안전을 위한 시스템 요청 사항 알아보기
악용 모니터링 알아보기
책임감 있는 AI에 대해 자세히 알아보기
차단된 대답을 처리하는 방법 알아보기