엔드포인트 유형 선택

다음 표에서는 Vertex AI 온라인 예측을 제공하는 데 지원되는 엔드포인트 유형을 비교하고 권장사항으로 권장되는 유형을 나타냅니다.

전용 공개 엔드포인트 (권장) 공개 엔드포인트 Private Service Connect 엔드포인트 (권장) 비공개 엔드포인트
목적 기본 네트워킹 환경 공개 인터넷에서 요청을 제출할 수 있도록 합니다 (VPC 서비스 제어가 사용 설정되지 않은 경우). 기본 네트워킹 환경 공개 인터넷에서 요청을 제출할 수 있도록 합니다 (VPC 서비스 제어가 사용 설정되지 않은 경우). 프로덕션 엔터프라이즈 애플리케이션에 권장됩니다. 요청과 응답이 비공개로 라우팅되도록 하여 네트워크 지연 시간과 보안을 개선합니다. 프로덕션 엔터프라이즈 애플리케이션에 권장됩니다. 요청과 응답이 비공개로 라우팅되도록 하여 네트워크 지연 시간과 보안을 개선합니다.
인바운드 네트워킹 전용 네트워킹 영역을 사용하는 공개 인터넷 공유 네트워킹 영역을 사용하는 공개 인터넷 Private Service Connect 엔드포인트를 사용한 비공개 네트워킹 비공개 서비스 액세스를 사용한 비공개 네트워킹 (VPC 네트워크 피어링)
발신 네트워킹 공개 인터넷 공개 인터넷 지원되지 않음 비공개 서비스 액세스를 사용한 비공개 네트워킹 (VPC 네트워크 피어링)
VPC 서비스 제어 지원되지 않음. 대신 Private Service Connect 엔드포인트를 사용하세요. 지원됨 지원됨 지원됨
비용 Vertex AI Prediction Vertex AI Prediction Vertex AI Prediction + 비공개 Service Connect 엔드포인트 Vertex AI 예측 + 비공개 서비스 액세스('Private Service Connect 엔드포인트 (전달 규칙)를 사용하여 게시된 서비스에 액세스' 참고)
네트워크 지연 시간 최적화 최적화되지 않음 최적화 P50 지연 시간은 짧고 P99 (꼬리) 지연 시간은 길다.
전송 중인 데이터 암호화 CA 서명 인증서가 있는 TLS CA 서명 인증서가 있는 TLS 자체 서명 인증서를 사용한 선택적 TLS 없음
추론 제한 시간 최대 1시간까지 구성 가능 60초 최대 1시간까지 구성 가능 60초
페이로드 크기 한도 10MB 1.5 MB 10MB 10MB
QPM 할당량 무제한 30,000 무제한 무제한
프로토콜 지원 HTTP 또는 gRPC HTTP HTTP 또는 gRPC HTTP
스트리밍 지원 예 (SSE) 아니요 예 (SSE) 아니요
트래픽 분할 아니요
요청 및 응답 로깅 아니요
액세스 로깅 아니요
AutoML 모델 및 설명 가능성 아니요 아니요 아니요