다음 표에서는 Vertex AI 온라인 예측을 제공하는 데 지원되는 엔드포인트 유형을 비교하고 권장사항으로 권장되는 유형을 나타냅니다.
전용 공개 엔드포인트 (권장) | 공개 엔드포인트 | Private Service Connect 엔드포인트 (권장) | 비공개 엔드포인트 | |
---|---|---|---|---|
목적 | 기본 네트워킹 환경 공개 인터넷에서 요청을 제출할 수 있도록 합니다 (VPC 서비스 제어가 사용 설정되지 않은 경우). | 기본 네트워킹 환경 공개 인터넷에서 요청을 제출할 수 있도록 합니다 (VPC 서비스 제어가 사용 설정되지 않은 경우). | 프로덕션 엔터프라이즈 애플리케이션에 권장됩니다. 요청과 응답이 비공개로 라우팅되도록 하여 네트워크 지연 시간과 보안을 개선합니다. | 프로덕션 엔터프라이즈 애플리케이션에 권장됩니다. 요청과 응답이 비공개로 라우팅되도록 하여 네트워크 지연 시간과 보안을 개선합니다. |
인바운드 네트워킹 | 전용 네트워킹 영역을 사용하는 공개 인터넷 | 공유 네트워킹 영역을 사용하는 공개 인터넷 | Private Service Connect 엔드포인트를 사용한 비공개 네트워킹 | 비공개 서비스 액세스를 사용한 비공개 네트워킹 (VPC 네트워크 피어링) |
발신 네트워킹 | 공개 인터넷 | 공개 인터넷 | 지원되지 않음 | 비공개 서비스 액세스를 사용한 비공개 네트워킹 (VPC 네트워크 피어링) |
VPC 서비스 제어 | 지원되지 않음. 대신 Private Service Connect 엔드포인트를 사용하세요. | 지원됨 | 지원됨 | 지원됨 |
비용 | Vertex AI Prediction | Vertex AI Prediction | Vertex AI Prediction + 비공개 Service Connect 엔드포인트 | Vertex AI 예측 + 비공개 서비스 액세스('Private Service Connect 엔드포인트 (전달 규칙)를 사용하여 게시된 서비스에 액세스' 참고) |
네트워크 지연 시간 | 최적화 | 최적화되지 않음 | 최적화 | P50 지연 시간은 짧고 P99 (꼬리) 지연 시간은 길다. |
전송 중인 데이터 암호화 | CA 서명 인증서가 있는 TLS | CA 서명 인증서가 있는 TLS | 자체 서명 인증서를 사용한 선택적 TLS | 없음 |
추론 제한 시간 | 최대 1시간까지 구성 가능 | 60초 | 최대 1시간까지 구성 가능 | 60초 |
페이로드 크기 한도 | 10MB | 1.5 MB | 10MB | 10MB |
QPM 할당량 | 무제한 | 30,000 | 무제한 | 무제한 |
프로토콜 지원 | HTTP 또는 gRPC | HTTP | HTTP 또는 gRPC | HTTP |
스트리밍 지원 | 예 (SSE) | 아니요 | 예 (SSE) | 아니요 |
트래픽 분할 | 예 | 예 | 예 | 아니요 |
요청 및 응답 로깅 | 예 | 예 | 예 | 아니요 |
액세스 로깅 | 예 | 예 | 예 | 아니요 |
AutoML 모델 및 설명 가능성 | 아니요 | 예 | 아니요 | 아니요 |