Vertex AI Feature Store는 온라인 예측을 위해 특성을 서빙하는 데 사용할 수 있는 다음과 같은 유형의 온라인 서빙을 제공합니다.
최적화된 온라인 서빙: 다음 구성 중 하나를 선택할 수 있습니다.
Bigtable 온라인 서빙
Bigtable 온라인 서빙은 데이터 내구성이 높은 대량의 데이터 볼륨(테라바이트 규모)에 적합합니다. Vertex AI Feature Store(기존)의 온라인 서빙과 비슷하지만 갑작스러운 트래픽 증가에 맞게 빠르게 조정하도록 최적화되지는 않았습니다.
일반적으로 Bigtable 온라인 서빙은 최적화된 온라인 서빙보다 지연 시간이 길지만 비용 효율적입니다.
Bigtable 온라인 서빙에서는 임베딩 관리를 지원하지 않습니다. 임베딩을 관리하고 제공하려면 최적화된 온라인 서빙을 사용합니다.
Bigtable 온라인 서빙을 사용하려면 다음 단계를 수행해야 합니다.
최적화된 온라인 서빙
최적화된 온라인 서빙을 사용하면 Bigtable 온라인 서빙보다 지연 시간이 매우 짧은 특성을 서빙할 수 있습니다. 더 빠르고 확장 가능하며 데이터 볼륨 증가에 대응할 수 있는 온라인 서빙 아키텍처를 제공합니다. 최적화된 온라인 서빙은 매우 짧은 지연 시간으로 특성을 서빙하는 것이 중요한 시나리오에 적합합니다.
최적화된 온라인 서빙을 사용하면 공개 엔드포인트 또는 Private Service Connect 엔드포인트에서 특성 값을 서빙할 수 있습니다.
최적화된 온라인 서빙을 위해 만든 모든 온라인 스토어 인스턴스는 임베딩 관리를 지원합니다.
공개 엔드포인트로 최적화된 온라인 서빙
기본적으로 최적화된 온라인 서빙을 위해 만든 온라인 스토어를 사용하면 공개 엔드포인트로 특성을 서빙할 수 있습니다. 공개 엔드포인트로 최적화된 온라인 서빙을 사용하려면 다음 단계를 수행해야 합니다.
Private Service Connect 엔드포인트로 최적화된 온라인 서빙
Private Service Connect 엔드포인트는 전용 서빙 엔드포인트입니다. 공개 엔드포인트보다 짧은 지연 시간으로 VPC 네트워크 내에서 특성을 서빙하려면 Private Service Connect 엔드포인트를 사용합니다. Private Service Connect 엔드포인트로 최적화된 온라인 서빙을 사용하려면 다음 단계를 수행해야 합니다.
다음 단계
온라인 스토어 인스턴스 만들기 방법 알아보기
특성 뷰 만들기 방법 알아보기
특성 값 서빙 방법 알아보기