O Feature Store da Vertex AI oferece os seguintes tipos de disponibilização on-line que podem ser usados para disponibilizar atributos para previsões on-line:
Veiculação on-line otimizada, em que é possível escolher uma das seguintes configurações:
veiculação on-line do Bigtable
A disponibilização on-line do Bigtable é adequada para grandes volumes de dados (na ordem de terabytes de dados) com alta durabilidade de dados. É comparável à veiculação on-line no Feature Store da Vertex AI (legado), mas não está otimizado para se ajustar rapidamente a bursts de tráfego repentinos.
Geralmente, a veiculação on-line do Bigtable tem maior latência do que a veiculação on-line otimizada, mas é mais econômica.
A exibição on-line do Bigtable não oferece suporte ao gerenciamento de embeddings. Se para gerenciar e exibir embeddings, use a Veiculação on-line otimizada.
Para usar a veiculação on-line do Bigtable, siga estas etapas:
Veiculação on-line otimizada
A veiculação on-line otimizada permite disponibilizar recursos em latências significativamente menores do que a veiculação on-line do Bigtable. Ele fornece uma arquitetura de veiculação on-line que é mais rápida, escalonável e responsiva a um aumento nos volumes de dados. A veiculação on-line otimizada é adequada para cenários em que é fundamental disponibilizar recursos em latências ultrabaixas.
Com a exibição on-line otimizada, é possível exibir valores de recursos de um endpoint público ou do Private Service Connect.
Todas as instâncias de lojas on-line criadas para compatibilidade com veiculação on-line otimizada de embeddings.
Veiculação on-line otimizada com endpoint público
Por padrão, uma loja on-line criada para exibição on-line otimizada permite exibir recursos com um endpoint público. Para usar a exibição on-line otimizada com um endpoint público, execute as seguintes etapas:
Crie uma loja on-line para veiculação on-line otimizada com um endpoint público.
Buscar valores de atributos usando a exibição on-line otimizada em um endpoint público.
Veiculação on-line otimizada com o endpoint do Private Service Connect
Um endpoint do Private Service Connect é um endpoint de exibição dedicado. Use um endpoint do Private Service Connect se quiser exibir recursos em uma rede VPC com latências menores do que um endpoint público. Para usar a exibição on-line otimizada com um endpoint do Private Service Connect, siga estas etapas:
A seguir
Saiba como criar uma instância de loja on-line.
Saiba como criar uma visualização de recursos.
Saiba como veicular valores de recursos.