Introdução ao Feature Store da Vertex AI

O Feature Store da Vertex AI oferece um repositório centralizado para organizar, armazenar e exibir atributos de ML. Um featurestore central permite que as organizações compartilhem, descubram e utilizem novamente atributos de ML com eficiência, o que pode aumentar a velocidade de desenvolvimento e implantação de novos aplicativos de ML.

O Vertex AI Feature Store é uma solução totalmente gerenciada que gerencia e escalona a infraestrutura subjacente, como armazenamento e recursos de computação. Essa solução significa que os cientistas de dados podem se concentrar na lógica de computação do recurso em vez de se preocupar com os desafios da implantação de recursos na produção.

O Feature Store da Vertex AI é uma parte integrada da Vertex AI. É possível usar o Feature Store da Vertex AI de forma independente ou como parte dos fluxos de trabalho da Vertex AI. Por exemplo, é possível buscar dados do Feature Store da Vertex AI para treinar modelos personalizados ou do AutoML no Vertex AI.

A Feature Store da Vertex AI (legada) é a antecessora do Feature Store da Vertex AI. Para saber mais sobre o Vertex AI Feature Store, consulte a documentação do Vertex AI Feature Store.

Informações gerais

Use o Vertex AI Feature Store para criar e gerenciar featurestores, tipos de entidade e atributos. Um featurestore é um contêiner de nível superior para seus recursos e os valores deles. Quando você configura um featurestore, os usuários permitidos podem adicionar e compartilhar os recursos sem precisar de suporte de engenharia adicional. Os usuários podem definir atributos e importar (processar) valores de atributos de várias fontes de dados. Saiba mais sobre o modelo de dados e os recursos do Vertex AI Feature Store.

Qualquer usuário permitido pode pesquisar e recuperar valores do featurestore. Por exemplo, os usuários podem descobrir recursos e fazer uma exportação em lote para acessar dados de treinamento para a criação do modelo de ML. Os usuários também podem recuperar valores de recurso em tempo real para executar predições on-line rápidas.

Benefícios

Antes de usar o Vertex AI Feature Store, é possível que você tenha computado valores de atributos e os salvou em vários locais, como tabelas no BigQuery e arquivos no Cloud Storage. Além disso, você pode ter criado e gerenciado soluções separadas para armazenamento e consumo de valores de recursos. Em contrapartida, o Vertex AI Feature Store oferece uma solução unificada para armazenamento em lote e on-line, bem como a disponibilização de recursos de ML. As seções a seguir detalham os benefícios que o Vertex AI Feature Store oferece.

Compartilhar recursos na sua organização

Se você produz recursos em um Featurestore, pode compartilhá-los rapidamente com outras pessoas para treinamento ou disponibilização de tarefas. As equipes não precisam reprojetar recursos para diferentes projetos ou casos de uso. Além disso, como é possível gerenciar e veicular recursos de um repositório central, você mantém a consistência em toda a organização e reduz os esforços duplicados, especialmente para recursos de alto valor.

O Vertex AI Feature Store (legado) oferece recursos de pesquisa e filtragem para que outras pessoas possam descobrir e reutilizar os recursos existentes. Para cada recurso, você pode visualizar metadados relevantes para determinar a qualidade e os padrões de uso do recurso. Por exemplo, você pode ver a fração de entidades que têm um valor válido para um recurso (também conhecido como cobertura do recurso) e a distribuição estatística dos valores do recurso.

Solução gerenciada para exibição on-line em escala

O Vertex AI Feature Store oferece uma solução gerenciada para a disponibilização on-line de recursos (baixa latência), que é fundamental para fazer previsões on-line em tempo hábil. Não é preciso criar e operar uma infraestrutura de disponibilização de dados de baixa latência. o Vertex AI Feature Store (legado) faz isso por você e escalona conforme necessário. Você codifica a lógica para gerar recursos, mas descarrega a tarefa de exibir recursos. Todo esse gerenciamento incluído reduz o atrito na criação de novos recursos, permitindo que os cientistas de dados façam seu trabalho sem se preocuparem com a implantação.

Diminuir o desvio de treinamento/disponibilização

O desvio de treinamento/disponibilização ocorre quando a distribuição de dados de atributos usada na produção é diferente da distribuição de dados de atributos usada para treinar o modelo. Esse desvio geralmente resulta em discrepâncias entre o desempenho de um modelo durante o treinamento e o desempenho na produção. Os exemplos a seguir descrevem como o Vertex AI Feature Store pode abordar possíveis fontes de desvio de treinamento/disponibilização:

  • A Vertex AI Feature Store (legada) garante que um valor de atributo seja importado uma vez em um featurestore e que o mesmo valor seja reutilizado para treinamento e disponibilização. Sem um featurestore, há diferentes caminhos de código para gerar recursos entre o treinamento e a disponibilização. Portanto, os valores de recursos podem ser diferentes entre treinamento e disponibilização.
  • o Vertex AI Feature Store oferece buscas pontuais para buscar dados históricos para treinamento. Com essas pesquisas, é possível reduzir o vazamento de dados, buscando apenas os valores de recurso que estavam disponíveis antes de uma previsão, e não depois.

Saiba mais sobre como detectar o desvio de treinamento/exibição em Ver anomalias no valor do atributo.

Detectar deslocamento

o Vertex AI Feature Store ajuda você a detectar mudanças significativas na distribuição de dados do recurso ao longo do tempo, também conhecido como deslocamento. A Vertex AI Feature Store (legada) monitora constantemente a distribuição de valores de recursos importados no featurestore. Conforme o desvio de recursos aumenta, talvez seja necessário treinar novamente os modelos que usam os recursos afetados. Saiba mais sobre como detectar deslocamentos em Ver anomalias no valor do atributo.

Cotas e limites

o Vertex AI Feature Store aplica cotas e limites para ajudar você a gerenciar recursos definindo seus próprios limites de uso e para proteger a comunidade de usuários do Google Cloud, evitando picos de uso inesperados. Para evitar que você atinja restrições não planejadas, consulte as cotas do Vertex AI Feature Store na página Cotas e limites. Por exemplo, o Vertex AI Feature Store define uma cota sobre o número de nós de exibição on-line e outra para o número de solicitações de exibição on-line que podem ser feitas por minuto.

Retenção de dados

o Vertex AI Feature Store mantém os valores de recurso até o limite de retenção de dados. Esse limite é baseado no carimbo de data/hora associado aos valores do recurso, e não quando os valores foram importados. As programações do Vertex AI Feature Store excluem dados com carimbos de data/hora que excedam o limite.

Preços

O preço do Vertex AI Feature Store é baseado em vários fatores, como a quantidade de dados armazenados e o número de nodes on-line que são usados. As cobranças começam logo depois que você cria uma featurestore. Para mais informações, consulte Preços do Vertex AI Feature Store.

A seguir