Antes de começar

Antes de começar a usar a pesquisa de vetores, escolha um modelo de incorporação, prepare seus dados e decida que tipo de endpoint será usado. Esta página fornece algumas informações sobre como fazer essas coisas.

Preparar seus embeddings

Para usar a pesquisa de vetor, você precisa ter seus embeddings prontos. Caso você já tenha seus embeddings, pule para Escolher um endpoint.

Para criar seus embeddings, faça o seguinte:

  1. Escolha um modelo de embedding: há muitos modelos de embedding externos disponíveis que oferecem recursos diferentes. Dependendo do caso de uso, escolha um dos seguintes tipos de modelo:

    • Pronto para uso: se você quiser fazer a correspondência semanticamente entre o texto e o texto ou entre texto e imagens conforme a relevância do texto ou da imagem. Esse é um caso de uso padrão, então não é preciso treinar ou ajustar o modelo. A IA generativa na Vertex AI é uma opção recomendada para este caso de uso.

    • Modelo personalizado para embeddings: se você quiser fazer correspondência semanticamente com base nos seus próprios dados ou caso de uso específico.

  2. Preparar os dados: limpe e pré-processe os dados para garantir que estejam em um formato que possa ser usado pelo modelo de incorporação.

  3. Treinar o modelo de embedding se você usar um modelo personalizado: se você optar por usar um modelo de embeddings personalizados (ajuste), será necessário treiná-lo nos seus dados. Esse processo pode ser demorado e depende do tamanho e da complexidade dos dados. Se você usar um modelo pré-treinado do Model Garden, poderá ignorar esta etapa.

  4. Gerar embeddings: depois de treinar o modelo, use-o para gerar embeddings para seus dados.

Escolher um endpoint

Depois de criar o índice, você o implantará em um endpoint. Para mais informações, consulte Implantar e gerenciar endpoints de índice público e Implantar e gerenciar endpoints de índice em uma rede VPC. É útil decidir que tipo de endpoint você precisa antes de criar o índice.

É possível implantar o índice de consulta em uma das seguintes opções:

  • Endpoint público: se você implantar em um endpoint público, não será necessário configurar a rede. As redes públicas têm latência um pouco maior, mas são mais rápidas de configurar e mais fáceis de manter.

  • Endpoint privado: se você quiser usar uma VPC, primeiro configure a rede. A pesquisa de vetores tem suporte a dois tipos de rede privada.

A seguir

Depois de gerar os embeddings e decidir onde implantar o índice, a próxima etapa é configurar o índice.