Esta página descreve como registrar um endpoint de modelo de IA e gerar embeddings de vetor com o gerenciamento de endpoint de modelo. Para usar modelos de IA em ambientes de produção, consulte Criar aplicativos de IA generativa usando o Cloud SQL e Trabalhar com embeddings de vetor.
Depois que os endpoints de modelo forem adicionados e registrados no gerenciamento de endpoints de modelo, você poderá fazê-los referência usando o ID do modelo para gerar incorporações.
Antes de começar
Faça o seguinte:
- Registre o endpoint do modelo com o gerenciamento de endpoint do modelo. Para mais informações, consulte Registrar e chamar modelos de IA remotos usando o gerenciamento de endpoints de modelo.
- Crie ou atualize sua instância do Cloud SQL para que ela possa se integrar à Vertex AI. Para mais informações, consulte Ativar a integração do banco de dados com a Vertex AI.
Gerar embeddings
Use a função SQL google_ml.embedding()
para chamar o endpoint de modelo registrado com o tipo de modelo de incorporação de texto para gerar embeddings.
Para chamar o modelo e gerar embeddings, use a seguinte consulta SQL:
SELECT
google_ml.embedding(
model_id => 'MODEL_ID',
content => 'CONTENT');
Substitua:
MODEL_ID
: o ID do modelo que você definiu ao registrar o endpoint do modeloCONTENT
: o texto a ser traduzido em um embedding vetorial
Exemplos
Alguns exemplos de como gerar embeddings usando endpoints de modelos registrados estão listados nesta seção.
Modelos de embedding de texto com suporte integrado
Para gerar embeddings para um endpoint de modelo textembedding-gecko@002
registrado, execute a seguinte instrução:
SELECT
google_ml.embedding(
model_id => 'textembedding-gecko@002',
content => 'Cloud SQL is a managed, cloud-hosted SQL database service');