Nesta página, descrevemos como registrar um endpoint de modelo de IA e gerar incorporações de vetores com o gerenciamento de endpoints de modelo. Para usar modelos de IA em ambientes de produção, consulte Criar aplicativos de IA generativa usando o Cloud SQL e Trabalhar com embeddings de vetor.
Depois que os endpoints de modelo são adicionados e registrados no gerenciamento de endpoints de modelo, é possível referenciá-los usando o ID do modelo para gerar incorporações.
Antes de começar
Faça o seguinte:
- Registre o endpoint do modelo com o gerenciamento de endpoints de modelo. Para mais informações, consulte Registrar e chamar modelos de IA remotos usando o gerenciamento de endpoints de modelo.
- Crie ou atualize sua instância do Cloud SQL para que ela possa se integrar à Vertex AI. Para mais informações, consulte Ativar a integração de bancos de dados com a Vertex AI.
Gerar embeddings
Use a função SQL google_ml.embedding()
para chamar o endpoint do modelo registrado com o tipo de modelo de embedding de texto e gerar embeddings.
Para chamar o modelo e gerar embeddings, use a seguinte consulta SQL:
SELECT
google_ml.embedding(
model_id => 'MODEL_ID',
content => 'CONTENT');
Substitua:
MODEL_ID
: o ID do modelo definido ao registrar o endpoint do modeloCONTENT
: o texto a ser traduzido em um embedding vetorial.
Exemplos
Alguns exemplos de geração de embeddings usando endpoints de modelos registrados estão listados nesta seção.
Modelos de embedding de texto com suporte integrado
Para gerar embeddings para um endpoint de modelo textembedding-gecko@002
registrado, execute a seguinte instrução:
SELECT
google_ml.embedding(
model_id => 'textembedding-gecko@002',
content => 'Cloud SQL is a managed, cloud-hosted SQL database service');