Usar o gerenciamento de endpoints de modelos no AlloyDB Studio

Este documento mostra como usar o AlloyDB Studio para registrar e chamar endpoints de modelos. Em seguida, use os endpoints de modelo registrados para invocar previsões ou gerar embeddings.

Para mais informações sobre o gerenciamento de endpoints de modelos, consulte Visão geral do gerenciamento de endpoints de modelos.

Chamar endpoints de modelos de embedding pré-registrados

Os modelos de embedding pré-registrados compatíveis estão listados no painel "Explorer" do AlloyDB Studio.

  1. No console do Google Cloud, abra a página AlloyDB.

    Acessar o AlloyDB

  2. Selecione um cluster na lista.

  3. No menu de navegação, clique em AlloyDB Studio.

  4. No painel Explorer, expanda google_ml e clique em Models.

  5. Clique em more_vert Ver ações ao lado do modelo pré-registrado, por exemplo, textembedding-gecko, e clique em Chamar modelo.

    A consulta SQL para gerar embeddings usando o modelo pré-registrado aparece.

  6. Digite o texto para o qual você quer gerar o embedding e clique em Executar.

Para mais informações sobre outras consultas SQL que usam modelos de embedding pré-registrados, consulte Gerar embeddings.

Registrar um endpoint de modelo

Você pode usar o modelo gerado pelo AlloyDB Studio para registrar um endpoint de modelo. Depois de registrar o endpoint do modelo, você pode começar a invocar previsões ou gerar embeddings.

  1. No console do Google Cloud, abra a página AlloyDB.

    Acessar o AlloyDB

  2. Selecione um cluster na lista.

  3. No menu de navegação, clique em AlloyDB Studio.

  4. No painel Explorer, expanda google_ml.

  5. Clique em more_vert Ver ações ao lado de Modelos e em Registrar modelo.

  6. Modifique os parâmetros necessários com base no provedor de endpoint do modelo. Para mais informações sobre como registrar um endpoint de modelo, consulte Registrar e chamar modelos de IA remotos.

  7. Clique em Run para registrar o endpoint do modelo.

Para mais informações sobre outras consultas SQL que usam endpoints de modelo registrados, consulte Invocar previsões ou Gerar embeddings.

Alterar um endpoint de modelo pré-registrado

Para endpoints de modelos pré-registrados, você pode alterar os metadados do modelo, se necessário.

  1. No console do Google Cloud, abra a página AlloyDB.

    Acessar o AlloyDB

  2. Selecione um cluster na lista.

  3. No menu de navegação, clique em AlloyDB Studio.

  4. No painel Explorer, expanda google_ml e clique em Models.

  5. Clique em more_vert Ver ações ao lado do modelo pré-registrado (por exemplo, textembedding-gecko) e em Alterar modelo.

  6. Clique em Executar para salvar os metadados do endpoint do modelo.

É possível executar a função google_ml.alter_model() na guia Editor do AlloyDB Studio para modificar os metadados de outros endpoints de modelo registrados. Para mais informações, consulte a Referência do gerenciamento de endpoints de modelos.

Excluir um endpoint de modelo pré-registrado

  1. No console do Google Cloud, abra a página AlloyDB.

    Acessar o AlloyDB

  2. Selecione um cluster na lista.

  3. No menu de navegação, clique em AlloyDB Studio.

  4. No painel Explorer, expanda google_ml e clique em Models.

  5. Clique em more_vert Ver ações ao lado do modelo pré-registrado (por exemplo, textembedding-gecko) e em Excluir modelo.

  6. Clique em Executar para excluir o endpoint do modelo.

É possível executar a função google_ml.drop_model() na guia Editor do AlloyDB Studio para excluir outros endpoints de modelo registrados. Para mais informações, consulte a Referência do gerenciamento de endpoints de modelos.

A seguir