Invocar previsões com o gerenciamento de endpoints de modelo

Esta página descreve o gerenciamento de endpoints de modelos. O gerenciamento de endpoint do modelo permite testar o registro de um endpoint de modelo de IA e invocar previsões. Para usar modelos de IA em ambientes de produção, consulte Criar aplicativos de IA generativa usando o Cloud SQL e Invocar previsões on-line de instâncias do Cloud SQL.

Depois que os endpoints do modelo forem adicionados e registrados no gerenciamento de endpoints do modelo, será possível fazê-los referência usando o ID do modelo para invocar previsões.

Antes de começar

Faça o seguinte:

Invocar previsões para modelos genéricos

Use a função SQL google_ml.predict_row() para chamar um endpoint de modelo genérico registrado para invocar previsões. É possível usar a função google_ml.predict_row() com qualquer tipo de modelo.

SELECT
  google_ml.predict_row(
    model_id => 'MODEL_ID',
    request_body => 'REQUEST_BODY');

Substitua:

  • MODEL_ID: o ID do modelo que você definiu ao registrar o endpoint do modelo
  • REQUEST_BODY: os parâmetros para a função de previsão, no formato JSON

Exemplos

Para gerar previsões para um endpoint de modelo gemini-pro registrado, execute a seguinte instrução:

    SELECT
        json_array_elements(
        google_ml.predict_row(
            model_id => 'gemini-pro',
            request_body => '{
        "contents": [
            {
                "role": "user",
                "parts": [
                    {
                        "text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
                    }
                ]
            }
        ]
        }'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';