Diese Seite wurde von der Cloud Translation API übersetzt.

ML-Vorhersagen mit dem Spanner-Emulator generieren

Auf dieser Seite wird beschrieben, wie Sie mit dem Spanner-Emulator ML-Vorhersagen für Datenbanken mit GoogleSQL- und PostgreSQL-Dialekt generieren.

Die Spanner Vertex AI-Integration kann mit dem Spanner-Emulator verwendet werden, um Vorhersagen mithilfe der GoogleSQL- oder PostgreSQL-ML-Vorhersagefunktionen zu generieren. Der Emulator ist eine Binärdatei, die einen Spanner-Server nachahmt und auch für Unit- und Integrationstests verwendet werden kann. Sie können den Emulator als Open-Source-Projekt oder lokal mit der Google Cloud CLI verwenden. Weitere Informationen zu den ML-Vorhersagefunktionen finden Sie unter Wie funktioniert die Einbindung von Spanner in Vertex AI?.

Sie können jedes Modell mit dem Emulator verwenden, um Vorhersagen zu generieren. Sie können auch ein Modell aus dem Vertex AI Model Garden oder ein Modell verwenden, das auf Ihrem Vertex AI-Endpunkt bereitgestellt wurde. Da der Emulator keine Verbindung zu Vertex AI herstellt, kann er das Modell oder sein Schema für Modelle, die aus dem Vertex AI Model Garden verwendet oder auf den Vertex AI-Endpunkten bereitgestellt werden, nicht überprüfen.

Wenn Sie eine Vorhersagefunktion mit dem Emulator verwenden, gibt die Funktion standardmäßig einen Zufallswert basierend auf den bereitgestellten Modellinputs und dem Modellausgabeschema zurück. Mit einer Callback-Funktion können Sie die Eingabe und Ausgabe des Modells ändern und Vorhersageergebnisse basierend auf bestimmten Verhaltensweisen generieren.

Hinweis

Führen Sie die folgenden Schritte aus, bevor Sie mit dem Spanner-Emulator ML-Vorhersagen generieren.

Spanner-Emulator installieren

Sie können den Emulator entweder lokal installieren oder über das GitHub-Repository einrichten.

Modell auswählen

Wenn Sie die Funktion ML.PREDICT (für GoogleSQL) oder ML_PREDICT_ROW (für PostgreSQL) verwenden, müssen Sie den Speicherort des ML-Modells angeben. Sie können jedes trainierte Modell verwenden. Wenn Sie ein Modell auswählen, das im Vertex AI Model Garden ausgeführt wird, oder ein Modell, das in Ihrem Vertex AI-Endpunkt bereitgestellt wird, müssen Sie die Werte input und output für diese Modelle angeben.

Weitere Informationen zur Einbindung von Spanner Vertex AI finden Sie unter Wie funktioniert die Einbindung von Spanner Vertex AI?

Vorhersagen generieren

Mit dem Emulator können Sie Vorhersagen mithilfe der Spanner-ML-Vorhersagefunktionen generieren.

Standardverhalten

Sie können jedes Modell verwenden, das mit dem Spanner-Emulator an einem Endpunkt bereitgestellt wird, um Vorhersagen zu generieren. Im folgenden Beispiel wird ein Modell namens FraudDetection verwendet, um ein Ergebnis zu generieren.

GoogleSQL

Weitere Informationen zur Verwendung der Funktion ML.PREDICT zum Generieren von Vorhersagen finden Sie unter ML-Vorhersagen mit SQL generieren.

Modell registrieren

Bevor Sie ein Modell mit der Funktion ML.PREDICT verwenden können, müssen Sie es mit der Anweisung CREATE MODEL registrieren und die Werte input und output angeben:

CREATE MODEL FraudDetection
INPUT (Amount INT64, Name STRING(MAX))
OUTPUT (Outcome BOOL)
REMOTE OPTIONS (
endpoint = '//aiplatform.googleapis.com/projects/PROJECT_ID/locations/REGION_ID/endpoints/ENDPOINT_ID'
);

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Google Cloud-Projekts, in dem sich das Modell befindet
REGION_ID: Die ID der Region, Google Cloud in der sich das Modell befindet, z. B. us-central1
ENDPOINT_ID: die ID des Modellendpunkts

Vorhersage ausführen

Verwenden Sie die GoogleSQL-Funktion ML.PREDICT, um eine Vorhersage zu generieren.

SELECT Outcome
FROM ML.PREDICT(
    MODEL FraudDetection,
    (SELECT 1000 AS Amount, "John Smith" AS Name))

Die erwartete Ausgabe dieser Abfrage ist TRUE.

PostgreSQL

Weitere Informationen zur Verwendung der Funktion spanner.ML_PREDICT_ROW zum Generieren von Vorhersagen finden Sie unter ML-Vorhersagen mit SQL generieren.

Vorhersage ausführen

Verwenden Sie die PostgreSQL-Funktion spanner.ML_PREDICT_ROW, um eine Vorhersage zu generieren.

SELECT (spanner.ml_predict_row(
'projects/`MODEL_ID`/locations/`REGION_ID`/endpoints/`ENDPOINT_ID`',
'{"instances": [{"Amount": "1000", "Name": "John Smith"}]}'
)->'predictions'->0->'Outcome')::boolean

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Google Cloud-Projekts, in dem sich das Modell befindet
REGION_ID: Die ID der Region, Google Cloud in der sich das Modell befindet, z. B. us-central1
ENDPOINT_ID: die ID des Modellendpunkts

Die erwartete Ausgabe dieser Abfrage ist TRUE.

Benutzerdefinierter Rückruf

Mit einer benutzerdefinierten Callback-Funktion können Sie ausgewählte Modellverhalten implementieren und bestimmte Modellinputs in Outputs umwandeln. Im folgenden Beispiel wird das gemini-pro-Modell aus dem Vertex AI Model Garden und der Spanner-Emulator verwendet, um Vorhersagen mithilfe eines benutzerdefinierten Rückrufs zu generieren.

Wenn Sie einen benutzerdefinierten Rückruf für ein Modell verwenden, müssen Sie das Spanner-Emulator-Repository forken und dann erstellen und bereitstellen. Weitere Informationen zum Erstellen und Bereitstellen des Spanner-Emulators finden Sie in der Kurzanleitung für den Spanner-Emulator.

GoogleSQL

Modell registrieren

Bevor Sie ein Modell mit der Funktion ML.PREDICT verwenden können, müssen Sie es mit der Anweisung CREATE MODEL registrieren:

CREATE MODEL GeminiPro
INPUT (prompt STRING(MAX))
OUTPUT (content STRING(MAX))
REMOTE OPTIONS (
endpoint = '//aiplatform.googleapis.com/projects/PROJECT_ID/locations/REGION_ID/publishers/google/models/gemini-pro',
default_batch_size = 1
);

Da der Emulator keine Verbindung zu Vertex AI herstellt, müssen Sie die Werte input und output angeben.

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Google Cloud-Projekts, in dem sich das Modell befindet
REGION_ID: Die ID der Region, Google Cloud in der sich das Modell befindet, z. B. us-central1

Callback

Verwenden Sie einen Callback, um dem GeminiPro-Modell benutzerdefinierte Logik hinzuzufügen.

absl::Status ModelEvaluator::Predict(
    const googlesql::Model* model,
    const CaseInsensitiveStringMap<const ModelColumn>& model_inputs,
    CaseInsensitiveStringMap<ModelColumn>& model_outputs) {
  // Custom logic for GeminiPro.
  if (model->Name() == "GeminiPro") {
    RET_CHECK(model_inputs.contains("prompt"));
    RET_CHECK(model_inputs.find("prompt")->second.value->type()->IsString());
    RET_CHECK(model_outputs.contains("content"));
    std::string content;

    // Process prompts used in tests.
    int64_t number;
    static LazyRE2 is_prime_prompt = {R"(Is (\d+) a prime number\?)"};
    if (RE2::FullMatch(
            model_inputs.find("prompt")->second.value->string_value(),
            *is_prime_prompt, &number)) {
        content = IsPrime(number) ? "Yes" : "No";
    } else {
        // Default response.
        content = "Sorry, I don't understand";
    }
    *model_outputs["content"].value = googlesql::values::String(content);
    return absl::OkStatus();
  }
  // Custom model prediction logic can be added here.
  return DefaultPredict(model, model_inputs, model_outputs);
}

Vorhersage ausführen

Verwenden Sie die GoogleSQL-Funktion ML.PREDICT, um eine Vorhersage zu generieren.

SELECT content
    FROM ML.PREDICT(MODEL GeminiPro, (SELECT "Is 7 a prime number?" AS prompt))

Die erwartete Ausgabe dieser Abfrage ist "YES".

PostgreSQL

Verwenden Sie die PostgreSQL-Funktion spanner.ML_PREDICT_ROW, um eine Vorhersage zu generieren.

Callback

Verwenden Sie einen Callback, um dem GeminiPro-Modell benutzerdefinierte Logik hinzuzufügen.

absl::Status ModelEvaluator::PgPredict(
    absl::string_view endpoint, const googlesql::JSONValueConstRef& instance,
    const googlesql::JSONValueConstRef& parameters,
    lesql::JSONValueRef prediction) {
  if (endpoint.ends_with("publishers/google/models/gemini-pro")) {
    RET_CHECK(instance.IsObject());
    RET_CHECK(instance.HasMember("prompt"));
    std::string content;

    // Process prompts used in tests.
    int64_t number;
    static LazyRE2 is_prime_prompt = {R"(Is (\d+) a prime number\?)"};
    if (RE2::FullMatch(instance.GetMember("prompt").GetString(),
                        *is_prime_prompt, &number)) {
        content = IsPrime(number) ? "Yes" : "No";
    } else {
        // Default response.
        content = "Sorry, I don't understand";
    }
    prediction.SetToEmptyObject();
    prediction.GetMember("content").SetString(content);
    return absl::OkStatus();
  }

  // Custom model prediction logic can be added here.
  return DefaultPgPredict(endpoint, instance, parameters, prediction);
}

Vorhersage ausführen

SELECT (spanner.ml_predict_row(
'projects/`PROJECT_ID`/locations/`REGION_ID`/publishers/google/models/gemini-pro',
'{"instances": [{"prompt": "Is 7 a prime number?"}]}'
)->'predictions'->0->'content')::text

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Google Cloud-Projekts, in dem sich das Modell befindet
REGION_ID: Die ID der Region, Google Cloud in der sich das Modell befindet, z. B. us-central1

Die erwartete Ausgabe dieser Abfrage ist "YES".

ML-Vorhersagen mit dem Spanner-Emulator generieren

Hinweis

Spanner-Emulator installieren

Modell auswählen

Vorhersagen generieren

Standardverhalten

GoogleSQL

PostgreSQL

Benutzerdefinierter Rückruf

GoogleSQL

PostgreSQL

Nächste Schritte