このページは Cloud Translation API によって翻訳されました。

AlloyDB の概要でリモート AI モデルを登録して呼び出す

このページでは、AI モデルエンドポイントを登録し、モデルエンドポイント管理で予測を呼び出す前に知っておく必要のある主なコンセプトについて説明します。

AlloyDB Omni にリモートモデルエンドポイントを登録するには、AlloyDB Omni でリモート AI モデルを登録して呼び出すをご覧ください。

概要

モデルエンドポイント管理を使用すると、モデルエンドポイントを登録し、データベースクラスタでモデルエンドポイントのメタデータを管理し、SQL クエリを使用してリモートモデルエンドポイントを呼び出すことができます。AI モデルに関連するメタデータを AlloyDB に登録できる関数を含む google_ml_integration 拡張機能を提供します。この登録済みメタデータは、ベクトルエンベディングの生成や予測の呼び出しに使用されます。

モデルエンドポイント管理を使用して登録できるモデルタイプの例を次に示します。

Vertex AI テキストエンベディングと汎用モデル
Hugging Face や OpenAI などのサードパーティプロバイダが提供するエンベディングモデル
カスタムホスト型テキストエンベディングモデル（セルフホスト型モデルやプライベートエンドポイントで利用可能なモデルなど）
JSON ベースの API を使用する汎用モデル（Hugging Face でホストされている facebook/bart-large-mnli モデル、Vertex AI Model Garden の gemini-pro モデル、Anthropic の claude モデルなど）

仕組み

モデルエンドポイント管理を使用すると、次の要件を満たすモデルエンドポイントを登録できます。

モデルの入力と出力は JSON 形式をサポートしています。
モデルは REST プロトコルを使用して呼び出すことができます。

モデルエンドポイントをモデルエンドポイント管理に登録すると、モデルへの参照として指定した一意のモデル ID を使用して各エンドポイントが登録されます。

モデルのエンドポイント ID を使用してモデルをクエリすると、次のことができます。

エンベディングを生成して、テキストプロンプトを数値ベクトルに変換します。データベースで vector 拡張機能が有効になっている場合、生成されたエンベディングをベクトルデータとして保存できます。詳細については、pgvector を使用してエンベディングをクエリしてインデックスに登録するをご覧ください。
SQL を使用して予測を呼び出します。

アプリケーションは、google_ml_integration 拡張機能を使用してモデルエンドポイント管理にアクセスできます。この拡張機能は、次の機能を提供します。

google_ml.create_model() SQL 関数。予測関数またはエンベディング関数で使用されるモデルエンドポイントを登録するために使用されます。
google_ml.create_sm_secret() SQL 関数。API キーが保存されている Google CloudSecret Manager のシークレットを使用します。
google_ml.embedding() SQL 関数。テキストエンベディングを生成する予測関数です。エンベディング関数の戻り値の型は REAL[] です。
JSON の入力形式と出力形式をサポートする汎用モデルを呼び出すときに予測を生成する google_ml.predict_row() SQL 関数。
カスタム URL の生成、HTTP ヘッダーの生成、変換関数の渡しを処理するその他のヘルパー関数。
登録されたモデルエンドポイントとシークレットを管理する関数。

主なコンセプト

モデルエンドポイント管理の使用を開始する前に、モデルに接続して使用するのに必要なコンセプトを理解してください。

モデルプロバイダ

モデルプロバイダは、サポートされているモデルホスティングプロバイダを示します。モデルプロバイダの設定は省略可能ですが、モデルエンドポイント管理でプロバイダを特定し、サポートされているモデルのヘッダーを自動的にフォーマットするのに役立ちます。次の表に、使用するモデルプロバイダに基づいて設定できるモデルプロバイダの値を示します。

モデルプロバイダ	関数で次のように設定します。
Vertex AI	`google`
Hugging Face モデル	`hugging_face`
Anthropic モデル	`anthropic`
OpenAI	`open_ai`
その他のモデル	`custom`

デフォルトのモデルプロバイダは custom です。

サポートされている認証方法は、プロバイダのタイプによって異なります。Vertex AI モデルは AlloyDB サービスアカウントを使用して認証を行いますが、他のプロバイダは Secret Manager を使用したり、認証の詳細をヘッダー経由で渡したりできます。詳細については、認証を設定するをご覧ください。

モデルタイプ

モデルタイプは、AI モデルのタイプを示します。この拡張機能は、テキストエンベディングと任意の汎用モデルタイプをサポートしています。モデルエンドポイントの登録時に設定できるサポートされているモデルタイプは、text-embedding と generic です。

汎用モデルエンドポイントを登録する場合、モデルタイプは省略可能です。generic がデフォルトのモデルタイプです。

事前登録済みの Vertex AI モデル

モデルエンドポイント管理は、事前登録されたモデル ID として一部のテキストエンベディングモデルと汎用 Vertex AI モデルをサポートしています。モデル ID を直接使用して、モデルタイプに基づいてエンベディングを生成したり、予測を呼び出したりできます。
サポートされている事前登録済みモデルの詳細については、事前登録済みの Vertex AI モデルをご覧ください。

たとえば、事前登録済みの textembedding-gecko モデルを呼び出すには、エンベディング関数を使用してモデルを直接呼び出します。

SELECT
      google_ml.embedding(
        model_id => 'textembedding-gecko',
        content => 'AlloyDB is a managed, cloud-hosted SQL database service');

サポートが組み込まれたモデル

モデルエンドポイント管理では、Vertex AI、Anthropic、OpenAI の一部モデルが組み込みでサポートされています。サポートが組み込まれているテキストエンベディングモデルの場合、AlloyDB はデフォルトの変換関数を自動的に設定します。

これらのモデルエンドポイントを登録するときに、修飾名を明示的に設定します。組み込みサポートが有効になっているモデルの一覧については、組み込みサポートが有効になっているモデルをご覧ください。

これらのモデルのモデルタイプは、text-embedding または generic です。

その他のテキストエンベディングモデル

組み込みサポートのないテキストエンベディングモデルエンドポイントを登録するには、モデルがサポートする入出力形式を処理する変換関数を作成することをおすすめします。必要に応じて、モデルの要件に応じて、ヘッダーを指定するカスタムヘッダー関数を作成することもできます。

これらのモデルのモデルタイプは text-embedding です。

汎用モデル

モデルエンドポイント管理では、テキストエンベディングモデルを除く他のすべてのモデルタイプの登録もサポートされています。汎用モデルの予測を呼び出すには、google_ml.predict_row() 関数を使用します。モデル固有のリクエストエンドポイントや HTTP ヘッダーなど、モデルエンドポイントのメタデータを設定できます。

汎用モデルエンドポイントを登録するときに、変換関数を渡すことはできません。予測を呼び出すときに、関数への入力が JSON 形式であること、および JSON 出力を解析して最終出力を導出していることを確認します。

これらのモデルのモデルタイプは generic です。

認証

認証タイプは、google_ml_integration 拡張機能を使用してモデルエンドポイント管理に接続するために使用できる認証タイプを示します。認証の設定は省略可能です。モデルにアクセスするために認証が必要な場合にのみ必要です。

Vertex AI モデルの場合、認証には AlloyDB サービスアカウントが使用されます。他のモデルでは、Secret Manager にシークレットとして保存されている API キーまたはベアラートークンを google_ml.create_sm_secret() SQL 関数で使用できます。ヘッダーで認証を渡す場合は、認証方法の設定をスキップできます。

次の表に、設定可能な認証タイプを示します。

認証方法	関数で次のように設定します。	モデルプロバイダ
AlloyDB サービスエージェント	`alloydb_service_agent_iam`	Vertex AI プロバイダ
Secret Manager	`secret_manager`	Anthropic、Hugging Face、OpenAI などのサードパーティプロバイダ

予測関数

google_ml_integration 拡張機能には、次の予測関数が含まれています。

google_ml.embedding(): 登録済みのテキストエンベディングモデルエンドポイントを呼び出してエンベディングを生成するために使用されます。; 組み込みサポートのないテキストエンベディングモデルの場合、入力パラメータと出力パラメータはモデルに固有であり、関数でモデルを呼び出すには変換する必要があります。予測関数の入力をモデル固有の入力に変換する変換入力関数と、モデル固有の出力を予測関数出力に変換する変換出力関数を作成する必要があります。
google_ml.predict_row(): モデルが JSON ベースの API をサポートしている限り、登録済みの汎用モデルエンドポイントを呼び出して予測を呼び出すために使用されます。

変換関数

変換関数は、入力をモデルが理解できる形式に変更し、モデルのレスポンスを予測関数が想定する形式に変換します。変換関数は、組み込みサポートなしで text-embedding モデルエンドポイントを登録する場合に使用されます。変換関数のシグネチャは、モデルが想定する入力によって異なります。

generic モデルエンドポイントを登録するときに変換関数を使用できません。

次のコードは、テキストエンベディングモデルの予測関数のシグネチャを示しています。

// define custom model specific input/output transform functions.
CREATE OR REPLACE FUNCTION input_transform_function(model_id VARCHAR(100), input_text TEXT) RETURNS JSON;

CREATE OR REPLACE FUNCTION output_transform_function(model_id VARCHAR(100), response_json JSON) RETURNS real[];

変換関数の作成方法の詳細については、変換関数の例をご覧ください。

HTTP ヘッダー生成関数

HTTP ヘッダー生成関数は、HTTP ヘッダーとして使用される JSON キー値ペアで出力を生成します。予測関数のシグネチャは、ヘッダー生成関数のシグネチャを定義します。

次の例は、google_ml.embedding() 予測関数のシグネチャを示しています。

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input TEXT) RETURNS JSON;

google_ml.predict_row() 予測関数のシグネチャは次のとおりです。

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input JSON) RETURNS JSON;

ヘッダー生成関数の作成方法については、ヘッダー生成関数の例をご覧ください。