このページは Cloud Translation API によって翻訳されました。

インデックスの作成

このページでは、保存されたエンベディングを使用してインデックスを生成し、AlloyDB for PostgreSQL で HNSW インデックスを使用してエンベディングをクエリする方法について説明します。エンベディングの保存の詳細については、ベクトルエンベディングを保存するをご覧ください。

始める前に

インデックスの作成を開始する前に、以下の前提条件を整える必要があります。

AlloyDB データベースのテーブルにエンベディングベクトルが追加されている。
Google が AlloyDB 用に拡張した pgvector に基づく vector 拡張機能のバージョン 0.5.0 以降がインストールされている。
```
CREATE EXTENSION IF NOT EXISTS vector;
```

`HNSW` インデックスを作成する

AlloyDB は、AlloyDB pgvector 拡張機能を使用して、ストック pgvector で使用可能なグラフベースの hnsw インデックスの作成をサポートしています。hnsw インデックスを使用すると、貪欲探索が行われます。この探索では、最適な結果が見つかるまで、グラフを移動しながらクエリベクトルに最も近い近傍を探し続けます。IVF と比較して、クエリのパフォーマンスは向上しますが、ビルド時間は長くなります。

HNSW アルゴリズムの詳細については、Hierarchical Navigable Small World グラフをご覧ください。

hnsw インデックスを作成するには、次のクエリを実行します。

CREATE INDEX INDEX_NAME ON TABLE
  USING hnsw (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (m = NUMBER_OF_CONNECTIONS, ef_construction = 'CANDIDATE_LIST_SIZE');

次のように置き換えます。

INDEX_NAME: 作成するインデックスの名前（例: my-hnsw-index）。
TABLE: インデックスを追加するテーブル。
EMBEDDING_COLUMN: vector データを格納する列。
DISTANCE_FUNCTION: このインデックスで使用する距離関数。次のいずれかを選択します。
- L2 距離: vector_l2_ops
- 内積: vector_ip_ops
- コサイン距離: vector_cosine_ops
NUMBER_OF_CONNECTIONS: グラフ内のノードからの接続の最大数。デフォルト値の 16 から始めて、データセットのサイズに応じて値を大きくしてテストできます。
CANDIDATE_LIST_SIZE: グラフの構築中に維持される候補リストのサイズ。ノードの最近傍の現在の最良の候補が常に更新されます。この値は、m 値の 2 倍を超える値に設定します（例: 64）。

インデックス作成の進行状況を確認するには、pg_stat_progress_create_index ビューを使用します。

SELECT * FROM pg_stat_progress_create_index;

phase 列には、インデックス作成の現在のステータスが示されます。インデックスが作成されると、building graph フェーズが消えます。

目標の再現率と QPS のバランスを考慮してインデックスをチューニングするには、hnsw インデックスをチューニングするをご覧ください。

クエリの実行

エンベディングをデータベースに保存してインデックスを作成した後は、pgvector クエリ機能を使用してクエリを開始できます。

エンベディングベクトルの最も近いセマンティックネイバーを見つけるには、次のサンプルクエリを実行します。ここでは、インデックスの作成時に使用した距離関数を設定します。

  SELECT * FROM TABLE
    ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY ['EMBEDDING']
    LIMIT ROW_COUNT

次のように置き換えます。

TABLE: テキストを比較するエンベディングを含むテーブル。
INDEX_NAME: 使用するインデックスの名前。例: my-hnsw-index
EMBEDDING_COLUMN: 保存されたエンベディングを含む列。
DISTANCE_FUNCTION_QUERY: このクエリで使用する距離関数。インデックスの作成時に使用した距離関数に基づいて、次のいずれかを選択します。
- L2 距離: <->
- 内積: <#>
- コサイン距離: <=>
EMBEDDING: 保存されているセマンティックネイバーの中で最も近いものを見つけるエンベディングベクトル。
ROW_COUNT: 返される行数。

最も適合するものが 1 つだけ必要な場合は、1 を指定します。

他のクエリの例については、クエリをご覧ください。

embedding() 関数を使用してテキストをベクトルに変換することもできます。ベクトルを pgvector 最近傍演算子（L2 距離の場合は <->）のいずれかに適用して、意味的に最も類似したエンベディングを含むデータベース行を見つけます。

embedding() は real 配列を返すため、これらの値を pgvector 演算子で使用するには、embedding() 呼び出しを vector に明示的にキャストする必要があります。

インデックスの作成 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

始める前に

HNSW インデックスを作成する

クエリの実行

次のステップ

インデックスの作成

`HNSW` インデックスを作成する