このドキュメントでは、AlloyDB Omni でクエリのパフォーマンスを高速化し、再現率を向上させるためのインデックスのチューニング方法について説明します。
IVF
インデックスをチューニングする
lists
、ivf.probes
、quantizer
パラメータに設定した値をチューニングすると、アプリのパフォーマンスを最適化できます。
チューニング パラメータ | 説明 | パラメータのタイプ。 |
---|---|---|
lists |
インデックスの構築中に作成されたリストの数。この値の設定の開始点は、最大 100 万行の場合は (rows)/1000 、100 万行を超える場合は sqrt(rows) です。 |
インデックスの作成 |
quantizer |
K 平均法ツリーに使用する量子化ツールのタイプ。デフォルト値は SQ8 で、クエリのパフォーマンスが向上します。FLAT に設定すると、再現率が向上します。 |
インデックスの作成 |
ivf.probes |
検索時に探索する最近傍リストの数。この値の出発点は sqrt(lists) です。 |
クエリ ランタイム |
チューニング パラメータが設定された IVF
インデックスを示す次の例について考えてみましょう。
SET LOCAL ivf.probes = 10;
CREATE INDEX my-ivf-index ON my-table
USING ivf (vector_column cosine)
WITH (lists = 100, quantizer = 'SQ8');
クエリを分析する
次の SQL クエリの例に示すように、EXPLAIN ANALYZE
コマンドを使用してクエリ分析情報を分析します。
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
レスポンスの例 QUERY PLAN
には、所要時間、スキャンまたは返された行数、使用されたリソースなどの情報が含まれます。
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
ベクトル インデックスの指標を表示する
ベクトル インデックスの指標を使用すると、ベクトル インデックスのパフォーマンスを確認して改善できる領域を特定し、必要に応じて指標に基づいてインデックスをチューニングできます。
すべてのベクトル インデックス指標を表示するには、pg_stat_ann_indexes
ビューを使用する次の SQL クエリを実行します。
SELECT * FROM pg_stat_ann_indexes;
指標の一覧については、ベクトル インデックスの指標をご覧ください。