カスタムインデックスを使用してクエリ時間を短縮する

このドキュメントでは、インデックス付きの LogEntry フィールドを Cloud Logging バケットに追加して、ログデータのクエリを高速化する方法について説明します。

概要

クエリのパフォーマンスは、どのロギングソリューションにとっても重要です。ワークロードのスケールアップに伴い、対応するログボリュームも増加していきますが、最も頻繁に使用するログデータをインデックスに登録することで、クエリ時間を短縮できます。

クエリのパフォーマンスを向上させるため、Logging は次の LogEntry フィールドを自動的にインデックスに登録します。

Logging が自動的にインデックスに登録するフィールド以外にも、バケットのカスタムインデックスを作成して、他の LogEntry フィールドをインデックスに登録するようログバケットに指示することもできます。

たとえば、クエリ式に jsonPayload.request.status フィールドが頻繁に含まれているとします。jsonPayload.request.status を含むバケットにカスタムインデックスを構成すると、クエリ式にそのフィールドが含まれている場合、そのバケットのデータに対する後続のクエリは、インデックスに登録された jsonPayload.request.status データを参照します。

Google Cloud CLI または Logging API を使用して、既存または新しいログバケットにカスタムインデックスを追加できます。カスタムインデックスに含める追加のフィールドを選択する際は、次の制限事項に注意してください。

1 つのカスタムインデックスに追加できるフィールドは 20 個までです。
バケットのカスタムインデックスを構成または更新した後、変更がクエリに適用されるまで 1 時間ほど待つ必要があります。このレイテンシにより、クエリ結果の正確性が確保され、過去に書き込まれたログが受け入れられます。
Logging は、インデックスの作成または変更後にログバケットに保存されたデータにカスタムインデックスを適用します。カスタムインデックスへの変更は、過去に遡ってログに適用されることはありません。

始める前に

カスタムインデックスの構成を開始する前に、次の操作を行います。

gcloud CLI の最新バージョンを使用していることを確認します。詳細については、Google Cloud CLI コンポーネントの管理をご覧ください。

注: このドキュメントの gcloud CLI の例では、正しいプロジェクトを更新するように gcloud CLI が構成されていることを前提としています。コマンドでプロジェクトを指定する場合は、--project フラグを含めて Google Cloud プロジェクト ID を指定します。
次の権限を持つ Identity and Access Management ロールが付与されていることを確認します。
- roles/logging.admin
- roles/logging.configWriter
これらのロールの詳細については、IAM によるアクセス制御をご覧ください。

カスタムインデックスを定義する

バケットのカスタムインデックスに追加するフィールドごとに、フィールドパスとフィールドタイプの 2 つの属性を定義します。

fieldPath: ログエントリの LogEntry フィールドの特定のパスを指定します。例: jsonPayload.req_status。
type: フィールドが文字列型か整数型かを指定します。指定できる値は INDEX_TYPE_STRING または INDEX_TYPE_INTEGER です。

カスタムインデックスは、新しいバケットを作成するか、既存のバケットを更新することで追加できます。バケットの構成の詳細については、ログバケットを構成するをご覧ください。

バケットを作成するときにカスタムインデックスを構成するには、次の操作を行います。

gcloud

gcloud logging buckets create コマンドを使用して、--index フラグを設定します。

gcloud logging buckets create BUCKET_NAME \
--location=LOCATION \
--description="DESCRIPTION" \
--index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE

コマンドの例:

gcloud logging buckets create int_index_test_bucket \
--location=global \
--description="Bucket with integer index" \
--index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER

API

バケットを作成するには、Logging API で projects.locations.buckets.create を使用します。次のように、メソッドの引数を準備します。

バケットを作成するリソース（projects/PROJECT_ID/locations/LOCATION）を parent パラメータに設定します。

変数 LOCATION には、ログを保存するリージョンを指定します。

たとえば、リージョン asia-east2 にプロジェクト my-project のバケットを作成する場合、parent パラメータは projects/my-project/locations/asia-east2 のようになります。
bucketId パラメータを設定します。例: my-bucket
LogBucket リクエスト本文で、IndexConfig オブジェクトを構成してカスタムインデックスを作成します。
projects.locations.buckets.create を呼び出してバケットを作成します。

既存のバケットを更新してカスタムインデックスを含めるには、次の操作を行います。

gcloud

gcloud logging buckets update コマンドを使用して、--add-index フラグを設定します。

gcloud logging buckets update BUCKET_NAME \
--location=LOCATION \
--add-index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE

コマンドの例:

gcloud logging buckets update int_index_test_bucket \
--location=global \
--add-index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER

API

Logging API で projects.locations.buckets.patch を使用します。LogBucket リクエスト本文で、インデックスに登録する LogEntry フィールドを含むように IndexConfig オブジェクトを構成します。

カスタムインデックスフィールドを削除する

バケットのカスタムインデックスからフィールドを削除するには、次の操作を行います。

gcloud

gcloud logging buckets update コマンドを使用して、--remove-indexes フラグを設定します。

gcloud logging buckets update BUCKET_NAME \
--location=LOCATION \
--remove-indexes=INDEX_FIELD_NAME

コマンドの例:

gcloud logging buckets update int_index_test_bucket \
--location=global \
--remove-indexes=jsonPayload.req_status

API

Logging API で projects.locations.buckets.patch を使用します。LogBucket リクエスト本文で、IndexConfig オブジェクトから LogEntry フィールドを削除します。

カスタムインデックスフィールドのデータ型を更新する

カスタムインデックスフィールドのデータ型を修正する必要がある場合は、次の操作を行います。

gcloud

gcloud logging buckets update コマンドを使用して、--update-index フラグを設定します。

gcloud logging buckets update BUCKET_NAME \
--location=LOCATION \
--update-index=fieldPath=INDEX_FIELD_NAME,type=INDEX_TYPE

コマンドの例:

gcloud logging buckets update int_index_test_bucket \
--location=global \
--update-index=fieldPath=jsonPayload.req_status,type=INDEX_TYPE_INTEGER

API

Logging API で projects.locations.buckets.patch を使用します。LogBucket リクエスト本文で、IndexConfig オブジェクトを更新して、LogEntry フィールドに適切なデータ型を指定します。

カスタムインデックスフィールドのパスを更新する

カスタムインデックスフィールドのフィールドパスを修正する必要がある場合は、次の操作を行います。

gcloud

gcloud logging buckets update コマンドを使用して、--remove-indexes フラグと --update-index フラグを設定します。

gcloud logging buckets update BUCKET_NAME \
--location=LOCATION \
--remove-indexes=OLD_INDEX_FIELD_NAME \
--update-index=fieldPath=NEW_INDEX_FIELD_NAME,type=INDEX_TYPE

コマンドの例:

gcloud logging buckets update int_index_test_bucket \
--location=global \
--remove-indexes=jsonPayload.req_status_old_path \
--add-index=fieldPath=jsonPayload.req_status_new_path,type=INDEX_TYPE_INTEGER

API

Logging API で projects.locations.buckets.patch を使用します。LogBucket リクエスト本文で、IndexConfig オブジェクトを更新して、LogEntry フィールドの正しいフィールドパスを指定します。

バケットでインデックスに登録されたすべてのフィールドを一覧表示する

カスタムインデックスフィールドを含むバケットの詳細を一覧表示するには、次の操作を行います。

gcloud

gcloud logging buckets describe コマンドを実行します。

gcloud logging buckets describe BUCKET_NAME \
--location=LOCATION

コマンドの例:

gcloud logging buckets describe indexed-bucket \
--location global

API

Logging API で projects.locations.buckets.get を使用します。

カスタムインデックスフィールドをクリアする

バケットからすべてのカスタムインデックスフィールドを消去するには、次の操作を行います。

gcloud

gcloud logging buckets update コマンドを使用して、--clear-indexes フラグを指定します。

gcloud logging buckets update BUCKET_NAME \
--location=LOCATION \
--clear-indexes

コマンドの例:

gcloud logging buckets update int_index_test_bucket \
--location=global \
--clear-indexes

API

Logging API で projects.locations.buckets.patch を使用します。LogBucket リクエスト本文で、IndexConfig オブジェクトを削除します。

インデックス付きデータのクエリと表示

カスタムインデックスフィールドに含まれるデータをクエリするには、クエリのスコープをカスタムインデックスフィールドを含むバケットに制限し、適切なログビューを指定します。

gcloud

ログバケットからログを読み取るには、gcloud logging read コマンドを使用し、LOG_FILTER を追加してインデックス付きのデータを含めます。

gcloud logging read LOG_FILTER --bucket=BUCKET_ID --location=LOCATION --view=LOG_VIEW_ID

API

ログバケットからログを読み取るには、entries.list メソッドを使用します。resourceNames を設定して、適切なバケットとログビューを指定し、filter を設定してインデックス付きのデータを選択します。

フィルタリング構文の詳細については、Logging のクエリ言語をご覧ください。

インデックスタイプとフィールドタイプ

カスタムフィールドインデックスの構成方法は、ログバケットへのログの保存方法やクエリの処理の方法に影響します。

書き込み時

Logging は、インデックスの作成後にログバケットに保存されたデータにカスタムインデックスの使用を試みます。

インデックス付きフィールドは型付きですが、これはログエントリのタイムスタンプに影響します。ログエントリがログバケットに保存されるとき、次のルールを使用して、ログフィールドがインデックスタイプに対して評価されます。

フィールドタイプがインデックスタイプと同じ場合、データはインデックスとしてすぐに追加されます。
フィールドタイプがインデックスタイプと異なる場合、Logging はフィールドタイプをインデックスタイプに強制変換しようとします（整数から文字列など）。
- タイプの強制変換が失敗した場合、データはインデックスに登録されません。タイプの強制変換が成功すると、データはインデックスに登録されます。

クエリ時

フィールドのインデックスを有効にすると、そのフィールドに対するクエリ方法が変更されます。デフォルトでは、Logging は、評価対象の各ログエントリ内のデータの種類に基づいて、フィールドにフィルタ制約を適用します。インデックスが有効になっている場合、フィールドのフィルタ制約はインデックスタイプに基づいて適用されます。フィールドにインデックスを追加すると、そのフィールドにスキーマが適用されます。

バケット用にカスタムインデックスが構成されている場合、次の両方の条件を満たしていると、スキーマを一致させる動作が変わります。

フィールドのソースデータ型がそのフィールドのインデックスタイプと一致しない。
ユーザーがこのフィールドに制約を適用している。

次の JSON ペイロードについて考えてみましょう。

{"jsonPayload": {"name": "A", "value": 12345}}
{"jsonPayload": {"name": "B", "value": "3"}}

このフィルタをそれぞれに適用します。

jsonPayload.value > 20

jsonPayoad.value フィールドにカスタムインデックスがない場合、Logging では柔軟なタイプマッチングが適用されます。

A の場合、Logging は value キーの値が実際には整数であり、制約 20 を整数に変換できることを確認します。次に、Logging は 12345 > 20 を評価します。この場合は数値に該当するため、true を返します。
B の場合、Logging は value キーの値が実際には文字列であることを確認します。次に、"3" > "20" を評価します。この場合は英数字に該当するため、true を返します。

フィールド jsonPayload.value がカスタムインデックスに含まれている場合、Logging は通常の Logging ロジックではなく、インデックスを使用してこの制約を評価します。動作の変更:

インデックスが文字列型の場合、すべての比較は文字列比較になります。
- 「12345」は英数字の「20」以下のため、A のエントリは一致しません。文字列「3」は「20」より大きいため、B のエントリが一致します。
インデックスが整数型の場合、すべての比較は整数比較になります。
- 「3」が数値的に「20」よりも小さいため、B のエントリは一致しません。「12345」は「20」よりも大きいため、A のエントリは一致します。

この動作の違いは微妙であり、カスタムインデックスの定義と使用時に考慮する必要があります。

フィルタリングのエッジケース

jsonPayload.value 整数型インデックスに対して、文字列値がフィルタリングされたとします。

jsonPayload.value = "hello"

クエリ値をインデックスタイプに強制変換できない場合、インデックスは無視されます。

また、文字列型のインデックスに整数値を渡す場合はどうなるでしょうか。

jsonPayload.value > 50

「12345」も「3」も英数字の「50」より大きくないため、A も B も一致しません。

カスタム インデックスを使用してクエリ時間を短縮する

概要

始める前に

カスタム インデックスを定義する

gcloud

API

gcloud

API

カスタム インデックス フィールドを削除する

gcloud

API

カスタム インデックス フィールドのデータ型を更新する

gcloud

API

カスタム インデックス フィールドのパスを更新する

gcloud

API

バケットでインデックスに登録されたすべてのフィールドを一覧表示する

gcloud

API

カスタム インデックス フィールドをクリアする

gcloud

API

インデックス付きデータのクエリと表示

gcloud

API

インデックス タイプとフィールド タイプ

書き込み時

クエリ時

フィルタリングのエッジケース

カスタムインデックスを使用してクエリ時間を短縮する

カスタムインデックスを定義する

カスタムインデックスフィールドを削除する

カスタムインデックスフィールドのデータ型を更新する

カスタムインデックスフィールドのパスを更新する

カスタムインデックスフィールドをクリアする

インデックスタイプとフィールドタイプ