PostgreSQL データベースの WAL ログファイルを操作する

概要

Datastream は、PostgreSQL WAL(write-ahead log)トランザクション ログを使用して PostgreSQL ストリームを読み取ります。ログは、データベース サーバー上の WAL ファイルに保存されます。WAL ログの各レコードは、データベースの 1 つのテーブルに含まれる実際のデータに対する 1 つの変更を表します。

PostgreSQL WAL ファイルの構成パラメータを設定する

PostgreSQL データベースに次の構成設定を適用することをおすすめします。

  • max_slot_wal_keep_size: このパラメータ(PostgreSQL 13 以降でのみ使用可能)を設定して、レプリケーション スロットで使用されるストレージ量を制限します。これは、長時間実行されるトランザクションでは特に重要です。極端な場合、WAL ファイルサイズがストレージ全体を占有し、データベースがクラッシュする可能性があります。

  • statement_timeout: このパラメータを選択した値に設定して、長時間実行トランザクションによって生じるレイテンシを短縮します。max_slot_wal_keep_size をサポートしていないデータベースに対して、代替の予防措置として statement_timeout を使用することもできます。

  • wal_sender_timeout: このパラメータを 0(タイムアウトを無効にする場合)または 10 分以上の値に設定します。

10 個を超えるストリームを作成する場合や、予定されたストリームの数に加え、他のリソースで使用される論理レプリケーション スロットの数が 10 個を超える場合は、次のパラメータを変更してください。

  • max_replication_slots: データベースに設定されているレプリケーション スロットの数に応じて、このパラメータの値を増やします(ストリームごとに 1 つのレプリケーション スロットが必要です)。max_replication_slots はサーバーの起動時にのみ設定できます。

  • max_wal_senders: このパラメータの値を max_replication_slots パラメータの値よりも大きくします。サーバーの起動時にのみ max_wal_senders を設定できます。