リレーショナル データベースから直接 BigQuery へシームレスな複製を行うことで、運用データに関するほぼリアルタイムの分析情報が得られます。
利点
MySQL、PostgreSQL、AlloyDB、Oracle データベースのデータを直接 BigQuery にシームレスにレプリケートします。低レイテンシで、ソースのパフォーマンスに影響を与えません。
自動的にスケールするサーバーレスのアプローチにより、インフラストラクチャの管理なしで運用上のオーバーヘッドを解消します。
簡素化された設定エクスペリエンスにより、わずか数ステップでオペレーショナル データベースから BigQuery へのデータのレプリケーションを開始できます。
主な機能
Datastream は、BigQuery の変更データ キャプチャ(CDC)機能と Storage Write API を使用して、ソースシステムから更新をほぼリアルタイムで効率的に複製します。複雑なデータ パイプライン、セルフマネージドのステージング テーブル、複雑なマージ ロジック、手動によるデータ型変換に貴重なリソースを浪費するレプリケーション ソリューションは不要になりました。
Datastream では、わずか数ステップでデータを BigQuery にレプリケートできます。BigQuery でソース データベース、接続タイプ、宛先を構成するだけで、Datastream for BigQuery が過去のデータのバックフィルを開始し、以降は継続的に、新しい変更が発生すると同時に変更がレプリケートされます。
Datastream は、MySQL、PostgreSQL、AlloyDB、Oracle の各種データベースから変更(挿入、更新、削除)をすべて読み取り、配信して、最小限のレイテンシで BigQuery にデータを読み込みます。ソース データベースは、オンプレミスや Cloud SQL、さらに Bare Metal Solution for Oracle などの Google Cloud サービス、または任意のクラウド上でホストすることができます。BigQuery のために構築されたエージェントレスの Google ネイティブ サービスであり、すあらゆるイベントを確実にストリーミングできます。
ソーススキーマが変更されると、Datastream はスキーマのドリフトをシームレスに処理し、ソースに追加された新しい列とテーブルを BigQuery に自動的に複製します。
Datastream は、転送中のデータを保護するための、複数の安全なプライベート接続方法をサポートしています。また、データは保存時に暗号化されます。
導入事例
ユースケース
Datastream はソース データベースから変更イベント(挿入、更新、削除)を読み取り、ほぼリアルタイムで BigQuery テーブルに書き込みます。これにより、既存の BigQuery データ ウェアハウスと ML モデルを小売りの購入などのトランザクション データで拡充し、より包括的なデータの全体像を構築できます。Datastream は過去のデータのバックフィルを行い、新しい変更が発生するたびにその変更をレプリケートします。また、スキーマの変更をシームレスに処理します。
主な利点
オペレーション データを BigQuery にレプリケートする最も簡単な方法
自動的にスケールアップとスケールダウンを行うサーバーレス アーキテクチャ
レプリケーション パイプラインのエンドツーエンドの可視性とモニタリングのための単一のインターフェース
柔軟性の高いカスタマイズ可能なソリューション
Google の幅広い掲載先に事前に構築されたテンプレート
データ品質やデータ マスキングなどの追加機能の統合
ETL デベロッパーとデータ アナリスト向けのシンプルなインターフェース
レプリケーションにおける潜在的な問題とギャップを事前に特定
レプリケーションのパフォーマンスに関するほぼリアルタイムの分析情報
主な利点
オペレーション データを BigQuery にレプリケートする最も簡単な方法
自動的にスケールアップとスケールダウンを行うサーバーレス アーキテクチャ
レプリケーション パイプラインのエンドツーエンドの可視性とモニタリングのための単一のインターフェース
主な利点
柔軟性の高いカスタマイズ可能なソリューション
Google の幅広い掲載先に事前に構築されたテンプレート
データ品質やデータ マスキングなどの追加機能の統合
主な利点
ETL デベロッパーとデータ アナリスト向けのシンプルなインターフェース
レプリケーションにおける潜在的な問題とギャップを事前に特定
レプリケーションのパフォーマンスに関するほぼリアルタイムの分析情報
料金
Datastream の料金は、処理された実際のデータに基づいています。ボリューム ベースの階層型料金体系を利用できるため、大容量のデータを移動する場合は、より手頃な価格で利用できます。料金の詳細については、データストリームの料金ページをご覧ください。
追加リソース(BigQuery、Cloud Storage、Dataflow など)は、これらのサービスの料金に従って課金されます。