データベース

Google Cloud データベースの最新情報 - 2024 年 6 月版

2024年6月27日

Kiran Shenoy

Sr. Product Manager, Google Cloud Databases

Gemini 1.5 モデルをお試しください。

Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダルモデルです。

※この投稿は米国時間 2024 年 6 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。

データベースは、あらゆる企業のイノベーション計画における基本的な要素ですが、多くのお客様にとって、技術スタックの中で最も設計、コーディング、運用、管理が難しい側面でもあります。Google Cloud は、データベースを移行、モダナイズ、変換して、AI を活用した次世代型のソリューションを構築できるようお客様を支援しています。

このブログ投稿では、1 月に投稿された前回の記事以降に Google Cloud のデータベースサービスに加えられた主要なデータベースサービスの更新を網羅的にリストアップしています。今年最大のデータベース関連ニュースとも言える Google Cloud と Oracle のパートナーシップについて詳しくは、こちらのブログ投稿をご覧ください。このパートナーシップにより、お客様はミッションクリティカルなエンタープライズワークロードを Google Cloud と Oracle Cloud Infrastructure（OCI）間でシームレスに移行し、実行できるようになります。今後の動きにもご注目ください。

データベースポートフォリオに関する重要な最新情報を以下にご紹介します。

生成 AI とデータベース

ベクトル検索が、生成 AI による有用かつ正確なアプリケーションを構築するための重要な機能として登場しました。近似最近傍アルゴリズムを使って、商品カタログからテキストや画像といった非構造化データの類似の検索結果を簡単に見つけることができます。

AlloyDB、Spanner、Cloud SQL、Memorystore for Redis、Firestore などのデータベースポートフォリオ全体でベクトルのサポートを利用できるようになりました。これにより、使い慣れたデータベースのデータに基づいたエンタープライズ向け生成 AI アプリの構築が可能となります。
LangChain とのインテグレーション: Google のデータベースと LangChain のネイティブなインテグレーションにより、マネージド環境のフレームワークとオーケストレーションを通じて、複雑な生成 AI アプリがサポートされます。

Gemini in Databases

Gemini in Databases は常時稼働の AI アシスタントで、データベース活用のあらゆる側面を簡素化し、利用体験と生産性を向上させます。

より迅速なアプリケーションの構築: 自然言語を使用してアプリケーションを迅速に開発できます。
一括表示を使った管理: データベースフリート全体を 1 か所で監視、最適化、制御できます。
移行の高速化: データベースの移行プロセスを合理化できます。
利用を開始するには: Gemini in Databases は現在、プレビュー版が公開されています。

AlloyDB

AlloyDB はトップレベルのリレーショナルデータベースワークロードに対応した高性能な PostgreSQL 互換データベースで、ノートパソコンやデータセンターなど、場所を問わずに実行できます。

AlloyDB AI が利用可能になり、IVFFlat インデックスの標準 PostgreSQL と比較して最大 10 倍高速なベクトルクエリが実現しました。
BigQuery から AlloyDB への連携クエリを使用できるようになりました。この機能はプレビュー版で提供されています。
Private Service Connect が一般提供されました。Private Service Connect を使用すると、異なるグループ、チーム、プロジェクト、または組織に属する複数の VPC ネットワークから AlloyDB for PostgreSQL インスタンスに接続できます。
AlloyDB クラスタのメンテナンスの時間枠を設定できるようになりました（一般提供）。有効にすると、緊急でないメンテナンスイベントは毎週指定された期間中にのみ開始するようスケジュールされます。今後のメンテナンスイベントに関するメール通知を受け取ることもできます。
ベクトルの検索と取得を効率化する Google の ScaNN（Scalable Nearest Neighbor）アルゴリズムが AlloyDB に組み込まれました。この統合により、ベクトルクエリの高速化、書き込みスループットの向上、メモリ使用量の節約、インデックス構築時間の短縮など、大きな利点が AlloyDB にもたらされます（こちらのブログ投稿を参照）。

Cloud SQL

Cloud SQL は MySQL、PostgreSQL、SQL Server 向けのフルマネージドデータベースサービスで、高可用性とスケーラビリティの機能を備えています。

Google I/O では、内部的に Cloud SQL を活用する Firebase Data Connect（FDC）の限定公開プレビュー版を発表しました。FDC により、スタートアップ、大企業を問わず、開発者は PostgreSQL にアクセスしてより迅速にアプリを開発できます。さらに、FDC は Cloud SQL のフルマネージド機能へのアクセスも提供し、開発者は革新的でスケーラブルなソリューションを構築できます（こちらの動画、YouTube ショート、ブログ投稿を参照）。
Cloud SQL Enterprise Plus エディションがさらに 6 つのリージョンで利用可能になり、メンテナンス、ほぼゼロダウンタイムのアップグレード、最大 35 日間のポイントインタイムリカバリ機能を含む 99.99% の可用性 SLA のメリットが提供されます。
Cloud SQL Enterprise Plus では、さらに高い可用性が実現しました。

プライマリインスタンスでのインスタンススケールアップ操作のダウンタイムがほぼゼロになりました。これにより、インスタンスをスケールアップする間、中断することなくリクエストを処理し続けることができます。
ダウンタイムが 1 秒未満の計画的メンテナンス: HA が有効になっているプライマリインスタンスのメンテナンスが、1 秒未満のダウンタイムで実行されるようになりました。

Cloud SQL（MySQL）の高度な DR: スイッチオーバーに加えて、障害発生後にプライマリリージョンでインスタンスを自動的に再構築してトイルを軽減するレプリカフェイルオーバーと呼ばれる機能を導入しました。

Memorystore

Memorystore は、幅広いアプリケーションにミリ秒未満のデータアクセス、スケーラビリティ、高可用性を提供する、フルマネージドのインメモリ Redis と Memcache のサービスです。

ベクトル検索と Redis バージョン 7.2 が Memorystore for Redis 向けに一般提供されました。ベクトル検索は、非常に高速なインメモリベクトル検索を実現します。Memorystore for Redis インスタンスではそれぞれ、数千万のベクトルに対して数ミリ秒単位のレイテンシでベクトル検索を行えます。
新しいノードタイプ: Memorystore for Redis Cluster 向けに 1.4 GB 共有コア、6.5 GB、58 GB が一般提供されました。
永続性（AOF および RDB）と動的構成が Memorystore for Redis Cluster 向けにプレビュー版で提供されました。
Memorystore と新しい OSS LangChain のインテグレーションにより、RAG ワークフローの高速化、LLM キャッシュとしての使用、その他のさまざまな生成 AI ユースケースでの使用が可能です。
シングルゾーンインスタンスは現在、公開プレビュー版が提供されています。シングルゾーンインスタンスを使用すると、ゾーン間のトラフィックを排除して、ネットワークコストを削減し、レイテンシを短縮できます。

Oracle 向け Bare Metal Solution

Oracle 向け Bare Metal Solution を使用すると、Oracle のワークロードを Google Cloud に近づけ、リスクを最小限に抑えてクラウドへの移行を開始できます。

Bare Metal Solution では、パフォーマンスストレージが提供されるようになりました。これはストレージオプションを TiB あたり 56 MB/秒から TiB あたり 256 MB/秒に拡張する高パフォーマンスワークロード向けのオプションです。
Bare Metal Solution の SKU が公開され、料金計算ツールに反映されるようになりました。

Spanner

Spanner はグローバルに分散されたフルマネージドのリレーショナルデータベースサービスで、水平方向のスケーラビリティ、強整合性、高可用性を提供します。

ベクトル検索: Spanner は、追加ツールやデータ移動なしで、リアルタイム RAG アプリケーション向けに、数兆のベクトルに対するベクトル検索を大規模にサポートするようになりました。Spanner は、K 最近傍（KNN）類似性検索用のコサイン距離関数、ユークリッド距離関数、ドット積ベクトル関数と、ベクターエンベディングを格納するための効率的な型を提供します。
変更ストリーム: 多くの新機能により、Spanner の組み込み変更データキャプチャメカニズムが改善されました。変更ストリームは、挿入、更新、削除のイベントを Pub/Sub や Kafka などのコンシューマーに効率的に公開するために使用されます。新しいキャプチャタイプを使用すると、新しい行全体または変更された値だけを含めることができます。新しいフィルタを使用すると、挿入、更新、削除の各タイプ別に、公開された変更を含めたり除外したりできるほか、組み込み TTL の一部として生成された削除を識別できます。最後に、変更ストリームは Spanner エミュレータを使ったローカルでの開発とテストにも使用できます。
プロトコルバッファ: Spanner はプロトコルバッファタイプをサポートするようになりました。Protobuf は、たとえば RPC やマイクロサービスアーキテクチャで共有するために、保存または転送するデータをシリアル化する効率的な方法です。
新しいリージョンエンドポイント（REP）は、Spanner のグローバルフロントエンドの代替手段であり、接続が構成済みリージョンのみを経由してルーティングされることを保証し、転送中のデータと保存中のデータの所在地の要件をサポートします。リーダー認識ルーティングはマルチリージョンインスタンスのもう一つの新しいパフォーマンス最適化で、多くの種類の読み取り / 書き込みトランザクションで書き込みレイテンシを最大 40% 削減します。
Spanner メトリクスとトレースの OpenTelemetry サポートが一般提供されました。OpenTelemetry はオープンソースのオブザーバビリティの最新標準であり、OpenCensus と OpenTracing の統合によって形成されています。

Bigtable

Bigtable は、ML、運用分析、ユーザー向けアプリケーションの大規模な活用に適した、エンタープライズグレードの低レイテンシ NoSQL データベースサービスです。

Bigtable では現在、Data Boost を提供しています。これは、ETL ジョブ、分析クエリ、ML モデルトレーニングなどのバッチワークロード向けに、Bigtable データに対する完全に分離されたサーバーレス読み取りを可能にするものです。
自動バックアップを有効にすることで、Bigtable テーブルの毎日のバックアップを作成できるようになりました。
Bigtable の承認済みビュー機能が一般提供されました。承認済みビューを使用すると、行レベルと列レベルでのきめ細かなアクセス制御を通じて、安全なデータコラボレーションが可能になります。
Bigtable Spark コネクタを使用すると、Spark SQL と PySpark DataFrame を使用して Bigtable のデータを読み書きできます。
Bigtable は、イベントストリームに対するスケーラブルな運用分析のために分散カウンタをサポートするようになりました。詳しくは、書き込み時に値を集計するを参照してください。

Firestore

Firestore は、充実したモバイルアプリ、ウェブアプリ、IoT アプリを構築するためのサーバーレスドキュメントデータベースです。

Gemini Code Assist とお好きな統合開発環境（IDE）を使用することで、Firestore データモデルの定義やクエリの記述に自然言語を使用できるようになりました。
Firestore は現在、厳密な最近傍を使用したベクトル検索が組み込みでサポートされ、すぐに使える拡張機能を介して一般的なエンベディングモデルを使って自動的にベクターエンベディングを生成できます。また、LangChain や Llamaindex などの一般的な生成 AI ライブラリとのインテグレーションにより、chatbot やレコメンデーションエンジンなどの AI 対応ソリューションの構築がサポートされています。
Firestore に顧客管理暗号鍵（CMEK）機能が追加され、お客様が暗号鍵を管理し、自社データのセキュリティ保護対策をより細かく制御できるようになりました。
複数のフィールドに範囲フィルタを使用するクエリのプレビュー版が最近リリースされたため、お客様は Firestore で直接、複数のフィールドにわたる範囲条件でフィルタする高速クエリを簡単かつ費用効率よく実行できます。
Firestore のお客様は Query Explain 機能を使用して、提案されたクエリプランを取得できるようになりました。この機能は、クエリのトラブルシューティングに対する追加サポートも提供しています。

Database Migration Service（DMS）

Database Migration Service は、MySQL、PostgreSQL、Oracle データベースの Cloud SQL または AlloyDB への移行を簡素化および高速化するフルマネージドサービスです。継続的なデータレプリケーションによりダウンタイムを最小限に抑えます。

DMS では、Oracle データベースから AlloyDB または Cloud SQL への移行がさらに簡単かつシームレスになりました。Oracle から AlloyDB または Cloud SQL に移行するときに、Gemini によるコードとスキーマの変換アシスト機能が利用可能になりました。
DMS には、公開プレビュー版で同種の SQL Server の Cloud SQL（SQL Server）への移行サポートが含まれるようになりました。お客様は、セルフマネージド SQL Server インスタンスと RDS SQL Server インスタンスを Cloud SQL に移行できます。
DMS は、Cloud SQL for PostgreSQL と AlloyDB for PostgreSQL の両方へのより高速な PostgreSQL の移行をサポートするようになりました。
Cloud SQL for MySQL への同種移行および Cloud SQL for PostgreSQL への同種移行用の DMS で、読み取りレプリカが有効になっている既存の宛先インスタンスへの移行がサポートされるようになりました。
DMS は、MySQL データベースを Cloud SQL MySQL に移行するための Percona Xtrabackup を公開プレビュー版でサポートするようになりました。

Datastream

Datastream は、Google Cloud 上でデータを移動するためのサーバーレスの変更データキャプチャ（CDC）およびレプリケーションサービスです。

Datastream は追加専用モードをサポートするようになりました。追記専用モードでは、BigQuery の INSERT、UPDATE、DELETE のイベントをそれぞれ個別の行としてキャプチャできるため、監査証跡や傾向分析などのユースケースが可能になります。
ソースとしての SQL Server は現在、公開プレビュー版が提供されています。これにより、SQL Server のデータを BigQuery、Cloud Storage、AlloyDB、Spanner など複数の Google Cloud サービスに複製できます。