2024 年の Spanner: イノベーションの一年
Piyush Mathur
Group Product Manager
Jagdeep Singh
Director of Product management
※この投稿は米国時間 2024 年 12 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。
Spanner は、Google が提供するほぼ無制限のスケールが可能な常時稼働のデータベースで、Gmail、YouTube、Google フォトなどの世界規模のアプリケーションの基盤となっています。Google 以外でも、Spanner は Yahoo!、The Home Depot、Wayfair、Pokémon Go といった家庭向けブランドの要求の厳しいワークロードを支えています。現在、Spanner が処理する秒間クエリ数は 40 億以上(ピーク時)、データ量は 15 エクサバイトを超え、99.999% の可用性とグローバルな整合性を実現しています。
2012 年の発表以来、Spanner は画期的な分散型 SQL データベースから、多用途でインテリジェントなイノベーション プラットフォームへと進化してきました。2024 年は Spanner にとって大きな一年となり、複数のリリースによる機能拡張、コスト パフォーマンスの向上、再設計による最高水準の信頼性とセキュリティ、デベロッパー エクスペリエンスの強化が達成されました。今回は、2024 年に実現された、特に重要な Spanner のイノベーションとそのメリットを振り返ります。
1. マルチモデル: 1 つのデータベースで多くの可能性を実現
Spanner Graph、全文検索、ベクトル検索のリリースにより、Spanner は、高可用性、グローバルな整合性、スケーラビリティを兼ね備えたデータベースから、AI 対応アプリケーションを構築できるインテリジェントで相互運用可能な機能を備えたマルチモデル データベースへと進化しました。市場に出回っている他のマルチモデル データベースとは異なり、Spanner は異なるデータモデル間の相互運用性をダウンタイムなしで実現する真のマルチモデル エクスペリエンスを提供します。
Spanner のマルチモデル サポートによってデータベースを統合することで、コストを削減し、運用上のオーバーヘッド、ガバナンスの負担、セキュリティ タッチポイントを低減できます。また、相互運用性によってデータの移動が不要になることで、「真のゼロ ETL」エクスペリエンスを実現し、すべてのモデルでデータの整合性を確保できます。これにより、準リアルタイムの不正行為検出、サプライ チェーンの最適化、商品のレコメンデーションなどのユースケースに対応できます。
図 1: グラフモデル、リレーショナル モデル、ベクトルモデル、全文検索の使用がインターリーブされた Spanner の SQL クエリ
2. コスト パフォーマンスの向上
Spanner はコスト パフォーマンスに優れているため、大きな目標を立てながら小規模(月額 65 ドル~)から始めることができ、急激な変動なく直線的にスケールできます。2022 年にはノードあたりのストレージを 2 TB から 4 TB に増やし、2023 年にはさらに追加料金不要でスループットを 50% 向上、ストレージを 2.5 倍増量しました。
今年は、新しいマルチモデル機能をリリースし、新機能ごとに追加料金を請求することなく、これらの機能をシンプルに、優れた費用対効果で提供することを目指しました。そして、その結果誕生したのが Spanner の各エディションでした。この直感的なティアベースの価格設定アプローチでは、多様なニーズと予算に合わせてさまざまな機能をさまざまな価格で提供することで、柔軟性やコストの透明性の向上、さらなるコスト削減を可能にします。
3. Cassandra ワークロードのための新たな環境
Cassandra NoSQL データベースは、そのスピードとスケーラビリティが高く評価されています。一方で、複雑なクエリのサポートが限定的であることや、複雑な関係のモデル化が困難であることなどの制限もあります。Spanner は、NoSQL のスケーラビリティと可用性、従来のデータベースの強整合性とリレーショナル モデルを組み合わせ、両方のメリットを取り入れます。
今年は、Cassandra to Spanner Proxy Adapter がリリースされました。これは、アプリケーション ロジックをほぼ変更せず、Cassandra ワークロードをこれまで以上に簡単に Spanner に移行するための、オープンソースのプラグアンドプレイ ツールです。Yahoo! や Reltio などのお客様は Cassandra Proxy Adapter の使いやすさに満足されており、Google Cloud は今後も他のお客様が Spanner で Cassandra をさらに活用できるよう支援していきます。
4. 生成 AI と Spanner のエコシステム
この 1 年間で、組織における生成 AI の活用方法は大きく変化しました。ただし、生成 AI にはハルシネーションのリスクが伴います。Google Cloud は、トランザクション データベースや分析データベースがこのリスクを低減し、基盤モデルとエンタープライズ生成 AI アプリのギャップを解消できると考えています。この実現方法は、以下のとおりです。
-
ベクトル サポート: Spanner のベクトル サポートにより、デベロッパーはデータベースに保存されたベクトル エンベディングに対して類似検索を実行できます。Spanner ベクトル検索は、厳密最近傍(KNN)検索と近似最近傍(ANN)検索の両方をサポートしており、Google のスケーラブルな最近傍(ScaNN)検索アルゴリズムを活用するさまざまなワークフローに対応する柔軟性を実現し、大規模なデータセットでも高速かつ正確に結果を提供します。Spanner は現在、100 億を超えるベクトルにスケーリング可能なベクトル検索をサポートしています。デベロッパーは、ベクトル検索を標準の SQL クエリやグラフ GQL クエリと組み合わせて、RAG アプリケーションなどのユースケースに使用できます。
-
BigQuery と Spanner の連携によるメリット: Spanner と BigQuery の新しい画期的なインテグレーションにより、企業は運用ワークロードと分析ワークロードを接続し、貴重な分析情報を活用して、意思決定を改善できます。BigQuery の Spanner 外部データセットにより、データを移動または複製しなくても、Spanner に存在するトランザクション データに対するクエリを BigQuery 内で直接実行できます。Spanner では、BigQuery から Spanner にデータをエクスポートする BigQuery からのリバース ETL もサポートされ、BigQuery で提供される分析情報を運用化できるようになりました。
5. 信頼性、可用性、セキュリティ、ガバナンス
Spanner のお客様は、ミッション クリティカルなワークロードに対して最高レベルの信頼性、可用性、セキュリティ、ガバナンス コントロールを期待しています。今年は、可用性 SLA の改善、マルチリージョン ワークロードのアプリケーション パフォーマンスの向上、ガバナンス要件への対応を支援するために、デュアルリージョン構成と地域別パーティション分割のサポートが開始されました。
-
デュアルリージョン サポート: Spanner のデュアルリージョン構成により、地域のデータ所在地要件を満たしながら、リージョンが 2 つのみの地域で 99.999% の可用性を実現し、目標復旧時点(RPO)ゼロを保証します。
-
地域別パーティション分割: 世界中のテーブルデータを行レベルで分割し、ユーザーに近い場所でデータを提供できます。地域別パーティション分割により、ゲーム、e コマース、金融サービスなどの業界に属する Spanner のお客様が、アプリケーション レイテンシの短縮、コストの最適化、データ所在地(特定の地域内への機密性の高いユーザーデータの保存など)に関するメリットをユーザーに提供できます。
最後に、Spanner データをより低コストで簡単にバックアップできるよう、増分バックアップとスケジュール バックアップのサポートを開始しました。
6. デベロッパー エクスペリエンス
Google Cloud は、Spanner を含む Google Cloud のデータベースを基盤とするアプリケーションを非常にシンプルに構築、管理できるようにすることを目指しています。
-
Protobuf の改善: プロトコル バッファ(Protobuf)は、言語に依存せずにデータ構造をエンコードおよびデコードして、転送と保存を効率化する手段です。Spanner で Protobuf 値を管理し、事前にテーブルに正規化することなく、SQL のドット演算子(dimensions.size.width など)を使用してそれらのフィールドにアクセスできるようになりました。これにより、Protobuf 内の特定の値によるフィルタ、グループ化、並べ替えが必要なクエリの記述が大幅に簡素化されます。
-
トラブルシューティングと Database Center のサポート: Database Center は、さまざまなデータベース サービスをモニタリング、管理するための、AI 搭載の統合データベース管理ソリューションです。今年は、お客様が Database Center で Spanner データベースを管理できるようになりました。また、パフォーマンス上の問題のトラブルシューティングを容易にするために、エンドツーエンドのトレースとクライアント トレースのサポートも追加されました。
Google Cloud は、2024 年にお客様に提供してきたイノベーションを誇りに思っており、お客様が Spanner で構築する革新的なソリューションを楽しみにしています。このイノベーションはまだ始まったばかりであり、2025 年にはさらに多くの魅力的な機能の提供が予定されていることは言うまでもありません。
使ってみる
Spanner の独自性や使用例について詳しくは、こちらをご覧ください。また、90 日間無料で、あるいは月額わずか 65 米ドルから、中断を伴う再構築やダウンタイムなしでビジネスの成長に合わせて拡張できる、プロダクション レディなインスタンスをお試しください。