コンテンツに移動
データベース

Intelligencia AI が Cloud SQL を活用してデプロイ時間を短縮

2024年2月16日
Google Cloud Japan Team

Try Gemini 1.5 Pro

Google's most advanced multimodal model in Vertex AI

Try it

※この投稿は米国時間 2024 年 2 月 6 日に、Google Cloud blog に投稿されたものの抄訳です。

編集者注: Intelligencia AI は、AI を活用したさまざまなソリューションで製薬分野のビジネスを支援しています。情報に基づいたデータドリブンの意思決定を行い、臨床開発のリスクを軽減できるように取り組んでいます。 ヘルステック企業では品質が重視され、また処理に関する要件も複雑です。加えてデータの量が急増していることもあり、堅牢でスケーラビリティに優れた、信頼性の高いデータベースが求められるようになっています。シームレスな統合が可能で、可用性に優れ、自動のバックアップ機能を備えた Cloud SQL for PostgreSQL Enterprise Plus エディションは、データの保存と管理を効率的かつリアルタイムで行える強力なツールとして、Intelligencia AI を支援しています。

Intelligencia AI は、ML アルゴリズムの臨床開発での使用における草分け的存在です。高品質の専用設計データ、独自のオントロジー、エキスパートによるキュレーションと自動化を活用して、FDA 認証を得られるかどうかについての確率を医薬品開発プロセスの早期の段階から正確に予測できるようにしています。私たちはこれまで、Compute Engine 上の独自の PostgreSQL データベースでデータを管理していましたが、これは、Intelligencia AI の初期段階においてはうまく機能していました ただ、データの要件が複雑になるに従い、バージョンの更新やデータベースのスナップショットを復元するための特殊なスクリプトの開発に時間や手間をかけなければならなくなりました。

健全なデータ インフラストラクチャの必要性

私たちは、スムーズなプロダクト デプロイを少ないエンジニアリングの労力で高頻度で実現できるマネージド データベースを探すことにしました。そのようなソリューションであれば、リソースの再割り当てやコスト効率の改善が可能となり、私たちのビジネス目標を達成できます。またこのソリューションに関しては、複数のソースからのデータを収集できるのと同時に、データを最新の状態に維持して重複を削除し、データの一貫性を保てることが理想でした。

Cloud SQL は、まさに私たちが求めていたものでした。Cloud SQL により得られる利点は魅力的であり、Cloud SQL for PostgreSQL Enterprise Plus エディションへのアップグレードに関して迷うことはありませんでした。データベース インスタンス オペレーションを管理するための包括的な API が提供されており、これを利用して、バックアップや復元、リソースの再スケーリング、新しいインスタンスの作成や削除、一般的な構成などのさまざまなオペレーションを実行するカスタム スクリプトを作成できます。複数のデータベース インスタンスにバックアップを簡単に復元できるため、使い慣れたネットワークで作業を行うことができます。また、コンピューティング ニーズ、クエリの負荷、トラフィックなどに応じて、リソースを柔軟に変更することもできます。

マネージド データベース サービスへの手間のかからない移行

Google のマネージド データベースへの移行はシームレスで、期待どおりでした。新しいマネージド インスタンスの設定後すぐに、直近のバックアップの復元を行い、徹底的な回帰テストとパフォーマンス テストを実施しました。

このテスト段階で私たちは、コンピューティング負荷の高いマイクロサービスのひとつでパフォーマンスの大幅な低下が発生していたことに気づきました。その原因は、そのワークロードに合わせて特別に最適化されたコンピューティング インスタンスに依存していたことでした。幸運なことに、パフォーマンスが最適化された N-family CPU を利用してこの問題に対処することができました。これは、Enterprise Plus エディションを利用できたおかげです。

その他のパフォーマンス上の懸念事項がないことを確認してから、すべてのサービスを更新して、新しいデータベースに接続しました。

マネージド データベース サービスこそが最適な手段

今では、Cloud SQL for PostgreSQL Enterprise Plus を活用して技術的および規制上の成功確率(PTRS)の AI ドリブンの予測に必要となる信頼性とスケーラビリティを達成し、正確で透明性のある結果をお客様に提供できています。

内部および顧客向けの両方で、SaaS プラットフォームのマネージド データベースに大きく依存しており、これが、Intelligencia AI の価値をお客様に届けるための方法として機能しています。また、スケーラブルで柔軟な SaaS ソリューションを利用して、継続的なデータ デプロイメントを実現し、品質の検証チェックでデータの整合性を維持し、プログラムによるシームレスなデータ利用のための API を実装しています。

私たちの価値提案は高品質データと AI 予測の確かな精度に依存するところが大きく、そのためデータベースの信頼性と管理のしやすさがきわめて重要になります。特に、顧客向けソリューションに関してはデータを高頻度で更新することが要求されるため、日常的に発生する計算、テスト、デプロイを、人間による介入を最低限に抑えて行う必要があります。Cloud SQL を活用することでこの要件を簡単に満たすことができるようになり、バックアップやインスタンスの復元などのタスクを容易にして、データの特定のバージョンのスナップショットの維持と推進を CI / CD プロセスの一貫として行えるようになっています。さらに、リソースのスケーリングとネットワーク構成の修正を簡単に行えるため、日々発生するオペレーションで俊敏性と効率性を維持できるようになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Intelligencia_AI.max-1900x1900.png

Cloud SQL でデプロイにかかる時間と労力を減らす

今では、Google Cloud SQL で達成できるであろうと考えていたこと以上のことを達成できています。

  • 機能環境のデプロイを自動化し、バックアップの復元機能を活用することで、運用上のオーバーヘッドを大幅に削減し、機能環境のデプロイにかかる時間を 50% 削減できました。
  • セルフマネージドのソリューションと比較した場合で、データが投入された完全に機能するデータベースの設定と破棄にかかる時間と労力を大幅に減らすことができました。
  • 複数のインスタンスにバックアップを復元できる機能は必要不可欠なものです。この機能のおかげで、ETL パイプラインにより生成されるデータを継続的に本番環境インスタンスにデプロイできるようになります(上記の Blue/Green デプロイの図をご覧ください)。

私たちの目標は、データベースの柔軟性を最大限にまで高め、ビジネスおよび技術上のデータ関連のあらゆるニーズに応えられるようにすることです。ダウンタイムの発生しないアジャイルなデプロイ手法であれ、アドホックの機能テスト環境であれ、データの準備が整ったデータベースを簡単に、自動化されたプラグアンドプレイの手法で構築できるようにすることを目指しています。

幸運なことに、Google Cloud データベースには、このようなことをスケーラブルな手法で行うためのツールがすでに備わっています。たとえば、最近追加されたエディション間の復元のおかげで、Enterprise エディションと Enterprise Plus エディションの異なるリソースが混在している場合でも、これをプロダクトのリソースのニーズに最適化して調査できるようになりました。これは、リソースを大量に消費する計算ワークロードに Enterprise Plus を使用し、読み取りに最適化されたワークロードに Enterprise エディションを使用することで達成されます。また、pgvector 拡張機能のサポートが追加されたことで、ベクトル エンベディング / ベクトル類似のユースケースで Google Cloud SQL データベースをベクトル データベースとして活用できるようになりました。

Google Cloud データベースによりリリースされる最新の機能をいち早く活用し、機能を継続的に強化し、サービスを改善できています。

使ってみる:

-Intelligencia AI、プリンシパル データ エンジニア Alberto Benroubi 氏

-Intelligencia AI、シニア DevOps エンジニア Michael Tsoukatos 氏

投稿先