コンテンツに移動
パートナー

Google を活用した Nobl9 の信頼性 AI

2023年12月7日
Google Cloud Japan Team

※この投稿は米国時間 2023 年 12 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。

Google Cloud の AI テクノロジーを活用して SLO を定義および理解したいとお考えのお客様は、Nobl9 が新たに開発したツール SLOgpt.ai のおかげで、Vertex AI を使用してそれを実現できるようになりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Nobl9.max-2000x2000.png

Google のサイト信頼性エンジニアリング(SRE)チームは、SRE に関する書籍を数冊出版してサービスレベル目標(SLO)の普及に貢献しました。それ以来、最新の分散システムの健全性を理解するための SRE アプローチは、多くのチームにおける業務のモダナイゼーションに役立っています。Google Cloud のお客様は、パーソナライズされた SLO を定義することで、信頼性を犠牲にすることなく、また誤検知の追跡でチームを疲弊させることなく、テクノロジーを進化させ、顧客ベースを拡大することができます。SLO は、どの問題がカスタマー エクスペリエンスに直接悪影響を及ぼしているかをチームが理解するために役立つ、すばらしいインサイトです。しかし、信頼性の要件はお客様の期待に応じて常に変化し、目標設定における固有のトレードオフは初心者にとって直観的でないため、SLO の導入は困難な場合があります。適切な指標の特定と、SLO を効果的に使用するためのプロセスの開発は、プラグ アンド プレイ ソリューションのような簡単なものではなく、ビジネスをサポートするソフトウェア サービスの運用方法の変更も必要とします。

では、Cloud AI テクノロジーはより良い方法を提供できるでしょうか?具体的に挙げると、大規模言語モデル(LLM)は、大規模になる可能性がある構造化データと非構造化データのセットに対する有用でシンプルなインターフェースであることがわかっています。Google Cloud を使用して構築された Nobl9 の新しい LLM ベースのプロダクトである SLOgpt.ai は、このような疑問に答えるために構築され、自然な人間言語インターフェースを介してユーザーに専門家レベルのシグナル解釈を提供します。

LLM の力を使って SLO の理解を単純化できるとしたらどうでしょうか?

大規模な組織の信頼性を理解することは、適切なツールやデータが手元にあったとしても難しいものです。すべてのプロダクトやサブシステムを追跡するのは骨が折れる作業です。ツールと言えば、72% の企業がモニタリング ツールやオブザーバビリティ ツールを 6 つ以上も使用しています。これは多いように思えます。しかし、最新の DORA レポートが示すように、信頼性はソフトウェア デリバリーの重要な部分であり、高い組織的成果を達成するために必要なものです。

複数のチームが多くのプロダクトを構築、運用し、それぞれのプロダクトが多くの異なるサービスで構成されているような組織では、SLO が途方もない数になる可能性があります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Nobl9.max-2000x2000.png

意思決定者は、このような複雑なシステムを表現するために、すべてを平均化したり、「1 つの数字」を求めたりすることはできないことを知っています。しかし、意思決定者がチームのさまざまなモニタリング システムや報告システムの専門家になる必要はありません。代わりに、この増え続ける信頼性データへの人間言語インターフェースとして、AI を活用できます。

Google Cloud のパートナーである Nobl9 は、SLO に基づいた信頼性プラットフォームを開発しました。Nobl9 は昨年の SLOconf で、SLOgpt.ai と呼ばれる AI インターフェースを発表しました。SLOgpt.ai を使用すると、誰でも任意のグラフの画像をアップロードし、その曲線に応じた SLO を出力できます。さらに、得られた SLO、エラー バジェット、次に何をすべきかについて質問することができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_Nobl9.max-1800x1800.png
https://storage.googleapis.com/gweb-cloudblog-publish/images/4_Nobl9.max-800x800.png

本日は、Nobl9 が新たにリリースした Nobl9 Reliability Center をご紹介します。これにより、前述したサンプルの SLO だけでなく、実際のサービスに基づいたデータやモニタリング データとも、新しい方法で対話できるようになります。たとえば、GKE でサービスをセットアップしてから Google Cloud Monitoring を使ってモニタリングし、そのデータソースに対して Nobl9 で SLO を定義することで、サービスが 99.9% の可用性目標を達成しているかどうかを確認できます。

Nobl9 の顧客は、信頼性レポートと直接対話し、次のような質問をすることができます。

  • 最も低い SLO は?
  • エラー バジェットの範囲を超えている SLO は?
  • 最新の SLO は?
  • 現在のサービス信頼性は十分か?

この機能は Google Cloud の Vertex AI を活用して提供されています。お客様はどこでもアプリケーションを実行し(Cloud Run など)、Nobl9(Google Cloud 上で実行)を使って SLO を追跡し、その結果を SLOgpt で分析できます。

Google Cloud のお客様や Nobl9 などのパートナーは、Google のテクノロジーを活用して、世界中の顧客に信頼性の高いサービスを提供しています。

SLO と SLOgpt の詳細情報

- Google、信頼性アドボケイト Steve McGhee

- Nobl9、最高製品責任者 Brian Singer 氏

投稿先