コンテンツに移動
金融サービス

Google Cloud で使用許可取得済みの市場データを検出、アクセス、分析する金融サービス向けの Datashare ソリューションのご紹介

2021年6月2日
https://storage.googleapis.com/gweb-cloudblog-publish/images/gcp_datashare.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2021 年 5 月 27 日に、Google Cloud blog に投稿されたものの抄訳です。

クラウドにアクセスできるようになったことにより、世界規模での財務情報の配信と利用が促進されました。同時に、ソーシャル メディアや気象データ、衛星画像などのデータを含む代替データソースの流入によって、金融データの世界状況は変容しつつあります。為替と市場のデータ プロバイダは、こうした新しいデータセットを組み込んで自社のサービスを充実させ、競争できるようにする必要があることに気付いています。つまり、市場データの消費を目的とした簡単かつ迅速でコスト効率の高い柔軟な方法を期待するお客様の要求にあわせて、クラウドベースのモデルを検討する必要があると認識しています。

これらのニーズに対応するために、本日は金融サービス向けの Datashare の一般提供についてお知らせします。この新しい Google Cloud ソリューションにより、資本市場のエコシステム全体(データ パブリッシャーとデータ コンシューマ)で市場データを安全かつ簡単に交換できるようになります。

Datashare は、サードパーティの財務情報を整理するのに役立ち、市場データのパブリッシャーとデータ コンシューマがその情報にアクセスして活用できるようにします。Google は Datashare ソリューション全体をオープンソース化したため、市場データのパブリッシャーは使用許可取得済みのデータセットを安全で迅速かつ簡単に Google Cloud にオンボーディングできます。一方データ コンシューマは、そのデータを BigQuery などの好みのツールでサービスとして利用できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_datashare.max-1200x1200.jpg

データを配信および使用する 3 つの方法

バッチデータの配信

Datashare はバッチデータ配信メカニズムを提供します。このメカニズムにより、データ パブリッシャーは BigQuery を介して参照データ、過去のティックデータ、代替市場データソースなどを配信でき、データ コンシューマがデータから分析情報を抽出するための管理上の負担が軽減されます。

リアルタイムのデータ ストリーミング配信

このイベントベースのデータ配信チャネルを使用して、時々刻々と変化する商品価格、ティックデータ、注文、ニュースなどを Pub/Sub 経由で受信することで、データ コンシューマは個々のメッセージをもれなく処理したり、特定の時点までさかのぼって以前の市場シナリオを再生し、モデルの変更をテストしたりできます。

使用許可取得済みのデータセットの収益化

市場データのパブリッシャーは、使用許可取得済みのデータセットを Google Cloud にオンボーディングし、それを Google Cloud Marketplace で一元的に利用できるようにして、新しい販売チャネルで市場範囲を拡大できます。

リファレンス アーキテクチャ

BigQuery と Pub/Sub を使用してバッチデータとリアルタイム データを Google Cloud のお客様と直接共有する方法については、以下の図でご確認ください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_datashare.max-700x700.jpg

上のリファレンス アーキテクチャからわかるように、パブリッシャーとコンシューマの両者ともに、このソリューションから複数のメリットを得られます。

データ パブリッシャーにとってのメリット

  • 独自の配信や使用許可のインフラストラクチャを維持する必要がなくなります。

  • SQL でより詳細なデータ製品やテストを簡単にパッケージ化して配信できます。

  • ビジネスの成長に伴うデータ量や顧客数の増加に合わせてスケールできるソリューションを提供できます。

データ コンシューマにとってのメリット

  • データをすぐに分析や機械学習(ML)に使用できます。ファイルを読み込んでデータを変換するための抽出、変換、読み込み(ETL)パイプラインを維持する必要がありません。

  • 大きいデータファイルのコピーを複数管理する費用と負担を回避できます。

  • BigQuery クエリを使用してデータを消費するターゲットを絞り、パフォーマンスとコンプライアンスを改善し、コストを削減できます。

データセットにアクセスする

Google Cloud は複数の業界企業と協力し、市場データ分野の革新に取り組んでまいりました。Datashare を使用して公開することで、データ パブリッシャーはデータセット全体を Google Cloud で利用可能にすることができます。Datashare の先行ユーザーとしては、OneTickAccern などの企業があります。OneTick のデータセットには、参照データと過去の先物データが含まれています(コンソールからログインしてアクセスできます)。Accern のデータセットには、市場センチメントや信用分析データなどの代替データが含まれています(コンソールからログインしてアクセスできます)。

より有効活用できるように、Google Cloud は Accern と提携し、データの取得と分析のプロセスを段階的に説明する架空のシナリオを作成しました。

Accern のユースケース

サステナビリティ アナリストが、アナリストに最も広く扱われている ESG セクターを特定し、ESG 感情スコアが最も低いセクターを特定するためには、経済、社会、ガバナンス(ESG)データセットが必要です。現在は、Google Cloud で ESG データセットを検出して取得できるようになりました。

ステップ 1. Google Cloud Console[金融サービス] ソリューション ページに移動します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_datashare.max-2000x2000.jpg

ステップ 2. Accern AI-Generated ESG Insights などのデータセットをクリックし、概要の詳細、プランと料金、ドキュメントとサポート情報を確認します。利用可能な料金ティアを表示するには、[すべてのプランを見る] をクリックします。登録するティアを決めたら、[選択] をクリックして請求先アカウントを選択し、利用規約を確認して同意して登録を完了します。手順が完了したら、一番下にある [登録] をクリックします。上に重なったウィンドウで、[Register with Accern] をクリックしてアクティブ化し、登録を完了します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_datashare.max-2000x2000.jpg
https://storage.googleapis.com/gweb-cloudblog-publish/images/5_datashare.max-2000x2000.jpg

ステップ 3. アクティベーションが完了すると、Datashare の [My Products] 画面に移動します。必要な操作は以上です。これで、Accern の ESG スコア データセットに登録し、Google Cloud インスタンスで BigQuery を使用してアクセスできるようになりました。データにアクセスするには、前のステップで購入した、対応する「My Products」レコードの砂時計アイコンをクリックします。オーバーレイには、データセットやテーブルの詳細が表示されます。[Navigate to Table] ボタンをクリックして、BigQuery コンソールに移動します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/6_datashare.max-2000x2000.jpg
https://storage.googleapis.com/gweb-cloudblog-publish/images/7_datashare.max-2000x2000.jpg
https://storage.googleapis.com/gweb-cloudblog-publish/images/8_datashare.max-2000x2000.jpg

ステップ 4. データにアクセスできるようになり、BigQuery コンソールが表示されているので、次はデータ分析情報を生成します。


この例では、サブスクリプションの一部として含まれる企業識別情報を削除し、各行が日、業種、特定の識別された「ESG 問題」(event_group と event)、問題ごとのそれぞれの「ESG 感情」を表すビューで企業 ESG を集計しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/9_datashare.max-1400x1400.jpg

たとえば、行 1 を見ると「Healthcare」セクター内で「Social - Civil Society」問題が特定され、負の ESG 感情スコアが -15.35 であることがわかります。

ステップ 5. データポータルにエクスポートしてレポートを生成し、可視化して ESG データの追加分析を行います。
https://storage.googleapis.com/gweb-cloudblog-publish/images/10_datashare.max-1500x1500.jpg

[エクスポート]、[データポータルで調べる] の順に選択します。

ステップ 6. シンプル / 基本的なレポートを作成します。

データポータルに ESG データが表示され、まず簡単なチャートを作成して、ESG に関する議論の量が最も多い業種や、業種ごとの全体的な ESG 感情を把握できます。

チャートを作成するには:

  • グラフの種類として「Table」を選択します。

  • 「業種」別に結果を集計するためのディメンションとして Entity_Sector を含めます。

  • 「業種」ごとに特定された ESG パッセージの数を数える指標として、Signal_ID を含めます。

  •  AVG(Event_Sentiment) を測定方法として含めて、ESG 問題全体の「業種」ごとの全体的な ESG 感情を表示します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/11_datashare.max-1700x1700.jpg

ESG 関連のトピックに関して最も議論されているセクターと、それに対応する「ESG Sentiment」スコアを確認できます。

ステップ 7. データポータルで最終レポートを作成します。

次のステップとして、データをさらに掘り下げて、各「業種」に固有の ESG データを把握し、ポジティブやネガティブな ESG 慣行を特定できます。

Accern は、より複雑なサンプル ダッシュボードを構築し、こちらで一般公開しています。このレポートを操作して、データをさまざまな切り口から表示することができます。ダッシュボードは、各セクターの重要な ESG 分析情報を特定して、投資とリスクのプロセスに情報を提供できます。その他の質問がある場合は、Accern に直接お問い合わせください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/12_datashare.max-1800x1800.jpg

使用許可取得済みのデータセットの検出、アクセス、分析はすばやく簡単にできます。使用許可取得済みの新しいデータセットの更新に関する情報に今後もご注目ください。

Datashare でデータを公開する

市場データ、代替データ、特殊データのパブリッシャーである場合、Datashare を使用して Google Cloud Marketplace で公開できます。

まず、Partner Advantage ポータルに登録し、Partner Advantage Build Model エンゲージメントに申し込んで、Partner Advantage プログラムにご参加ください。Marketplace で使用許可取得済みのデータセットの公開を開始するための情報については、スタートガイドをご覧ください。Datashare を使用して Marketplace でデータセットを公開する方法については、今後のブログ投稿で説明する予定です。

資本市場向けの他のソリューション

資本市場向けの他の Google Cloud ソリューションもご確認ください。

- Global Financial Services Strategy & Solutions Lead, Google Cloud, Christin Brown

投稿先