データセット

BigQueryCloud StorageEarth Engine などの Google Cloud サービスが提供するビルド済みのデータ ソリューションや貴重なデータセットを使って、分析や AI イニシアチブを強化しましょう。

データ エコシステムを拡大する

外部データを使用して分析や AI のイニシアチブを強化すると、データアセットの価値を高めることができます。Google、パブリック プロバイダ、または商用プロバイダからのユニークで価値のあるデータセットや事前構築済みのソリューションを見つけてアクセスしましょう。フルマネージドのデータ パイプラインを使用すると、最も重要なこと、つまり洞察とビジネス価値の提供に集中できます。

Google の一般公開データセットの詳細

注目のデータセット

Category注目のデータセットユースケースと分析情報の例
Google データセット
Google トレンドのロゴ

このデータセットを使用して、過去 30 日間の Google トレンドでの上位 25 件の検索トレンドと上位 25 件の急上昇ワードを表示します。各期間には、米国の 210 の指定マーケット エリア(DMA)と現在 50 か国以上の 5 年間の履歴データが含まれます。

  • 付近で検索された特に人気の小売商品を把握する。

棒グラフの画像

このデータセットは、Google Merchandise Store で収集された 12 か月間(2016 年 8 月~ 2017 年 8 月)の難読化された Google アナリティクス 360 のデータを提供し、トラフィック ソース、コンテンツ、トランザクション データなど e コマースサイトで収集されるデータを表示します。

  • デバイスのブラウザごとに生成されるトランザクションの合計数はどれくらいを把握する。

Google 特許検索のアイコン

Google Patents Research Data には、Google 翻訳によるタイトルや抄録の機械翻訳、埋め込みベクトル、抽出された上位のキーワード、類似文書、前方参照など、Google 特許検索(patents.google.com)で使用されたデータ分析作業の多くの出力が含まれています。

  • ここ最近出願された 20 件の特許にはどんなものがありますか?

商用データセット
Crux ロゴ

Crux Deliver は、データ エンジニアリングとオペレーションのためのマネージド サービスです。Crux は、クライアントに代わって従来型データ プロバイダや代替データ プロバイダと連携し、オンボーディング、データ エンジニアリング、オペレーションのあらゆる側面を管理します。すべてのデータセットは検証され、クリーンで実用的なデータのみが提供されます。

  • Crux がデータ エコシステムへのオンボーディングを支援してくれるデータセットとは。

Exchange Data International ロゴ

Exchange Data International(EDI)は、世界中の金融および投資コミュニティが情報に基づいた意思決定を行えるよう支援します。EDI の広範なコンテンツ データベースには、世界中の株式と債券にかかわるコーポレートアクション、配当、静的参照データ、終値、発行済み株式数が含まれます。

  • 普通株と ETF に影響する過去のイベントについて把握する。

Factset ロゴ

FactSet は、総合的な財務情報、分析アプリケーション、業界トップクラスのサービスを提供しているグローバル プロバイダであり、優れたコンテンツ、分析、柔軟なテクノロジーを提供します。

  • 合併取引に関するさまざまな見解をトラッキングして、投資プロセスを強化する。

HouseCanary のロゴ

1 億軒を超える住宅の信頼できる不動産情報、ローン情報、評価情報にアクセスできます。ML アルゴリズムでは、数百のデータソースを処理し、米国の住宅市場の 95 %以上をカバーする 381 の大都市圏、18,300 の地域、そして400 万ブロックの住宅価格指数を提供します。

  • 過去 40 年間の変動や 3 年間の予測に基づいて、投資に関する決定を行う。

Linkup ロゴ

LinkUp は、求人市場の正確でリアルタイムかつ予測可能なデータと分析を提供するグローバル リーダーです。独自のデータ ソリューションにより、お客様が世界の労働市場に関する貴重な分析情報を導き出し、投資家がマクロ、セクター、地域、個別の企業レベルでアルファ値を創出できるよう支援します。

  • セクターレベルでジョブの成長を評価して予測するためのモデルとシグナルを作成する。

Leba ロゴ

LEBA のソリューションを使用すると、主要なエネルギー ブローカー全体から、エネルギー市場の独自の全体像を把握できるようになります。エネルギー、石油、ガスの生産者、卸売ユーザー、公益事業、金融トレーダーは、価格評価ではなく取引活動に基づいた独立した市場情報を利用できます。

  • ヨーロッパ各国のエネルギー価格の把握

Neustar ロゴ

TransUnion 傘下企業 Neustar, Inc. は、ID 解決のリーダーとして、最も重要な瞬間に企業と人々の間の信頼できるつながりを可能にするデータとテクノロジーを提供しています。Neustar は、マーケティング、リスク、コミュニケーションの分野で業界をリードするソリューションを提供しています。

  • 顧客データアセットの改善と、プライバシーを重視した消費者データベースの構築

RS metrics ロゴ

アセットレベルのリアルタイムで客観的、検証可能な ESG データで知られる大手企業 RS Metrics は、EV メーカーの工場の在庫レベルに関する正確な分析情報へのアクセスを提供します。

  • EV 車生産において、独立した、検証可能で客観的なベンチマークを作成する。

UrsaSpace ロゴ

グローバルな衛星インテリジェンス インフラストラクチャ プロバイダである Ursa Space Systems は、週単位で更新される衛星画像から派生したデータを基に、世界の経済動向を顧客が監視できるようにします。

  • 石油価格ベンチマークの方向性と地域ごとの展開はどのようなものかを把握する。

一般公開データセット
NORA ロゴ

Storm Events Database は、1950 年から今年に至るまでの米国における気象イベントの大規模な統合型データベースです。暴風雨警報が発出された場所、方位角、距離、影響、重大度に関する情報が含まれています。(資産や作物の損害額を含む)

米国商務省のロゴ

これは、米国国勢調査局が提供する地理情報プロダクトである TIGER/Line Shapefile から派生した完全解像度の境界ファイルで、米国 50 州、コロンビア特別区、プエルトリコ、および離島地域の情報が含まれています。

  • ユースケース: 小売業のための都市化インデックスの作成

米国商務省国勢調査局のロゴ

American Community Survey(ACS)は、全米の 350 万以上の世帯に対して毎年行われている、米国とそこに住む人々についての重要な情報を提供するアンケートです。得られたデータから、米国のあらゆる地域の人口統計を非常に詳細に分析できます。

  • ユースケース: 施設 / サイト選択分析の入力としての人口増加傾向

Google Cloud Marketplace ロゴ

Google Cloud Marketplace にある 200 以上のデータセットを検索してアクセスできます。

  • どのようなデータセットが、分析や AI ワークフローのより深いコンテキストを提供できますか?

Earth Engine データセット
Earth Engine アイコン

Earth Engine の公開データ アーカイブには、40 年以上の履歴画像と科学データセットが含まれており、毎日更新され、オンラインで分析できます。

  • 過去 30 年間で地表の表面温度はどのように変化しましたか?

  • 2000 年以前のこの地域はどのような様子だったのでしょうか?

Kaggle データセット
Kaggle ロゴ

Kaggle には、データ サイエンス作業を行うために必要なコードとデータがすべて含まれています。80,000 以上の一般公開データセットと 400,000 以上の公開ノートブックを使用して、あらゆる分析をすばやく完了できます。

  • データ サイエンスにおける最も厄介で挑発的な問題に取り組むことができますか?

Synthetic データセット
Cymbal ロゴ

Synthetic データは、架空の Cymbal Investments グループによって管理されている自動取引ボットによる取引を表しています。各取引は単一のアルゴリズムを使用して、取引の意思決定を主導します。レコードは、BigQuery に読み込まれた FIX プロトコル(バージョン 4.4)の Trade Capture レポートから派生します。

  • トレーダーは個々の取引でどのくらいの利益を得ましたか?

Research データセット
Google ロゴ

Google のデータセット検索プログラムは、ウェブ全体から約 2,500 万のデータセットをインデックス登録し、1 か所でデータセットを検索して、そのデータへのリンクを見つけることができます。新しい順、形式、トピックなどでフィルタできます。 

  • <関心のあるキーワード> のデータセットにはどのようなものがありますか?

  • 昨年から存在するサステナビリティのデータセットの中で、無料で商業利用が可能なものはどれですか?

注目のデータセット

Google トレンドのロゴ

このデータセットを使用して、過去 30 日間の Google トレンドでの上位 25 件の検索トレンドと上位 25 件の急上昇ワードを表示します。各期間には、米国の 210 の指定マーケット エリア(DMA)と現在 50 か国以上の 5 年間の履歴データが含まれます。

  • 付近で検索された特に人気の小売商品を把握する。

Crux ロゴ

Crux Deliver は、データ エンジニアリングとオペレーションのためのマネージド サービスです。Crux は、クライアントに代わって従来型データ プロバイダや代替データ プロバイダと連携し、オンボーディング、データ エンジニアリング、オペレーションのあらゆる側面を管理します。すべてのデータセットは検証され、クリーンで実用的なデータのみが提供されます。

  • Crux がデータ エコシステムへのオンボーディングを支援してくれるデータセットとは。

NORA ロゴ

Storm Events Database は、1950 年から今年に至るまでの米国における気象イベントの大規模な統合型データベースです。暴風雨警報が発出された場所、方位角、距離、影響、重大度に関する情報が含まれています。(資産や作物の損害額を含む)

Earth Engine アイコン

Earth Engine の公開データ アーカイブには、40 年以上の履歴画像と科学データセットが含まれており、毎日更新され、オンラインで分析できます。

  • 過去 30 年間で地表の表面温度はどのように変化しましたか?

  • 2000 年以前のこの地域はどのような様子だったのでしょうか?

Kaggle ロゴ

Kaggle には、データ サイエンス作業を行うために必要なコードとデータがすべて含まれています。80,000 以上の一般公開データセットと 400,000 以上の公開ノートブックを使用して、あらゆる分析をすばやく完了できます。

  • データ サイエンスにおける最も厄介で挑発的な問題に取り組むことができますか?

Cymbal ロゴ

Synthetic データは、架空の Cymbal Investments グループによって管理されている自動取引ボットによる取引を表しています。各取引は単一のアルゴリズムを使用して、取引の意思決定を主導します。レコードは、BigQuery に読み込まれた FIX プロトコル(バージョン 4.4)の Trade Capture レポートから派生します。

  • トレーダーは個々の取引でどのくらいの利益を得ましたか?

Google ロゴ

Google のデータセット検索プログラムは、ウェブ全体から約 2,500 万のデータセットをインデックス登録し、1 か所でデータセットを検索して、そのデータへのリンクを見つけることができます。新しい順、形式、トピックなどでフィルタできます。 

  • <関心のあるキーワード> のデータセットにはどのようなものがありますか?

  • 昨年から存在するサステナビリティのデータセットの中で、無料で商業利用が可能なものはどれですか?

このソリューションを活用して課題をともに解決しましょう。

Google Cloud のデータセットがデータとビルド済みソリューションでお客様の業務をどのように変革するかをご覧ください。
オンボーディングを希望する一般公開データセットがある場合は、public-data-help@google.com にお問い合わせください。

BigQuery サンドボックスを使用すると、請求先アカウントやクレジット カードなしで BigQuery のすべての機能をお試しいただけます。

データ パートナーと導入事例

データセット エコシステム(データ プロバイダとデータ コンシューマ)の両側から詳細を確認する。