Data Cloud Summit をオンデマンドで視聴し、分析、AI、BI、データベースの最新の技術革新についてご確認ください。

Datasets

BigQueryCloud StorageEarth Engine などの Google Cloud サービスが提供するビルド済みのデータ ソリューションや貴重なデータセットを使って、分析や AI イニシアチブを強化しましょう。

データ エコシステムを拡大する

外部データを使用して分析や AI のイニシアチブを強化すると、データアセットの価値を高めることができますGoogle、パブリック プロバイダ、または商用プロバイダからのユニークで価値のあるデータセットや事前構築済みのソリューションを見つけてアクセスします。フルマネージドのデータ パイプラインを使用すると、最も重要なこと、つまり洞察とビジネス価値の提供に集中できます。

Google の一般公開データセットの詳細

カテゴリ 注目のデータセット ユースケースと分析情報の例
Google データセット

このデータセットを使用して、過去 30 日間の Google トレンドでの上位 25 件の検索トレンドと上位 25 件の急上昇ワードを表示します。各期間には、米国の 210 の指定マーケット エリア(DMA)と現在 50 か国以上の 5 年間の履歴データが含まれます。

  • 付近で検索された特に人気の小売商品は何ですか?

コミュニティ モビリティ レポート

このデータセットは、小売店やレクリエーション、食料品店や薬局、公園、交通機関の駅、職場、住宅など、さまざまなカテゴリーの場所について、地理的に長期にわたる移動傾向を報告しています。

  • ユースケース: 週末の小売トラフィックの違いを特定する

Google アナリティクス(サンプル)

このデータセットは、Google Merchandise Store からの 12 か月間(2016 年 8 月~ 2017 年 8 月)の難読化された Google アナリティクス 360 のデータを提供し、トラフィック ソース、コンテンツ、トランザクション データなどの e コマースサイトに表示される内容を表示します。

  • デバイスのブラウザごとに生成されるトランザクションの合計数はどれくらいですか?

Google Patents Research

Google Patents Research Data には、Google 翻訳によるタイトルや抄録の機械翻訳、埋め込みベクター、抽出されたトップターム、類似文書、前方参照など、Google 特許検索(patents.google.com)で使用されているデータ分析作業の多くが出力されています。

  • ここ最近出願された 20 件の特許にはどんなものがありますか?

商用データセット
Crux Informatics

Crux Deliver は、データ エンジニアリングとオペレーションのためのマネージド サービスです。Crux は、クライアントに代わって従来型データ プロバイダや代替データ プロバイダと連携し、オンボーディング、データ エンジニアリング、オペレーションのあらゆる側面を管理します。すべてのデータセットは検証され、クリーンで実用的なデータのみが提供されます。 

  • Crux がデータ エコシステムへのオンボーディングを支援してくれるデータセットは何ですか?

Exchange Data International

Exchange Data International(EDI)は、世界中の金融および投資コミュニティが情報に基づいた意思決定を行うのを支援します。EDI の広範なコンテンツ データベースには、世界中の株式と債券の法人活動、配当、静的参照データ、終値、発行済み株式数が含まれます。

  • 普通株と ETF に影響する過去のイベントについて説明します。

Factset

FactSet は、優れた財務情報、分析アプリケーション、業界トップクラスのサービスを提供しているグローバル プロバイダであり、優れたコンテンツ、分析、柔軟なテクノロジーを提供します。

  • 合併取引に関するさまざまな見解をトラッキングして、投資プロセスを強化できます。

HouseCanary

1 億を超える住宅の信頼できる不動産情報、ローン情報、評価情報にアクセスできます。ML アルゴリズムでは、数百のデータソースを処理し、米国の住宅市場の 95 %以上をカバーする 381 の大都市圏、18,300 の地域、そして400 万ブロックの住宅価格指数を提供します。 

  • 過去 40 年間の変動や 3 年間の予測に基づいて、投資に関する決定を行います。

LinkUp

LinkUp は、正確でリアルタイムかつ予測可能な求人市場データと分析を提供するグローバル リーダーです。独自のデータ ソリューションにより、お客様は世界の労働市場に関する貴重な分析情報を導き出し、マクロ、セクター、地域、個別の企業レベルで投資家がアルファを創出できるよう支援します。

  • セクターレベルでジョブの成長を評価して予測するためのモデルとシグナルを作成します。

ロンドン エネルギー ブローカー協会(LEBA)

LEBA のソリューションを使用すると、主要なエネルギー ブローカー全体から、エネルギー市場の独自の全体像を把握できるようになります。エネルギー、石油、ガスの生産者、卸売ユーザー、公益事業、金融トレーダーは、価格評価ではなく取引活動に基づいた独立した市場情報を利用できます。

  • ヨーロッパ各国のエネルギー価格の把握

Neustar

TransUnion 傘下企業 Neustar, Inc. は、ID 解決のリーダーとして、最も重要な瞬間に企業と人々の間の信頼できるつながりを可能にするデータとテクノロジーを提供しています。Neustar は、マーケティング、リスク、コミュニケーションの分野で業界をリードするソリューションを提供しています。

  • 顧客データアセットの改善と、プライバシーを重視した消費者データベースの構築

RS Metrics

アセットレベル、リアルタイム、客観性、検証可能な ESG データで知られる大手企業である RS Metrics は、顧客が EV メーカーの工場の在庫レベルに関する正確な分析情報にアクセスできるようにします。

  • EV 車生産において、独立した、検証可能で客観的なベンチマークを作成します。

Ursa Space Systems

グローバルな衛星インテリジェンス インフラストラクチャ プロバイダである Ursa Space Systems は、週単位で更新される衛星画像から派生したデータを基に、世界の経済動向を顧客が監視できるようにします。

  • 石油価格ベンチマークの方向性と地域ごとの展開はどのようなものか。

公開データセット
Severe Storm Event Details

Storm Events Database は、1950 年から今年に至るまでの米国における気象イベントの大規模な統合型データベースです。暴風雨警報が発出された場所、方位角、距離、影響、重大度に関する情報が含まれています。(資産や作物の損害額を含む)

Census Bureau US Boundaries

これは、米国国勢調査局が提供する地理情報プロダクトである TIGER/Line Shapefile から派生した完全解像度の境界ファイルで、米国 50 州、コロンビア特別区、プエルトリコ、および離島地域の情報が含まれています。

  • ユースケース: 小売業のための都市化インデックスの作成

American Community Survey

American Community Survey(ACS)は、全米の 350 万以上の世帯に対して毎年行われている、米国とそこに住む人々についての重要な情報を提供するアンケートです。得られたデータから、米国のあらゆる地域の人口統計を非常に詳細に分析できます。

  • ユースケース: 施設 / サイト選択分析の入力としての人口増加傾向

すべての一般公開データセット

Google Cloud Marketplace にある 200 以上のデータセットを検索してアクセスできます。

  • どのようなデータセットが、分析や AI ワークフローのより深いコンテキストを提供できますか?

Earth Engine データセット
Earth Engine

Earth Engine の公開データ アーカイブには、40 年以上の履歴画像と科学データセットが含まれており、毎日更新され、オンラインで分析できます。

  • 過去 30 年間で地表の表面温度はどのように変化しましたか?

  • 2000 年以前のこの地域はどのような様子だったのでしょうか?

Kaggle データセット
Kaggle データセット

Kaggle には、データ サイエンス作業を行うために必要なコードとデータがすべて含まれています。80,000 以上の一般公開データセットと 400,000 以上の公開ノートブックを使用して、あらゆる分析をすばやく完了できます。

  • データ サイエンスにおける最も厄介で挑発的な問題に取り組むことができますか?

Synthetic データセット
Cymbal Investments

Synthetic データは、架空の Cymbal Investments グループによって管理されている自動取引ボットによる取引を表しています。各取引は単一のアルゴリズムを使用して、取引の意思決定を主導します。レコードは、BigQuery に読み込まれた FIX プロトコル(バージョン 4.4)の Trade Capture レポートから派生します。

  • トレーダーは個々の取引でどのくらいの利益を得ましたか?

Research データセット

Google のデータセット検索プログラムは、ウェブ全体から約 2,500 万のデータセットをインデックス登録し、1 か所でデータセットを検索して、そのデータへのリンクを見つけることができます。新しい順、形式、トピックなどでフィルタできます。 

  • <関心のあるキーワード> のデータセットにはどのようなものがありますか?

  • 昨年から存在するサステナビリティのデータセットの中で、無料で商業利用が可能なものはどれですか?

カテゴリ

Google Cloud のソリューションを活用してみませんか。課題をともに解決しましょう。

Google Cloud のデータセットがデータとビルド済みソリューションでお客様の業務をどのように変革するかをご覧ください。
お問い合わせ
オンボーディングを希望する一般公開データセットがある場合は、public-data-help@google.com にお問い合わせください。

BigQuery サンドボックスを使用すると、請求先アカウントやクレジット カードなしで BigQuery のすべての機能をお試しいただけます。

データ パートナーと導入事例

データセット エコシステム(データ プロバイダとデータ コンシューマ)の両側から詳細を確認する。