Google Cloud Next '21 の「データ分析戦略とロードマップ」セッションをオンデマンドでご覧ください。

Datasets

BigQueryCloud StorageEarth Engine などの Google Cloud サービスが提供するビルド済みのデータ ソリューションや貴重なデータセットを使って、分析や AI イニシアチブを強化しましょう。

データ エコシステムを拡大する

外部データを使用して分析や AI のイニシアチブを強化すると、データアセットの価値を高めることができますGoogle、パブリック プロバイダ、または商用プロバイダからのユニークで価値のあるデータセットや事前構築済みのソリューションを見つけてアクセスします。フルマネージドのデータ パイプラインを使用すると、最も重要なこと、つまり洞察とビジネス価値の提供に集中できます。

Google の一般公開データセットの詳細

カテゴリ 注目のデータセット サンプルクエリ、ユースケース、ソリューション
Google データセット

このデータセットを使用して、過去 30 日間の Google トレンドでの上位 25 件の検索トレンドと上位 25 件の急上昇ワードを表示します。各キーワードには、米国の 210 の指定マーケット エリア(DMA)の 5 年間の履歴データが含まれます。

  • check_circle_filled_black_24dp (1)

    ニュース / ラジオ放送分野のリスナーの関心事は何ですか?

  • check_circle_filled_black_24dp (1)

    利用可能な最新のデータについて、米国の上位の検索キーワードは何ですか?

  • check_circle_filled_black_24dp (1)

    付近で検索された特に人気の小売商品は何ですか?

コミュニティ モビリティ レポート

このデータセットは、COVID-19 の感染対策の指針に合わせて、どのような変化が起きているかを探ることを目的としています。小売店やレクリエーション、食料品店や薬局、公園、交通機関の駅、職場、住宅など、さまざまなカテゴリーの場所について、地理的に長期にわたる移動傾向を報告しています。

  • check_circle_filled_black_24dp (1)

    サンフランシスコの外出禁止令は小売店にどのような影響を及ぼしましたか?

  • check_circle_filled_black_24dp (1)

    ユースケース: 週末の小売トラフィックの違いを特定する

Google アナリティクス(サンプル)

このデータセットは、Google ブランドの商品を販売する実在の e コマースストア、Google Merchandise Store の 12 か月間(2016 年 8 月から 2017 年 8 月)の難読化された Google アナリティクス 360 データを提供します。このデータは、e コマースサイトで表示される一般的なデータであり、トラフィック ソース データ、コンテンツ データ、トランザクション データが含まれます。

Google Patents Research

Google Patents Research Data には、Google 翻訳によるタイトルや抄録の機械翻訳、埋め込みベクター、抽出されたトップターム、類似文書、前方参照など、Google 特許検索(patents.google.com)で使用されているデータ分析作業の多くが出力されています。

  • check_circle_filled_black_24dp (1)

    ここ最近出願された 20 件の特許にはどんなものがありますか?

  • check_circle_filled_black_24dp (1)

    Fortune 500 に名を連ねる企業のうち、2017 年から 2019 年まで継続的に特許を出願したのはどの企業ですか?  

公開データセット
Severe Storm Event Details

Storm Events Database は、1950 年から今年に至るまでの米国における気象イベントの大規模な統合型データベースです。暴風雨警報が発出された場所、方位角、距離、影響、重大度に関する情報が含まれています。(資産や作物の損害額を含む)

  • check_circle_filled_black_24dp (1)

    過去 15 年間に発生した台風のうち、最も大きな被害が発生したのは?

  • check_circle_filled_black_24dp (1)
  • check_circle_filled_black_24dp (1)

    ユースケース: 住宅リフォーム小売業者が台風により在庫が受ける影響を把握できる

Census Bureau US Boundaries

これは、米国国勢調査局が提供する地理情報プロダクトである TIGER/Line Shapefile から派生した完全解像度の境界ファイルで、米国 50 州、コロンビア特別区、プエルトリコ、および離島地域の情報が含まれています。

  • check_circle_filled_black_24dp (1)

    中心部から 10 km 圏内に公共の空港が最も多くあるのはどの都市ですか?

  • check_circle_filled_black_24dp (1)

    ユースケース: 小売業のための都市化インデックスの作成

American Community Survey

American Community Survey(ACS)は、全米の 350 万以上の世帯に対して毎年行われている、米国とそこに住む人々についての重要な情報を提供するアンケートです。得られたデータから、米国のあらゆる地域の人口統計を非常に詳細に分析できます。

  • check_circle_filled_black_24dp (1)

    所得の中央値に占める家賃の割合は、前年に比べてどう変化しましたか?  

  • check_circle_filled_black_24dp (1)

    ユースケース: 施設 / サイト選択分析の入力としての人口増加傾向

すべての一般公開データセット

Google Cloud Marketplace にある 200 以上のデータセットを検索してアクセスできます。

  • check_circle_filled_black_24dp (1)

    どのようなデータセットが、分析や AI ワークフローのより深いコンテキストを提供できますか?

商用データセット
Crux Informatics

Crux Deliver は、データ エンジニアリングとオペレーションのためのマネージド サービスです。Crux は、クライアントに代わって従来型データ プロバイダや代替データ プロバイダと連携し、オンボーディング、データ エンジニアリング、オペレーションのあらゆる側面を管理します。すべてのデータセットは検証され、クリーンで実用的なデータのみが提供されます。 

  • check_circle_filled_black_24dp (1)

    Crux がデータ エコシステムへのオンボーディングを支援してくれるデータセットは何ですか?

HouseCanary

1 億を超える住宅の信頼できる不動産情報、ローン情報、評価情報にアクセスできます。ML アルゴリズムでは、数百のデータソースを処理し、米国の住宅市場の 95 %以上をカバーする 381 の大都市圏、18,300 の地域、そして400 万ブロックの住宅価格指数を提供します。40 年間の過去の変動情報と今後 3 年間の予測に基づいて、投資判断を行います。

  • check_circle_filled_black_24dp (1)

    翌年の住宅価格が 3% 以上増加すると予測されている地域はどこですか?

  • check_circle_filled_black_24dp (1)

    特定の物件の価値を知りたい。

Earth Engine データセット
Earth Engine

Earth Engine の公開データ アーカイブには、40 年以上の履歴画像と科学データセットが含まれており、毎日更新され、オンラインで分析できます。

  • check_circle_filled_black_24dp (1)

    過去 30 年間で地表の表面温度はどのように変化しましたか?

  • check_circle_filled_black_24dp (1)

    2000 年以前のこの地域はどのような様子だったのでしょうか?

Kaggle データセット
Kaggle データセット

Kaggle には、データ サイエンス作業を行うために必要なコードとデータがすべて含まれています。80,000 以上の一般公開データセットと 400,000 以上の公開ノートブックを使用して、あらゆる分析をすばやく完了できます。

  • check_circle_filled_black_24dp (1)

    データ サイエンスにおける最も厄介で挑発的な問題に取り組むことができますか?

Synthetic データセット
Cymbal Investments

Synthetic データは、架空の Cymbal Investments グループによって管理されている自動取引ボットによる取引を表しています。各取引は単一のアルゴリズムを使用して、取引の意思決定を主導します。レコードは、BigQuery に読み込まれた FIX プロトコル(バージョン 4.4)の Trade Capture レポートから派生します。

  • check_circle_filled_black_24dp (1)

    トレーダーは個々の取引でどのくらいの利益を得ましたか?

Research データセット

Google のデータセット検索プログラムは、ウェブ全体から約 2,500 万のデータセットをインデックス登録し、1 か所でデータセットを検索して、そのデータへのリンクを見つけることができます。新しい順、形式、トピックなどでフィルタできます。 

  • check_circle_filled_black_24dp (1)

    <関心のあるキーワード> のデータセットにはどのようなものがありますか?

  • check_circle_filled_black_24dp (1)

    昨年から存在するサステナビリティのデータセットの中で、無料で商業利用が可能なものはどれですか?

カテゴリ

Google Cloud のソリューションを活用してみませんか。課題をともに解決しましょう。

Google Cloud のデータセットがデータとビルド済みソリューションでお客様の業務をどのように変革するかをご覧ください。
お問い合わせ
オンボーディングを希望する一般公開データセットがある場合は、public-data-help@google.com にお問い合わせください。

BigQuery サンドボックスを使用すると、請求先アカウントやクレジット カードなしで BigQuery のすべての機能をお試しいただけます。

データ パートナーと導入事例

データセット エコシステム(データ プロバイダとデータ コンシューマ)の両側から詳細を確認する。