データ分析

BigQuery 特集: ブログシリーズ

Data Analytics B1

※この投稿は米国時間 2020 年 10 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。文中で紹介している各ブログへのリンクを、全て日本語版ブログへのリンクに訂正し、本ポストを再投稿しております。

BigQuery は、大規模かつ迅速な動作が可能になるサーバーレス アーキテクチャを採用した、独自の分析用データ ウェアハウス サービスと位置付けられていて、大規模なデータセットに対し驚くべき速度で SQL 解析を実行できます。BigQuery の概念や機能、改良点を説明する新しいブログシリーズ、「BigQuery 特集」が始まります。本ブログ投稿は同シリーズのホームページで、いつでも参照できるように既存の投稿や今後の投稿へのリンクが記載されています。このシリーズのブログ投稿へのリンクはこちら:


  1. 概要: この投稿では、「データ ウェアハウスによってビジネス上の意思決定が変わる」、「従来のデータ ウェアハウスの問題を BigQuery で解決する」や「BigQuery アーキテクチャの概要」、「BigQuery の使用をすぐに開始するには」などのトピックについて簡潔に紹介していきます。

  2. ストレージの概要: この投稿では、BigQuery のストレージ構成や保存形式について説明するほか、最適なパフォーマンスのためのデータのパーティショニングやクラスタ化をご紹介します。

  3. データの取り込み: この投稿では、BigQuery への各種データ取り込み方法について解説します。この投稿では、バッチの取り込み方について説明するほか、ストリーミング、データ移転サービス、クエリのマテリアル化をご紹介します。

  4. データのクエリ: この投稿では、BigQuery を使ったデータのクエリ、SQL クエリのライフサイクル、標準ビューと実体化されたビュー、クエリの保存と共有について説明します。

  5. 結合データ、繰り返しおよびネストされたデータの処理: この投稿では、BigQuery を使った結合、結合パターンの最適化、ネストフィールドと繰り返しフィールドを使うデータの非正規化について解説します。

BigQuery の機能や概念を扱った記事もまもなく公開されます。

今後の情報にご注目ください。ご精読ありがとうございました。質問がある場合やチャットを希望する場合は、Twitter または LinkedIn でアクセスしてください。

この投稿に協力してくれた Alicia Williams に感謝します。

-Cloud カスタマー エンジニア、機械学習スペシャリスト Rajesh Thallam