BigQuery の概要

BigQuery は、ML、検索、地理空間分析、ビジネス インテリジェンスなどの組み込み機能を使用してデータの管理と分析を支援する、フルマネージドの AI 対応データ プラットフォームです。BigQuery のサーバーレス アーキテクチャを使用すると、SQL や Python などの言語を使用して、インフラストラクチャ管理なしで組織の最も大きな課題に対応できます。

BigQuery は、構造化データと非構造化データの両方を使用するための統一的な方法を提供するものであり、Apache Iceberg、Delta、Hudi などのオープン テーブル形式をサポートしています。BigQuery ストリーミングは、継続的なデータ取り込みと分析をサポートしています。BigQuery のスケーラブルな分散型分析エンジンを使用すると、数テラバイトのデータであれば数秒、数ペタバイトのデータであれば数分でクエリを実行できます。

BigQuery のアーキテクチャは、データを取り込み、保存、最適化するストレージ レイヤと、分析機能を提供するコンピューティング レイヤの 2 つの部分で構成されています。これらのコンピューティング レイヤとストレージ レイヤは、レイヤ間の必要な通信を可能にする Google のペタビット規模のネットワークにより、相互に独立して効率的に動作します。

一般的に以前のデータベースでは、読み取り / 書き込みオペレーションと分析オペレーションでリソースを共有する必要があります。これによりリソースの競合が発生し、データがストレージに書き込まれるとき、またはストレージから読み込まれるときにクエリが遅くなる可能性があります。権限の割り当てや取り消しなど、データベース管理タスクにリソースが必要な場合、共有リソースプールの負荷はさらに増大します。BigQuery では、コンピューティング レイヤとストレージ レイヤが分離されているため、他方のレイヤのパフォーマンスや可用性に影響を与えることなく、各レイヤでリソースを動的に割り当てることができます。

BigQuery アーキテクチャでは、ペタビット ネットワークを使用してリソースが分離されます。

この分離原則により、BigQuery はダウンタイムやシステム パフォーマンスへの悪影響なしに、ストレージとコンピューティングの改善を個別にデプロイできるため、より迅速にイノベーションを実現できます。また、BigQuery エンジニアリング チームが更新とメンテナンスを処理するフルマネージド サーバーレス データ ウェアハウスを提供することも不可欠です。結果として、リソースのプロビジョニングや手動スケーリングを行う必要がないため、従来のデータベース管理タスクではなく、価値の提供に集中できます。

BigQuery インターフェースには、Google Cloud コンソールのインターフェースと BigQuery コマンドライン ツールが含まれます。デベロッパーやデータ サイエンティストは、Python、Java、JavaScript、Go などの使い慣れたプログラミング言語でクライアント ライブラリを使用することも、BigQuery の REST API と RPC API でデータを変換、管理することもできます。ODBC ドライバと JDBC ドライバにより、サードパーティのツールやユーティリティなどの既存のアプリケーションとやり取りできるようになります。

データ アナリスト、データ エンジニア、データ ウェアハウス管理者、またはデータ サイエンティストであれば、BigQuery は、データを読み込み、処理、分析して、重要なビジネス上の意思決定を支援します。

BigQuery を使ってみる

BigQuery は数分で使い始めることができます。BigQuery の無料枠または無料サンドボックスを活用して、データの読み込みとクエリを開始できます。

  1. BigQuery のサンドボックス: BigQuery サンドボックスをリスクフリーかつ無料でご利用いただけます。
  2. Google Cloud コンソールクイックスタート: BigQuery Console の機能に慣れるようにします。
  3. 一般公開データセット: 一般公開データセット プログラムの大規模な実際のデータを検索することで、BigQuery のパフォーマンスを体験します。

BigQuery を詳しく見る

BigQuery のサーバーレス インフラストラクチャを使用すると、リソース管理ではなくデータに集中できます。BigQuery は、クラウドベースのデータ ウェアハウスと強力な分析ツールを組み合わせたものです。

BigQuery ストレージ

BigQuery は、分析クエリに最適化されたカラム型ストレージ形式でデータを保存します。BigQuery はデータをテーブル、行、列に表示し、データベース トランザクション セマンティクス(ACID)を完全にサポートします。高可用性を実現するため、BigQuery ストレージは複数のロケーションに自動的に複製されます。

詳細については、BigQuery のストレージの概要をご覧ください。

BigQuery による分析

記述的分析および処方的分析を行う際、ビジネス インテリジェンス、アドホック分析、地理空間分析、機械学習が使用されます。BigQuery に保存されたデータに対してクエリを実行することも、Cloud Storage、Bigtable、Spanner、Google ドライブに保存された Google スプレッドシートなどの外部テーブルや連携クエリを使用して、外部テーブルのデータに対するクエリを実行することもできます。

  • 結合、ネスト、繰り返しのフィールド、分析関数と集計関数、マルチステートメントクエリ、地理空間分析(地理情報システム)などのさまざまな空間関数のサポートを含む ANSI 標準 SQL クエリ(SQL:2011 準拠)を行います。
  • ビューを作成して分析を共有します。
  • Looker Studio を使用する BI EngineLookerGoogle スプレッドシート、Tableau や Power BI などのサードパーティ製ツールを含むビジネス インテリジェンス ツールをサポートします。
  • BigQuery ML は、ML と予測分析を提供します。
  • BigQuery Studio には、Python ノートブックや、ノートブックと保存済みクエリの両方のバージョン管理などの機能が用意されています。これらの機能を使用すると、BigQuery でデータ分析と ML のワークフローを簡単に完了できます。
  • 外部テーブル連携クエリを使用して、BigQuery の外部でデータをクエリします。

詳細については、BigQuery の分析の概要をご覧ください。

BigQuery の管理

BigQuery では、データとコンピューティング リソースの一元管理が可能ですが、Identity and Access Management(IAM)では、Google Cloud 全体で使用されるアクセスモデルにより、これらのリソースを保護できます。Google Cloud セキュリティのベスト プラクティスでは、従来の境界セキュリティや、より複雑できめ細かい多層防御アプローチを含めることができる、堅牢かつ柔軟なアプローチが用意されています。

  • データ セキュリティとガバナンスの概要では、データ ガバナンスと、BigQuery リソースの保護に必要な制御について確認できます。
  • ジョブとは、データの読み込み、エクスポート、クエリ、コピーなど、ユーザーに代わって BigQuery が実行するアクションのことです。
  • Reservations では、オンデマンド料金と容量ベースの料金を切り替えることができます。

詳細については、BigQuery の管理の概要をご覧ください。

BigQuery リソース

次の BigQuery リソースを詳しく見てみます。

API、ツール、リファレンス

BigQuery のデベロッパーとアナリスト向けの参考資料:

BigQuery の役割とリソース

BigQuery は、次の役割と責任にわたってデータ プロフェッショナルのニーズに対応しています。

データ アナリスト

次の操作を行う必要がある場合のサポート用タスク ガイダンス。

Google Cloud コンソールで BigQuery のデータ分析機能を直接使用するには、[ツアーを見る] をクリックします。

ツアーを見る

データ管理者

次の操作が必要な場合に役立つタスク ガイダンス。

詳細については、BigQuery の管理の概要をご覧ください。

Google Cloud コンソールで BigQuery データ管理機能を直接使用するには、[ツアーを見る] をクリックします。

ツアーを見る

データ サイエンティスト

BigQuery ML の機械学習を使用して、次の操作を行う必要がある場合のサポート用タスク ガイダンス。

データ デベロッパー

次の操作を行う必要がある場合のサポート用タスク ガイダンス。

BigQuery の動画チュートリアル

次の動画チュートリアルでは、BigQuery の紹介と簡単な使い方の説明を行っています。

タイトル

説明

BigQuery の使用を開始する方法(17:18) BigQuery の概要とその使用方法について概説します。セグメントには、ETL パイプライン、料金と最適化、BigQuery ML と BI Engine、および Google Cloud コンソール内の BigQuery のデモが含まれます。
BigQuery とは(4:39) アナリストやデベロッパーなどをサポートするために、大量のデータの取り込みと保存を可能にする BigQuery がどのように設計されているかについての概要
BigQuery サンドボックスの使用(3:05) BigQuery サンドボックスを設定して、クレジット カードの登録なしでクエリを実行できるようにする方法
質問とクエリの実行(5:11) BigQuery UI で SQL クエリを作成して実行する方法(例: 魅力的な背番号を選択する)
BigQuery へのデータの読み込み(5:31) リアルタイムでデータを取り込んで分析する方法、または一括でのデータのバッチ分析(例: 猫と犬)
クエリ結果の可視化(5:38) 複雑なデータセットの把握と習得を容易にするためにデータの可視化を役立てる方法
IAM によるアクセス管理(5:23) IAM 権限とアクセス制御を使用して、他のユーザーが BigQuery 内のデータセットをクエリできるようにする方法
クエリの保存と共有(6:17) BigQuery にクエリを保存して共有する簡単な方法
認可済みビューでの機密データの保護(7:12) カスタマイズしたアクセス制御を設定して、異なるユーザーとデータセットを簡単に共有する方法
BigQuery を使用した外部データのクエリ(5:49) BigQuery で外部データソースを設定し、Cloud Storage、Cloud SQL、Google ドライブなどのデータにクエリを実行する方法
ユーザー定義関数とは(4:59) BigQuery でのデータセットの分析に使用するユーザー定義関数(UDF)の作成方法

次のステップ