BigQuery の概要

BigQuery は、ML、検索、地理空間分析、ビジネスインテリジェンスなどの組み込み機能を使用してデータの管理と分析を支援する、フルマネージドの AI 対応データプラットフォームです。BigQuery のサーバーレスアーキテクチャを使用すると、SQL や Python などの言語を使用して、インフラストラクチャ管理なしで組織の最も大きな課題に対応できます。

BigQuery は、構造化データと非構造化データの両方を使用するための統一的な方法を提供するものであり、Apache Iceberg、Delta、Hudi などのオープンテーブル形式をサポートしています。 BigQuery ストリーミングは、継続的なデータ取り込みと分析をサポートしています。BigQuery のスケーラブルな分散型分析エンジンを使用すると、数テラバイトのデータであれば数秒、数ペタバイトのデータであれば数分でクエリを実行できます。

BigQuery には、データの検出とキュレーション、メタデータとデータ品質の管理を可能にするガバナンス機能が組み込まれています。セマンティック検索やデータリネージなどの機能を使用して、分析に関連するデータを見つけて検証できます。アクセス制御のメリットを活かしながら、組織全体でデータと AI アセットを共有できます。これらの機能は、 Google Cloudのデータと AI アセット向けの統合されたインテリジェントなガバナンスソリューションである Dataplex Universal Catalog によって実現されています。

BigQuery のアーキテクチャは、データを取り込み、保存、最適化するストレージレイヤと、分析機能を提供するコンピューティングレイヤの 2 つの部分で構成されています。これらのコンピューティングレイヤとストレージレイヤは、レイヤ間の必要な通信を可能にする Google のペタビット規模のネットワークにより、相互に独立して効率的に動作します。

一般的に以前のデータベースでは、読み取り / 書き込みオペレーションと分析オペレーションでリソースを共有する必要があります。これによりリソースの競合が発生し、データがストレージに書き込まれるとき、またはストレージから読み込まれるときにクエリが遅くなる可能性があります。権限の割り当てや取り消しなど、データベース管理タスクにリソースが必要な場合、共有リソースプールの負荷はさらに増大します。BigQuery では、コンピューティングレイヤとストレージレイヤが分離されているため、他方のレイヤのパフォーマンスや可用性に影響を与えることなく、各レイヤでリソースを動的に割り当てることができます。

BigQuery アーキテクチャでは、ペタビットネットワークを使用してリソースが分離されます。

この分離原則により、BigQuery はダウンタイムやシステムパフォーマンスへの悪影響なしに、ストレージとコンピューティングの改善を個別にデプロイできるため、より迅速にイノベーションを実現できます。また、BigQuery エンジニアリングチームが更新とメンテナンスを処理するフルマネージドサーバーレスデータウェアハウスを提供することも不可欠です。結果として、リソースのプロビジョニングや手動スケーリングを行う必要がないため、従来のデータベース管理タスクではなく、価値の提供に集中できます。

BigQuery インターフェースには、 Google Cloud コンソールインターフェースと BigQuery コマンドラインツールが含まれます。デベロッパーやデータサイエンティストは、Python、Java、JavaScript、Go などの使い慣れたプログラミング言語でクライアントライブラリを使用することも、BigQuery の REST API と RPC API でデータを変換、管理することもできます。ODBC ドライバと JDBC ドライバにより、サードパーティのツールやユーティリティなどの既存のアプリケーションとやり取りできるようになります。

データアナリスト、データエンジニア、データウェアハウス管理者、またはデータサイエンティストであれば、BigQuery は、データを読み込み、処理、分析して、重要なビジネス上の意思決定を支援します。

BigQuery を使ってみる

BigQuery は数分で使い始めることができます。BigQuery の無料枠または無料サンドボックスを活用して、データの読み込みとクエリを開始できます。

BigQuery のサンドボックス: BigQuery サンドボックスをリスクフリーかつ無料でご利用いただけます。
Google Cloud コンソールクイックスタート: BigQuery コンソールの機能に慣れるようにします。
一般公開データセット: 一般公開データセットプログラムの大規模な実際のデータを検索することで、BigQuery のパフォーマンスを体験します。

BigQuery を詳しく見る

BigQuery のサーバーレスインフラストラクチャを使用すると、リソース管理ではなくデータに集中できます。BigQuery は、クラウドベースのデータウェアハウスと強力な分析ツールを組み合わせたものです。

BigQuery ストレージ

BigQuery は、分析クエリに最適化されたカラム型ストレージ形式でデータを保存します。BigQuery はデータをテーブル、行、列に表示し、データベーストランザクションセマンティクス（ACID）を完全にサポートします。高可用性を実現するため、BigQuery ストレージは複数のロケーションに自動的に複製されます。

データウェアハウスとデータマートで BigQuery リソースを整理するための一般的なパターンについて確認します。
BigQuery のテーブルとビューの最上位コンテナであるデータセットについて学習します。
次の機能を使用して、BigQuery にデータを読み込みます。
- Storage Write API を使用してデータをストリーミングします。
- Avro、Parquet、ORC、CSV、JSON、Datastore、Firestore などの形式でローカルファイルまたは Cloud Storage から、データをバッチ読み込みします。
BigQuery Data Transfer Service は、データの取り込みを自動化します。

詳細については、BigQuery の料金の概要をご覧ください。

BigQuery による分析

ビジネスインテリジェンス、アドホック分析、地理空間分析、ML では記述的分析、処方的分析を使用できます。BigQuery に保存されたデータに対してクエリを実行することも、Cloud Storage、Bigtable、Spanner、Google ドライブに保存された Google スプレッドシートなどの外部テーブルや連携クエリを使用して、外部テーブルのデータに対するクエリを実行することもできます。

ANSI 標準 SQL クエリ（SQL:2011 遵守）は、結合、ネスト、繰り返しのフィールド、分析関数と集計関数、マルチステートメントクエリ、地理空間分析（地理情報システム）などのさまざまな空間関数をサポートします。
ビューを作成して分析を共有します。
Looker Studio を使用する BI Engine、Looker、Google スプレッドシート、Tableau や Power BI などのサードパーティ製ツールを含むビジネスインテリジェンスツールをサポートします。
BigQuery ML は、ML と予測分析を提供します。
BigQuery Studio には、Python ノートブックや、ノートブックと保存済みクエリの両方のバージョン管理などの機能が用意されています。これらの機能を使用すると、BigQuery でデータ分析と ML のワークフローを簡単に完了できます。
外部テーブルと連携クエリを使用して、BigQuery の外部でデータをクエリします。

詳細については、BigQuery の分析の概要をご覧ください。

BigQuery の管理

BigQuery では、データとコンピューティングリソースの一元管理が可能であり、Identity and Access Management（IAM）では、 Google Cloud全体で使用されるアクセスモデルにより、これらのリソースを保護できます。Google Cloud セキュリティのベストプラクティスでは、従来の境界セキュリティや、より複雑できめ細かい多層防御アプローチを含めることができる、堅牢かつ柔軟なアプローチが用意されています。

データセキュリティとガバナンスの概要では、データガバナンスと、BigQuery リソースの保護に必要な制御について確認できます。
ジョブとは、データの読み込み、エクスポート、クエリ、コピーなど、ユーザーに代わって BigQuery が走行するアクションのことです。
Reservations では、オンデマンド料金と容量ベースの料金を切り替えることができます。

詳細については、BigQuery の管理の概要をご覧ください。

BigQuery リソース

次の BigQuery リソースを利用できます。

リリースノート。機能、変更、非推奨の変更履歴が記載されています。
分析とストレージの料金。BigQuery ML、BI Engine、Data Transfer Service の料金もご覧ください。
ロケーション。データセットを作成して保存する場所（リージョンとマルチリージョンのロケーション）を定義します。
Stack Overflow。BigQuery を使用するデベロッパーとアナリストのコミュニティがホストされています。
BigQuery のサポート。BigQuery のサポートを利用できます。
Google BigQuery: Definitive Guide: Data Warehousing, Analytics, and Machine Learning at Scale（Valliappa Lakshmanan、Jordan Tigani 著）。BigQuery の仕組みについて解説し、サービスの使用方法に関するエンドツーエンドのチュートリアルを提供しています。

API、ツール、リファレンス

BigQuery のデベロッパーとアナリスト向けの参考資料:

GoogleSQL の使用方法の詳細は、SQL クエリ構文をご覧ください。
BigQuery API とクライアントライブラリには、BigQuery の機能と用途の概要が記載されています。
BigQuery コードサンプル: C#、Go、Java、Node.js、Python、Ruby のクライアントライブラリ向けに数百のスニペットが用意されています。また、サンプルブラウザも表示できます。
DML、DDL、ユーザー定義関数（UDF）の構文により、BigQuery データの管理と変換を行うことができます。
bq コマンドラインツールリファレンス。bq CLI インターフェース用の構文、コマンド、フラグ、引数が記載されています。
ODBC / JDBC の統合。これにより、BigQuery が既存のツールやインフラストラクチャに接続されます。

Gemini in BigQuery の機能

Gemini in BigQuery は Gemini for Google Cloud プロダクトスイートの一部であり、データの操作を支援するための AI 搭載アシスタント機能を提供します。

Gemini in BigQuery は、次の作業を支援する AI アシスタンスを提供します。

データインサイトでデータを探索し、理解する。データインサイトは、テーブルのメタデータから生成された知見に富んだクエリを使用して、パターンの発見、統計分析を実行する自動かつ直感的な方法を提供します。この機能は特に初期のデータ探索におけるコールドスタートの課題に対処するのに役立ちます。詳細については、BigQuery でデータ分析情報を生成するをご覧ください。
BigQuery データキャンバスを使用して、データを検出、変換、クエリ、可視化する。Gemini in BigQuery で自然言語を使用すると、テーブルアセットの検索、結合、クエリ、結果の可視化、プロセス全体での他のユーザーとのシームレスなコラボレーションを実行できます。詳細については、データキャンバスで分析するをご覧ください。
SQL と Python のデータ分析の支援を利用する。Gemini in BigQuery を使用すると、SQL または Python のコードを生成または提案し、既存の SQL クエリを説明できます。自然言語クエリを使用して、データ分析を開始することもできます。生成方法については、次のドキュメントをご覧ください。
- SQL コードアシスト
- Python コードアシスト
分析用のデータを準備する。BigQuery のデータ準備では、コンテキストに応じた AI 生成変換推奨事項を使用して、分析用にデータをクレンジングします。詳細については、Gemini でデータを準備するをご覧ください。
変換ルールを使用して SQL 変換をカスタマイズする。（プレビュー）インタラクティブ SQL トランスレータを使用するときに、Gemini 拡張変換ルールを作成して SQL 変換をカスタマイズします。自然言語プロンプトを使用して SQL 変換出力の変更を記述することや、検索と置換を行う SQL パターンを指定することが可能です。詳細については、変換ルールを作成するをご覧ください。

Gemini in BigQuery を設定する方法については、Gemini in BigQuery を設定するをご覧ください。

BigQuery のロールとリソース

BigQuery は、次の役割と責任にわたってデータプロフェッショナルのニーズに対応しています。

データアナリスト

次の操作が必要な場合に役立つタスクガイダンス。

SQL クエリ構文を使用して、インタラクティブクエリまたはバッチクエリで BigQuery データをクエリする
SQL の関数、演算子、条件式を参照して、データをクエリする
Looker、Looker Studio、Google スプレッドシートなどのツールを使用して、BigQuery データを分析、可視化します。
地理空間分析を使用して、BigQuery の地理情報システムで地理空間データを分析および可視化します。
次の機能を使用して、クエリパフォーマンスを最適化する。
- パーティション分割テーブル: 時間または整数の範囲に基づいて、大きなテーブルをプルーニングします。
- マテリアライズドビュー: キャッシュに保存されるビューを定義して、クエリの最適化や、永続的な結果の提供を行います。
- BI Engine: BigQuery の高速なインメモリ分析サービス。

Google Cloud コンソールで BigQuery のデータ分析機能を直接使用するには、[ツアーを見る] をクリックします。

ツアーを見る

データ管理者

次の操作が必要な場合に役立つタスクガイダンス。

Reservations で費用を管理し、オンデマンドと容量ベースの料金のバランスをとる。
データセキュリティとガバナンスを把握して、データセット、テーブル、列、行、ビューごとにデータを保護する。
テーブルのスナップショットでデータをバックアップして、特定の時点でのテーブルのコンテンツを保存する。
BigQuery INFORMATION_SCHEMA を表示して、データセット、ジョブ、アクセス制御、Reservations、テーブルなどのメタデータについて把握する。
ジョブを使用して、ユーザーの代わりに BigQuery がデータの読み込み、エクスポート、クエリ、コピーなどのアクションを行う。
ログとリソースをモニタリングして、BigQuery とワークロードを把握する。

詳細については、BigQuery の管理の概要をご覧ください。

Google Cloud コンソールで BigQuery データ管理機能を直接使用するには、[ツアーを見る] をクリックします。

ツアーを見る

データサイエンティスト

BigQuery ML の機械学習で次の操作が必要な場合に役立つタスクガイダンス。

機械学習モデルのエンドツーエンドのユーザージャーニーを理解する。
BigQuery ML のアクセス制御を管理する。
以下を含む BigQuery ML モデルを作成してトレーニングする。
- 線形回帰予測
- 2 項ロジスティック回帰と多項ロジスティック回帰分類
- データセグメンテーション用の K 平均法クラスタリング
- Arima+ モデルを使用した時系列予測

データデベロッパー

次の操作が必要な場合に役立つタスクガイダンス。

以下を使用して BigQuery にデータを読み込む:
- Avro、Parquet、ORC、CSV、JSON、Datastore、Firestore の形式でデータをバッチ読み込みする。
- BigQuery Data Transfer Service
- BigQuery Storage Write API
次のようなコードサンプルライブラリを使用する:
Google Cloud サンプルブラウザ（BigQuery を対象とする）
API とライブラリの概要
ODBC / JDBC の統合

BigQuery の動画チュートリアル

次の動画チュートリアルでは、BigQuery の紹介と簡単な使い方の説明を行っています。

タイトル	説明
BigQuery の使用を開始する方法（17:18）	BigQuery の概要とその使用方法について概説します。セグメントには、ETL パイプライン、料金と最適化、BigQuery ML と BI Engine、および Google Cloud コンソール内の BigQuery のデモが含まれます。
BigQuery とは（4:39）	BigQuery でアナリストやデベロッパーが大量のデータを取り込んで保存するための仕組み。
BigQuery サンドボックスの使用（3:05）	BigQuery サンドボックスを設定して、クレジットカードの登録なしでクエリを実行できるようにする方法
質問とクエリの実行（5:11）	BigQuery UI で SQL クエリを作成して実行する方法（例: 魅力的な背番号を選択する）
BigQuery へのデータの読み込み（5:31）	リアルタイムでデータを取り込んで分析する方法、または一括でのデータのバッチ分析（例: 猫と犬）
クエリ結果の可視化（5:38）	複雑なデータセットの把握と習得を容易にするためにデータの可視化を役立てる方法
IAM によるアクセス管理（5:23）	IAM 権限とアクセス制御を使用して、他のユーザーが BigQuery 内のデータセットをクエリできるようにする方法
クエリの保存と共有（6:17）	BigQuery にクエリを保存して共有する簡単な方法
認可済みビューでの機密データの保護（7:12）	カスタマイズしたアクセス制御を設定して、異なるユーザーとデータセットを簡単に共有する方法
BigQuery を使用した外部データのクエリ（5:49）	BigQuery で外部データソースを設定し、Cloud Storage、Cloud SQL、Google ドライブなどのデータにクエリを実行する方法
ユーザー定義関数とは（4:59）	BigQuery でのデータセットの分析に使用するユーザー定義関数（UDF）の作成方法

次のステップ

BigQuery ストレージの概要については、BigQuery ストレージの概要をご覧ください。
BigQuery クエリの概要については、BigQuery 分析の概要をご覧ください。
BigQuery の管理の概要については、BigQuery の管理の概要をご覧ください。
BigQuery セキュリティの概要については、データセキュリティとガバナンスの概要をご覧ください。

BigQuery の概要

BigQuery を使ってみる

BigQuery を詳しく見る

BigQuery ストレージ

BigQuery による分析

BigQuery の管理

BigQuery リソース

API、ツール、リファレンス

Gemini in BigQuery の機能

BigQuery のロールとリソース

データ アナリスト

データ管理者

データ サイエンティスト

データ デベロッパー

BigQuery の動画チュートリアル

次のステップ

データアナリスト

データサイエンティスト

データデベロッパー