クラウド コンピューティング入門: よくある質問
Google Cloud Japan Team
※この投稿は米国時間 2021 年 5 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。
クラウド コンピューティングには、さまざまな用語や概念がありますが、誰もがそれらをすべて理解しているわけではありません。そこで本ブログでは、よくある質問についてまとめましたのでご参照ください。一部、用語の頭字語の意味についても説明しています。今回取り上げた用語、およびその他多くの情報については、学習用リソースでご確認いただけます。
コンテナとは
コンテナとは、あらゆる環境で実行するために必要なすべての要素を含む、ソフトウェアのパッケージです。パッケージにすることで、コンテナはオペレーティング システムを仮想化し、プライベート データセンターからパブリック クラウド、開発者個人のノートパソコンまで、どこでも実行できます。コンテナ化により、開発チームは開発をスピードアップし、ソフトウェアを効率的にデプロイして、運営規模をこれまでにないほど拡大できます。詳細を読む
コンテナと VM: その違いは何か
すでにご存じかもしれませんが、VM は Linux や Windows などのゲスト オペレーティング システムをホスト オペレーティング システム上で実行し、基盤となるハードウェアへのアクセスを提供します。コンテナは仮想マシン(VM)と比較されることがよくあります。コンテナも仮想マシンと同様にライブラリや他の依存関係とアプリケーションをまとめてパッケージ化し、ソフトウェア サービスの実行用に独立した環境を提供します。ただし類似点はここまでで、コンテナでは、開発者と IT 運用チームがうまく連携できるように、多くのメリットを備えたさらに軽量なユニットが提供されます。コンテナは VM よりはるかに軽量です。VM がハードウェア レベルで仮想化するのに対し、コンテナは OS レベルで仮想化します。また、コンテナは OS カーネルを共有し、VM に比べてごくわずかなメモリしか使用しません。詳細を読む
Kubernetes とは
組織内でのコンテナの普及に伴い、コンテナ中心の管理ソフトウェアである Kubernetes は、コンテナ化アプリケーションのデプロイと運用における事実上の標準になっています。Google Cloud は Kubernetes が生まれた場所です。元々 Google で開発され、2014 年にオープンソースとしてリリースされました。Kubernetes は、15 年間にわたって Google のコンテナ化されたワークロードを実行してきた経験と、オープンソース コミュニティによる価値ある貢献のもと、構築されています。Google の内部クラスタ管理システムである Borg にインスパイアされた Kubernetes を利用すると、アプリケーションのデプロイと管理に関連するすべてが容易になります。自動化されたコンテナのオーケストレーションを提供することで、Kubernetes は信頼性を向上させ、日々の運用作業にかかる時間とリソースを削減します。詳細を読む
マイクロサービス アーキテクチャとは
マイクロサービス アーキテクチャ(多くの場合、マイクロサービスと略される)は、アプリケーション開発におけるアーキテクチャ スタイルの一つです。マイクロサービスによって、大きなアプリケーションを、それぞれが独自の責任範囲を持つ独立した小さな部分に分割できます。単一のユーザー リクエストを処理するために、マイクロサービス ベースのアプリケーションが多数の内部マイクロサービスを呼び出して、レスポンスを作成します。コンテナは、依存関係に気を取られることなくサービスの開発に集中できるため、マイクロサービス アーキテクチャの例として非常に適しています。最新のクラウドネイティブ アプリケーションは、通常、コンテナを使用してマイクロサービスとして構築されます。詳細を読む
ETL とは
ETL は extract(抽出)、transform(変換)、load(読み込み)の略で、複数のシステムからのデータを単一のデータベース、データストア、データ ウェアハウス、データレイクに統合するために、さまざまな組織が長く利用してきた方法です。ETL は、既存のデータを保存するために使用できます。また、現在は一般的に、データを集計して分析し、ビジネス上の正しい決定を下すために使用されます。組織は何十年もの間 ETL を使用してきました。しかし、新しい点として、データのソースとターゲット データベースの両方がクラウドに移行していることが挙げられます。さらに、バッチ パイプラインと一緒に統合されるようになったストリーミング ETL パイプラインも出現しています。つまり、集計されたバッチでデータを処理するのではなく、データの連続するストリームをリアルタイムで処理します。バッチのバックフィルまたはデータ検出に織り込まれた再処理パイプラインを使用して連続的なストリーム処理を実行する企業もあります。詳細を読む
データレイクとは
データレイクは、大量の構造化データ、半構造化データ、非構造化データを保存、処理、保護するための、一元化されたリポジトリです。サイズ上限を問わず、ネイティブ形式でデータを保存し、どのようなデータでも処理できます。詳細を読む
データ ウェアハウスとは
データドリブンの企業には、組織全体の大量のデータを管理し、分析するための堅牢なソリューションが必要です。システムはスケーラブルで信頼性が高くなくてはならず、規制産業にも十分なほどの安全性が求められます。また、さまざまなデータの種類とユースケースをサポートできる柔軟性も備えていなければなりません。こうした要件は、従来のデータベースの能力をはるかに上回っています。そこでデータ ウェアハウスの出番です。データ ウェアハウスとは、POS トランザクション、マーケティング オートメーション、顧客管理などの複数のソースからの構造化データおよび半構造化データの分析とレポート作成に使用される企業システムです。アドホック分析やカスタム レポート作成に適しており、現在と過去のデータの両方を 1 か所に保存できます。長期間のデータを表示できるよう設計されていることから、ビジネス インテリジェンスにおける主要なコンポーネントとなっています。詳細を読む
ストリーミング分析とは
ストリーミング分析とは、データレコードをバッチではなく連続的に処理して分析することです。一般的に、ストリーミング分析はデータが生成される際に連続的な流れで小さなサイズ(多くの場合はキロバイト単位)のデータを送信するタイプのデータソースに有用です。詳細を読む
機械学習(ML)とは
昨今、企業は大量のデータに翻弄されています。事業を改善するためには、データをよく理解する必要があります。しかし、膨大なデータに複雑さが組み合わさると、従来のツールでの分析が難しくなります。データのパターンとインサイトを識別するための分析モデルの構築、テスト、反復、デプロイは、従業員の多くの時間を奪います。また、デプロイ後には、モデルをモニタリングし、市場の状況やデータ自体の変化に応じて継続的に調整する必要があります。このソリューションとなるのが、機械学習です。機械学習により、企業は機械学習のアルゴリズムで当面の問題を解決する方法と、時間の経過とともに改善していく方法をシステムに学習させることができます。詳細を読む
自然言語処理(NLP)とは
自然言語処理(NLP)は、機械学習を使用してテキストの構造や意味を明らかにします。自然言語処理アプリケーションを使用することで、組織はテキストを分析し、人、場所、イベントに関する情報を抽出して、ソーシャル メディアに表れる感情や顧客との会話について理解を深めることができます。詳細を読む
詳細
クラウド コンピューティングに関するよくある質問の例をご紹介しました。詳しくは、cloud.google.com/learn の Google Cloud に関するトピックをご覧ください。
-Google Cloud 編集チーム