ARCO(Analysis-Ready, Cloud Optimized)ERA5 は、欧州中期気象予報センター(ECMWF)による第 5 世代の大気再解析で、大気、陸地、海洋に関連する膨大な数の気象変数に対して時間単位の予測を提供します。Google Cloud 一般公開データセット プログラムは、1940 年から 2023 年 5 月までの ERA5 データをホストしています。地球全体を 30 km のグリッドでカバーし、地表から 80 km の高さを 137 のレベルで大気を解析します。
再解析は「現時点で実現可能な過去の気象と天候が可能な限り再現された、最も包括的な全体像」を示します。再解析は、数値気象予測(NWP)モデルによる幅広いデータソースを元に行われています。地球と大気に関する気象学的に有用な変数を取り込み、grib データを Zarr に変換して、クラウド用に最適化されたバージョン(ERA5)を提供しています(これ以外の変更は行われていません)。また、データと一般的な研究ワークフローを提供するオープンソースのコードベースも用意されています。このデータセットには、未加工ファイル(grib)とクラウド用に最適化されたファイル(Zarr)の両方が含まれています。
ユースケース
ERA5 のデータは、さまざまな用途で使用できます。たとえば、次のようなアプリケーションで利用できます。
- さまざまな現象に対する天候の影響を予測する ML モデルのトレーニング
- 天気を予測する ML モデルのトレーニングと評価
- 気象条件(地域内の特定期間の平均的な気象情報)の計算
- 過去の気象現象(ハリケーン サンディなど)の視覚化と研究
Copernicus Climate Change and Atmosphere Monitoring Services と ECMWF のデータ公開ポリシーにより、このデータセットは、Google Cloud 一般公開データセット プログラムの一部として無料で公開されています。ライセンス情報については、以下をご確認ください。
データセットの構造
ERA5 データセットは、3 つのコア サブディレクトリ(raw/
、co/
、ar/
)に保存されます。raw/
には、ECMWF から取り込まれたソースデータが含まれています。co/
には「クラウド最適化」バージョンが含まれています。これらはさらに処理をすることなく、ネイティブ グリッドでクラウド用に最適化された形式(Zarr)に直接変換されたデータです。ar/
(analysis-ready)には ML に対応したデータセットが含まれます。このバージョンのコーパスは通常の緯度 / 経度グリッドで、地表と大気のデータを 1 つの Zarr に統合しています。
クラウド用に最適化されたデータ
クラウド用に最適化されたコーパスには、Cloud Storage バケット gcp-public-data-arco-era5
にある 5 つの個別の Zarr データセットが含まれています。
- モデルレベルの湿度: モデルレベルの湿気に関連する変数とオゾン混合率。
- モデルレベルの風力: モデルレベルでの発散、渦巻き運動、温度、垂直速度。
- 単一レベルの表面: モデル表面における表面圧力と表面圧力の対数。
- 単一レベルの予測: 地表での太陽光 / 長波長放射線、降水の量と種類、降雪量と含水量に関連する 21 の変数。
- 単一レベルの再解析: 土壌の水分 / 温度、地表付近の風量、地表付近の温度と湿気、水蒸気と雲凝縮に関する合計列、海水圧に関連する 38 の変数。
各データセットに含まれる変数の詳細については、GitHub リポジトリの Jupyter ノートブックの例をご覧ください。
分析に対応したデータ
Google Cloud 分析対応コーパスは、1959 年から 2022 年までに対応する Zarr です。データの最新バージョンは Cloud Storage バケット gcp-public-data-arco-era5
にあります。
- 1959 年~2022 年: 完全な圧力レベル: 1 時間単位で整理された 0.25° / 0.25° の緯度 / 経度の分解能での 31 の表面と圧力レベルの変数(37 のすべての圧力レベル)。
データアクセス
次のコード スニペットは、分析に適したデータセットを読み込み、データセットのサマリーを表示します。
import xarray era5 = xarray.open_zarr( "gs://gcp-public-data-arco-era5/ar/1959-2022-full_37-1h-0p25deg-chunk-1.zarr-v2", chunks={'time': 48}, consolidated=True, ) era5
Python で ARCO-ERA5 データを使用する他の例については、Jupyter ノートブックの例をご覧ください。
データセットについて
データセットのソース: ECMWF - Copernicus Climate Change Service(C3S)Climate Data Store information を使用して生成。
カテゴリ: 大気科学、データ同化、気候、クラウド最適化、気象、再解析、気象、科学、研究
使用: ERA5 データの使用は無料です。全世界において非独占的かつロイヤリティフリーで永続的に使用できます。Copernicus プロダクトを利用しているユーザーは、明確でわかりやすいアトリビューションを Copernicus プログラムに提供する必要があります。欧州委員会および ECMWF は、Copernicus の情報またはそこに含まれるデータから生じるいかなる使用に対しても責任を負いません。使用方法の詳細については、Copernicus プロダクトを使用するためのライセンスをご覧ください。
更新頻度: ERA5 データセットは現在、Google Cloud 一般公開データセット プログラムで更新されていません。このプログラムでは、1940 年から 2023 年 5 月までの ERA5 データが提供されます。
形式: 未加工ファイルは .grib
と NetCDF 形式で、処理されたファイルは .zarr
です。
Cloud Storage のロケーション: データは、us-central1
リージョンの gcp-public-data-arco-era5
バケットに保存されます。
データセットのロードマップ: この Google Cloud データセットの開発計画は、ERA5 リポジトリで入手できます。