Data ERA5

Analysis-Ready, Cloud Optimized (ARCO) ERA5 adalah generasi kelima European Centre for Medium-Range Weather Forecasts (ECMWF) Analisa Ulang Atmosfer, yang memberikan estimasi setiap jam sejumlah besar variabel iklim atmosfer, daratan, dan lautan. Program Set Data Publik Google Cloud menghosting data ERA5 yang berlangsung dari tahun 1940 hingga Mei 2023, yang mencakup Bumi dalam petak 30 km dan menyelesaikan atmosfer menggunakan 137 tingkat dari permukaan hingga ketinggian 80 km.

Analisis ulang adalah "gambaran paling lengkap yang saat ini mungkin terjadi dari cuaca dan iklim masa lalu". Analisis ulang dibuat dari asimilasi berbagai sumber data melalui model prediksi cuaca numerik (NWP). Variabel yang berharga secara meteorologi untuk daratan dan atmosfer diserap dan dikonversi dari data grib ke Zarr (tanpa modifikasi lainnya) untuk menampilkan versi ERA5 yang dioptimalkan untuk cloud. Selain itu, code base open source juga disediakan untuk menunjukkan asal data serta menunjukkan alur kerja penelitian umum. Set data ini mencakup file mentah (grib) dan file yang dioptimalkan untuk cloud (zarr).

Kasus penggunaan

Data ERA5 dapat digunakan di berbagai aplikasi, termasuk:

  • Melatih model ML yang memprediksi dampak cuaca terhadap berbagai fenomena
  • Melatih dan mengevaluasi model ML yang memperkirakan cuaca
  • Komputasi klimatologi, cuaca rata-rata untuk suatu wilayah selama periode waktu tertentu
  • Memvisualisasikan dan mempelajari peristiwa cuaca bersejarah, seperti Badai Sandi

Berkat kebijakan data terbuka dari Copernicus Climate Change and Atmosphere Monitoring Services dan ECMWF, set data ini tersedia gratis sebagai bagian dari Google Cloud Public Dataset Program. Lihat di bawah untuk informasi lisensi.

Struktur set data

Set data ERA5 disimpan dalam tiga subdirektori inti: raw/, co/, dan ar/. raw/ berisi data sumber yang diserap dari ECMWF. co/ berisi versi "yang dioptimalkan untuk cloud": Ini adalah data yang dikonversi langsung ke format yang dioptimalkan untuk cloud (Zarr) di petak native-nya tanpa diproses lebih lanjut. ar/, atau "siap analisis", berisi set data yang siap digunakan ML. Corpus versi ini berada dalam petak lintang/bujur reguler dan menyatukan data permukaan dan atmosfer menjadi satu Zarr.

Data yang dioptimalkan cloud

Corpus kami yang dioptimalkan untuk cloud mencakup lima set data Zarr terpisah, yang ditemukan di bucket Cloud Storage gcp-public-data-arco-era5:

  • Kelembapan tingkat model: Variabel terkait kelembapan dan rasio pencampuran ozon di tingkat model.
  • Angin tingkat model: Divergensi, vortisitas, suhu, dan kecepatan vertikal pada tingkat model.
  • Permukaan Satu Tingkat: Geopotensial permukaan dan logaritma tekanan permukaan pada permukaan model.
  • Perkiraan Satu Tingkat: 21 variabel yang terkait dengan radiasi matahari/gelombang panjang di permukaan, jumlah dan jenis curah hujan, serta kedalaman hujan salju dan kandungan air.
  • Analisis Ulang Satu Tingkat: 38 variabel yang terkait dengan kelembapan/suhu tanah, angin di dekat permukaan, suhu dan kadar air di dekat permukaan, total uap air di kolom dan kondensat awan, total lapisan awan, dan tekanan permukaan laut.

Untuk informasi lebih lanjut tentang variabel mana yang disertakan dengan setiap set data, lihat contoh notebook Jupyter di repositori GitHub.

Data yang siap dianalisis

Corpus Google Cloud yang siap dianalisis adalah Zarr dari tahun 1959-2022. Versi terbaru data dapat ditemukan di bucket Cloud Storage gcp-public-data-arco-era5:

  • 1959-2022, tingkat tekanan penuh: 31 variabel permukaan dan tingkat tekanan (untuk keseluruhan 37 tingkat tekanan) pada resolusi garis lintang/bujur 0,25°/0,25°, yang disusun dalam waktu 1 jam potongan kode.

Akses data

Cuplikan kode berikut memuat set data yang siap dianalisis dan menampilkan ringkasan set data:

import xarray
era5 = xarray.open_zarr(
    "gs://gcp-public-data-arco-era5/ar/1959-2022-full_37-1h-0p25deg-chunk-1.zarr-v2",
    chunks={'time': 48},
    consolidated=True,
)
era5

Untuk contoh lain yang menggunakan data ARCO-ERA5 di Python, lihat contoh notebook Jupyter.

Tentang set data

Sumber Set Data: ECMWF - Dibuat menggunakan informasi Penyimpanan Data Iklim Copernicus Climate Change Service (C3S).

Kategori: Ilmu Atmosfer, Asimilasi Data, Iklim, Dioptimalkan untuk Cloud, Meteorologi, Analisis Ulang, Cuaca, Sains & Riset.

Penggunaan: Penggunaan data ERA5 tidak dikenai biaya, berlaku di seluruh dunia, non-eksklusif, bebas royalti, dan berlaku permanen. Semua pengguna Produk Copernicus harus memberikan atribusi yang jelas dan terlihat di program Copernicus. Baik Komisi Eropa maupun ECMWF tidak bertanggung jawab atas penggunaan apa pun yang mungkin dilakukan terhadap informasi atau data Copernicus yang ada di dalamnya. Untuk detail lengkap penggunaan, lihat Lisensi untuk Menggunakan Produk Copernicus.

Frekuensi Update: Set data ERA5 saat ini tidak dimuat ulang di Program Set Data Publik Google Cloud. Program ini menyediakan data ERA5 yang dari tahun 1940 hingga Mei 2023.

Format: File mentah memiliki format .grib dan NetCDF, file yang diproses memiliki format .zarr.

Lokasi Cloud Storage: Data disimpan di bucket gcp-public-data-arco-era5, yang terletak di region us-central1.

Roadmap set data: Rencana pengembangan untuk set data Google Cloud ini tersedia di repositori ERA5.