Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Dataproc terintegrasi dengan Apache Hadoop dan Hadoop Distributed
File System (HDFS). Fitur dan pertimbangan berikut dapat menjadi hal yang penting saat memilih opsi komputasi dan penyimpanan data untuk cluster dan tugas Dataproc:
HDFS dengan Cloud Storage:
Dataproc menggunakan
Hadoop Distributed File System (HDFS) untuk penyimpanan. Selain itu,
Dataproc akan otomatis menginstal konektor Cloud Storage
yang kompatibel dengan HDFS,
yang memungkinkan penggunaan Cloud Storage
secara paralel dengan HDFS. Data dapat dipindahkan masuk dan keluar dari cluster melalui
upload dan download ke HDFS atau Cloud Storage.
Disk VM:
Secara default, jika tidak ada SSD lokal yang disediakan, data HDFS dan data shuffle
perantara disimpan di disk booting VM, yang merupakan
Persistent Disk.
Jika Anda menggunakan SSD lokal,
data HDFS dan data shuffle perantara disimpan di SSD.
Ukuran dan jenis disk persisten (PD) memengaruhi performa dan ukuran VM, baik menggunakan HDFS maupun Cloud Storage untuk penyimpanan data.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2024-12-21 UTC."],[],[]]