Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Para complementar el disco de arranque, puedes adjuntar unidades de estado sólido locales (SSD locales) a los nodos principales, trabajadores principales y trabajadores secundarios en tu clúster.
Cuando se proporcionan SSD locales al clúster, los datos HDFS y provisorios, como los resultados aleatorios, usan los SSD locales en lugar del disco persistente de arranque.
Con los SSD locales, se pueden obtener tiempos de lectura y escritura más rápidos que con disco persistente (consulta Rendimiento de SSD locales).
El tamaño de 375 GB de cada SSD local es fijo, pero puedes conectar varios SSD locales para aumentar el almacenamiento SSD (consulta Acerca de los SSD locales).
Cada SSD local se activa en /mnt/<id> en los nodos del clúster de Dataproc.
Las SSD locales usan ext4 como sistema de archivos predeterminado.
Usa SSD locales
Comando de gcloud
Usa el comando
gcloud dataproc clusters create
con las marcas --num-master-local-ssds,
--num-workers-local-ssds y
--num-secondary-worker-local-ssds para conectar SSD locales a los nodos trabajadores principales, primarios y secundarios del clúster.
Las SSD locales se pueden conectar a las VMs de Dataproc con una interfaz SCSI (Small Computer System Interface) o NVMe (Non-Volatile Memory Express) (consulta Rendimiento de SSD locales).
La interfaz SCSI es la interfaz predeterminada de SSD local de la VM del clúster de Dataproc. Usa el comando
gcloud dataproc clusters create
con las marcas --master-local-ssd-interface,
--worker-local-ssd-interface y
--secondary-worker-local-ssd-interface
para especificar la interfaz de SSD local para los nodos trabajadores principales, primarios y secundarios.
Establece el campo numLocalSsds en InstanceGroupConfig de masterConfig, workerConfig y secondaryWorkerConfig en una solicitud cluster.create a la API para conectar SSD locales a los nodos trabajadores principales, primarios y secundarios del clúster.
Las SSD locales se pueden conectar a las VMs de Dataproc con una interfaz SCSI (Small Computer System Interface) o NVMe (Non-Volatile Memory Express) (consulta Rendimiento de SSD locales).
La interfaz SCSI es la interfaz predeterminada de SSD local de la VM del clúster de Dataproc. Establece el campo localSsdInterface en InstanceGroupConfig de masterConfig, workerConfig y secondaryWorkerConfig en una solicitud cluster.create a la API para especificar la interfaz "SCSI" o "NVME" para conectar SSD locales a los nodos principales, trabajadores primarios y trabajadores secundarios del clúster.
Console
Crea un clúster y adjunta los SSD locales a los nodos trabajadores principales, primarios y secundarios desde el panel Configurar nodos de la página Crear un clúster de Dataproc de la consola de Google Cloud .
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-08 (UTC)"],[[["\u003cp\u003eLocal SSDs can be attached to master, primary worker, and secondary worker nodes in a cluster, offering faster read and write speeds compared to persistent disks.\u003c/p\u003e\n"],["\u003cp\u003eEach local SSD has a fixed size of 375GB, but multiple SSDs can be attached to increase the total SSD storage capacity.\u003c/p\u003e\n"],["\u003cp\u003eThe gcloud command-line tool and REST API provide methods to configure the number and interface type (SCSI or NVME) of local SSDs attached to each node type.\u003c/p\u003e\n"],["\u003cp\u003eLocal SSDs are automatically mounted to the \u003ccode\u003e/mnt/<id>\u003c/code\u003e directory on Dataproc cluster nodes and use the ext4 file system by default.\u003c/p\u003e\n"],["\u003cp\u003eYou can create a cluster with local SSDs from the "Configure Nodes" panel of the Dataproc cluster creation page of the google cloud console.\u003c/p\u003e\n"]]],[],null,["To supplement the boot disk, you can attach\n[local Solid State Drives (local SSDs)](/compute/docs/disks/local-ssd)\nto master, primary worker, and secondary worker nodes in your cluster.\nWhen local SSDs are provided to the cluster, both HDFS and scratch data,\nsuch as shuffle outputs, use the local SSDs instead of the boot\npersistent disk.\n\n- Local SSDs can provide faster read and write times than persistent disk (see [Local SSD Performance](/compute/docs/disks/local-ssd#performance)).\n- The 375GB size of each local SSD is fixed, but you can attach multiple local SSDs to increase SSD storage (see [About Local SSDs](/compute/docs/disks/local-ssd)).\n- Each local SSD is mounted to `/mnt/\u003cid\u003e` in Dataproc cluster nodes.\n- Local SSDs use [`ext4`](https://en.wikipedia.org/wiki/Ext4) as the default filesystem.\n\nUse local SSDs \n\ngcloud command\n\nUse the\n[`gcloud dataproc clusters create`](/sdk/gcloud/reference/dataproc/clusters/create)\ncommand with the `--num-master-local-ssds`,\n`--num-workers-local-ssds`, and\n`--num-secondary-worker-local-ssds` flags to attach local\nSSDs to the cluster's master, primary, and secondary worker\nnodes.\n\nLocal SSDs can be attached to Dataproc VMs using a SCSI\n(Small Computer System Interface) or NVME (Non-Volatile Memory Express) interface (see\n[local SSD performance](/compute/docs/disks/local-ssd#performance)).\nThe default Dataproc cluster VM local SSD interface is the SCSI interface. Use the\n[gcloud dataproc clusters create](/sdk/gcloud/reference/dataproc/clusters/create)\ncommand with the `--master-local-ssd-interface`,\n`--worker-local-ssd-interface`, and\n`--secondary-worker-local-ssd-interface` flags\nto specify the local SSD interface for master, primary, and secondary\nworker nodes.\n\n**Example:** \n\n```\ngcloud dataproc clusters create cluster-name \\\n --region=region \\\n --num-master-local-ssds=1 \\\n --num-worker-local-ssds=1 \\\n --num-secondary-worker-local-ssds=1 \\\n --master-local-ssd-interface=NVME \\\n --worker-local-ssd-interface=NVME \\\n --secondary-worker-local-ssd-interface=NVME \\\n ... other args ...\n```\n\nREST API\n\nSet the\n[numLocalSsds](/dataproc/docs/reference/rest/v1/ClusterConfig#diskconfig)\nfield in the `masterConfig`, `workerConfig`, and\n`secondaryWorkerConfig`\n[InstanceGroupConfig](/dataproc/docs/reference/rest/v1/ClusterConfig#InstanceGroupConfig)\nin a\n[cluster.create](/dataproc/docs/reference/rest/v1/projects.regions.clusters/create)\nAPI request to attach local SSDs to the cluster's master, primary worker, and\nsecondary worker nodes.\n\nLocal SSDs can be attached to Dataproc VMs using a SCSI\n(Small Computer System Interface) or NVME (Non-Volatile Memory Express) interface (see\n[local SSD performance](/compute/docs/disks/local-ssd#performance)).\nThe default Dataproc cluster VM local SSD interface is the SCSI interface. Set the\n[localSsdInterface](/dataproc/docs/reference/rest/v1/ClusterConfig#diskconfig)\nfield in the `masterConfig`, `workerConfig`, and\n`secondaryWorkerConfig`\n[InstanceGroupConfig](/dataproc/docs/reference/rest/v1/ClusterConfig#InstanceGroupConfig)\nin a\n[cluster.create](/dataproc/docs/reference/rest/v1/projects.regions.clusters/create)\nAPI request to specify the \"SCSI\" or \"NVME\" interface to attach local SSDs to the cluster's master,\nprimary worker, and secondary worker nodes.\n\nConsole\n\nCreate a cluster and attach local SSDs to the master,\nprimary, and secondary worker nodes from the Configure nodes panel of the\nDataproc\n[Create a cluster](https://console.cloud.google.com/dataproc/clustersAdd) page\nof the Google Cloud console."]]