Parallelstore es un sistema de archivos distribuido de baja latencia y completamente administrado que está diseñado para satisfacer las demandas de la computación de alto rendimiento (HPC) y las aplicaciones intensivas en datos.
Parallelstore es ideal para casos de uso en los que varios clientes necesitan acceso simultáneo a archivos compartidos con integridad de datos.
Parallelstore admite el estándar POSIX, lo que garantiza la compatibilidad con una amplia variedad de aplicaciones y herramientas existentes, y simplifica la migración y la integración.
Las instancias de Parallelstore se pueden activar en VMs de Compute Engine o en clústeres de Google Kubernetes Engine. El controlador CSI de Parallelstore permite a los clientes usar las APIs de Kubernetes para acceder al sistema de archivos como volúmenes para sus cargas de trabajo con estado.
Las transferencias de datos por lotes hacia y desde Cloud Storage están disponibles desde la línea de comandos y la API de REST.
Especificaciones
Parallelstore es un sistema de archivos "en blanco": está respaldado por un SSD local con codificación de borrado 2+1, con un tiempo medio de pérdida de datos (MTTDL) de 2 a 16 meses, según la capacidad de la instancia. Consulta la tabla Rendimiento para obtener más detalles.
La capacidad utilizable se puede configurar de 12 TiB a 100 TiB.
Se admite en varias regiones.
Rendimiento
En la siguiente tabla, se muestra el rendimiento esperado de Parallelstore.
Métrica | Resultado |
---|---|
Capacidad de procesamiento de escritura | 0.5 GiBps por TiB |
Capacidad de procesamiento de lectura | 1.15 GiBps por TiB |
IOPS de lectura | 30,000 IOPS por TiB |
IOPS de escritura | 10,000 IOPS por TiB |
Latencia de lectura 4K | 0.3 ms |
Cantidad de procesos de cliente admitidos | 4000 |
Velocidad de transferencia (Parallelstore <> Cloud Storage) | Tasa de transferencia máxima de 20 GiBps o 5,000 archivos por segundo |
Tiempo promedio de pérdida de datos (MTTDL) | Capacidad de 100 TiB: 2 meses
Capacidad de 48 TiB: 4 meses Capacidad de 12 TiB: 16 meses |
Estas cifras se miden con 256 conexiones de cliente a una sola instancia. La latencia se mide desde un solo cliente. La configuración de la eliminación de directorios y archivos se optimiza para cada métrica.
Casos de uso
Computación de alto rendimiento: Parallelstore se destaca en entornos de HPC en los que varios nodos de procesamiento necesitan acceso rápido y coherente a los datos compartidos para simulaciones, modelado y análisis.
Aprendizaje automático: Parallelstore puede controlar los grandes conjuntos de datos y los requisitos de alta productividad de las cargas de trabajo de aprendizaje automático, lo que permite una capacitación y una inferencia eficientes.
Precios
Consulta la página Precios para obtener más detalles.