Usa el almacenamiento en caché de archivos de Cloud Storage FUSE

La característica de caché de archivos de Cloud Storage FUSE es una caché de lectura basada en el cliente que permite repetir las lecturas de archivos para entregarlas desde el almacenamiento en caché más rápido que elijas. En esta página, se describe cómo habilitar y usar el almacenamiento en caché de archivos de Cloud Storage FUSE. Para obtener una descripción general del almacenamiento en caché de archivos, de estadísticas o de tipo, consulta Descripción general del almacenamiento en caché.

Antes de comenzar

La caché de archivos requiere una ruta de acceso de directorio que se usará para almacenar los archivos en caché. Puedes crear un directorio nuevo en un sistema de archivos existente o crear un sistema de archivos nuevo en el almacenamiento aprovisionado. Si aprovisionas un almacenamiento nuevo para usar, sigue estas instrucciones para crear un sistema de archivos nuevo:

  1. Si quieres formatear un disco persistente, consulta las instrucciones de Compute Engine para formatear un disco persistente.

  2. Para crear discos RAM en la memoria, consulta las instrucciones de Compute Engine sobre cómo activar discos RAM.

  3. Si deseas formatear y activar SSD locales, consulta las instrucciones de Compute Engine para activar SSD locales. Si deseas combinar varias SSD locales en un solo volumen, consulta las instrucciones de Compute Engine para agregar una SSD local a tu VM.

Habilita y configura el comportamiento del almacenamiento en caché

  1. Habilita y configura el almacenamiento en caché de archivos mediante el campo file-cache en un archivo de configuración de Cloud Storage FUSE y especifica el directorio de caché que deseas usar en el campo cache-dir. La caché de archivos está inhabilitada de forma predeterminada. Ten en cuenta que puedes habilitar el almacenamiento en caché de archivos si pasas un directorio al campo cache-dir.

  2. Opcional: Configura el almacenamiento en caché de estadísticas y de tipo mediante el campo metadata-cache en un archivo de configuración. Para obtener más información sobre el almacenamiento en caché de estadísticas y tipos, consulta Descripción general del almacenamiento en caché de tipo o Descripción general del almacenamiento en caché de estadísticas.

  3. Opcional: Aumenta el TTL de las entradas almacenadas en caché mediante la configuración de la opción ttl-secs en un valor basado en el tiempo esperado entre las lecturas repetidas mientras equilibra las necesidades de coherencia. Te recomendamos que establezcas el valor ttl-secs en el mismo valor que tu carga de trabajo. Puedes configurar el TTL en un archivo de configuración de Cloud Storage FUSE. Si deseas obtener más información sobre cómo configurar un TTL para entradas almacenadas en caché, consulta Tiempo de actividad.

    Por ejemplo, el siguiente archivo de configuración habilita el almacenamiento en caché de archivos, de estadísticas y de tipos con un TTL de 3600 segundos, y el directorio de la caché configurado como /path/to/a/directory/. Ten en cuenta que max-size-mb se establece en -1, que configura la caché del archivo para usar toda la capacidad disponible.

    file-cache:
      max-size-mb: -1
      cache-file-for-range-read: false
    
    metadata-cache:
      stat-cache-max-size-mb: 32
      ttl-secs: 3600
      type-cache-max-size-mb: 4
    
    cache-dir: /path/to/a/directory
    
  4. Ejecuta de forma manual el comando ls -R en el bucket activado antes de ejecutar la carga de trabajo para propagar los metadatos con anterioridad para garantizar que la caché del tipo se propague antes de la primera lectura en un método por lotes más rápido.

¿Qué sigue?