Esta página ofrece una descripción general del espacio de nombres jerárquico, las funciones clave, los casos de uso, los beneficios y las limitaciones que hay que tener en cuenta.
Descripción general
El espacio de nombres jerárquico es una función que ofrece Cloud Storage que te permite organizar objetos en carpetas. Con el espacio de nombres jerárquico, puedes almacenar tus datos en una estructura lógica de sistema de archivos. Organizar tus datos en una estructura de sistema de archivos mejora el rendimiento, garantiza la coherencia y simplifica la administración de cargas de trabajo que consumen muchos datos y orientadas a archivos.
Las operaciones de administración de carpetas brindan confiabilidad y capacidades de administración, como crear, borrar, enumerar y cambiar el nombre de las carpetas. La organización jerárquica de los objetos simplifica la organización de los datos y optimiza las tareas de administración de datos. Una carpeta en un bucket con espacio de nombres jerárquico habilitado puede contener objetos, otras carpetas o una combinación de ambos.
Solo puedes habilitar el espacio de nombres jerárquico cuando creas un bucket. Si deseas obtener información sobre cómo habilitar el espacio de nombres jerárquico para tu bucket, consulta Crea y administra buckets con espacio de nombres jerárquico habilitado.
En el siguiente diagrama, se muestra un ejemplo de un bucket con el espacio de nombres jerárquico habilitado en el que los objetos se organizan en una estructura jerárquica de carpetas.
Características clave
El espacio de nombres jerárquico proporciona las siguientes funciones:
Consultas por segundo (QPS) iniciales más altas: Los buckets con espacio de nombres jerárquico habilitado ofrecen una mayor cantidad de QPS iniciales para las operaciones de lectura y escritura en comparación con los buckets sin espacios de nombres jerárquicos habilitados. Las QPS iniciales más altas hacen que sea más fácil escalar cargas de trabajo con una gran cantidad de datos y proporcionan una capacidad de procesamiento mejorada.
Carpetas: Las carpetas actúan como un contenedor de objetos y otras carpetas y admiten operaciones como crear, borrar y obtener carpetas.
Cambia el nombre de las carpetas: La operación para cambiar el nombre de las carpetas te ayuda a cambiar de forma atómica el nombre de la ruta de acceso de una carpeta y sus carpetas subyacentes sin borrar ningún objeto. Esta técnica es eficiente y te ahorra tiempo, especialmente para las carpetas grandes con varios objetos.
Enumera carpetas: La operación para enumerar carpetas enumera todas las carpetas en el bucket o en una carpeta específica, lo que te ayudará a administrar y comprender la estructura de los datos almacenados en un bucket.
Cuándo debes habilitar el espacio de nombres jerárquico para tu bucket
Debes considerar habilitar el espacio de nombres jerárquico cuando uses aplicaciones que esperan una jerarquía y semántica similar a un sistema de archivos. El espacio de nombres jerárquico es beneficioso para tareas con grandes volúmenes de datos, como analítica, IA y cargas de trabajo de AA. Estos son algunos casos comunes en los que deberías considerar usar el espacio de nombres jerárquico:
Procesamiento basado en Hadoop: Las cargas de trabajo de Hadoop y Spark tradicionalmente esperan una estructura de almacenamiento similar a un sistema de archivos y una asignación de nombres basada en el tiempo para archivos y carpetas. El espacio de nombres jerárquico se integra en el conector de Cloud Storage para proporcionar una capacidad de procesamiento mejorada y cambios de nombre de carpetas atómicos, lo que mejora la coherencia y la integridad de los datos para muchas canalizaciones de procesamiento de datos.
Procesamiento de cargas de trabajo orientadas a archivos: Las cargas de trabajo como el procesamiento de análisis por lotes, los servicios financieros o la computación de alto rendimiento se estructuran en particiones según una jerarquía de carpetas y archivos. El espacio de nombres jerárquico ayuda a administrar estos entornos con una API dedicada para la administración de carpetas. Además, el espacio de nombres jerárquico simplifica la administración de carpetas que contienen otras carpetas y objetos. Con un solo comando de API, puedes renombrar rápidamente una carpeta junto con todo su contenido y, así, ahorrar tiempo y recursos valiosos.
Procesamiento de IA y AA: Herramientas de IA y AA como TensorFlow, Pandas y PyTorch esperan acceso y semántica similares al sistema de archivos. El espacio de nombres jerárquico, en especial cuando se combina con Cloud Storage FUSE, proporciona mayor capacidad de procesamiento y acceso eficiente a los datos. Como resultado, el espacio de nombres jerárquico mejora el rendimiento y la confiabilidad de la iteración del modelo de AA.
Antes de habilitar el espacio de nombres jerárquico para tu bucket, debes considerar las limitaciones del espacio de nombres jerárquico. Para obtener información sobre las limitaciones de espacios de nombres jerárquicos, consulta Limitaciones.
Beneficios del espacio de nombres jerárquico
Cuando habilitas el espacio de nombres jerárquico para tus buckets, puedes realizar lo siguiente:
Optimizar la organización: Puedes organizar los datos en una estructura de carpeta jerárquica, que te ayuda a administrar y ubicar archivos o conjuntos de datos.
Establecer un ecosistema similar a un sistema de archivos: El espacio de nombres jerárquico presenta funciones similares a las del sistema de archivos, como carpetas, cambio de nombre de carpetas y enumeración de carpetas, que son beneficiosas para aplicaciones orientadas a archivos, incluidos el ecosistema de Hadoop y las cargas de trabajo de IA y AA.
Mejora del rendimiento: escalando las cargas de trabajo que consumen muchos datos para manejar una capacidad de procesamiento más grande, puedes mejorar el rendimiento general de tu aplicación.
Plataformas compatibles
Los buckets con espacios de nombres jerárquicos admiten las siguientes capacidades de la plataforma de Cloud Storage:
Todas las APIs de objetos de Cloud Storage y las funciones de Cloud Storage que más se usan. Para obtener detalles sobre las funciones no admitidas, Consulta Limitaciones.
Transferencia de datos de un bucket estándar a un bucket con espacio de nombres jerárquico mediante el Servicio de transferencia de almacenamiento.
Integración en los siguientes productos:
Cloud Storage Connector, que Dataproc mantiene para las cargas de trabajo de Hadoop. Para obtener más información, consulta Usa buckets con espacio de nombres jerárquico habilitado para las cargas de trabajo de Hadoop
Cloud Storage FUSE para el acceso a buckets similar al sistema de archivos mediante clientes
Limitaciones
Las siguientes son las limitaciones del espacio de nombres jerárquico:
Solo puedes habilitar el espacio de nombres jerárquico cuando creas un bucket. No puedes modificar buckets con un espacio de nombres plano para incluir un espacio de nombres jerárquico.
Las siguientes capacidades de Cloud Storage no se admiten en versión preliminar para los buckets que usan espacio de nombres jerárquico:
- Borrar de forma no definitiva
- Autoclass
- Control de versiones de los objetos
- LCA de objetos
- Bloqueo de retención de objetos
- Bloqueo del bucket
Si bien puedes ver los buckets creados con un espacio de nombres jerárquico en la consola de Google Cloud, no puedes administrar sus carpetas con la consola de Google Cloud. Recomendamos usar la línea de comandos, las APIs de REST o las bibliotecas cliente para la administración de carpetas.
¿Qué sigue?
- Crea y administra buckets con el espacio de nombres jerárquico habilitado.
- Crea y administra carpetas.
- Cambia el nombre de las carpetas.
- Usa el espacio de nombres jerárquico para las cargas de trabajo de Hadoop.
Pruébalo tú mismo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Cloud Storage en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
Probar Cloud Storage gratis