En esta página se ofrecen instrucciones detalladas sobre cómo configurar el acceso a la red para tus instancias de Dataproc Metastore. Es fundamental configurar correctamente la red para que los clústeres de Dataproc y las cargas de trabajo de Dataproc sin servidor puedan comunicarse de forma segura y privada con tu servicio de Dataproc Metastore gestionado.
Conceptos clave de redes
Las instancias de Dataproc Metastore suelen residir en una red de productores de servicios gestionada por Google y se comunican con tu red de nube privada virtual mediante conectividad privada. Es fundamental que conozcas los siguientes conceptos para configurar correctamente la cuenta:
- VPC compartida: si tus clústeres de Dataproc o tus cargas de trabajo de Dataproc sin servidor están en un proyecto de servicio que usa una red de VPC compartida de un proyecto host, comprueba que se hayan realizado las configuraciones de red adecuadas en el proyecto host. Para obtener más información, consulta la descripción general de la nube privada virtual compartida.
- Acceso privado de Google: las instancias de Dataproc Metastore suelen usar el acceso privado de Google para comunicarse de forma privada con tu red de nube privada virtual. De esta forma, las instancias de máquina virtual (VM) de tu nube privada virtual pueden conectarse a las APIs y los servicios de Google mediante direcciones IP internas. Para obtener más información, consulta el artículo Acceso privado a Google.
- Peering de redes de VPC: este mecanismo permite la conectividad de IP privada entre dos redes de nube privada virtual, lo que permite que los recursos de una red se comuniquen con los recursos de la otra mediante direcciones IP internas. Dataproc Metastore establece una conexión de emparejamiento de redes VPC gestionada con tu red de nube privada virtual como parte de su configuración. Para obtener más información, consulta Emparejamiento entre redes de VPC.
- Reglas de cortafuegos: es necesario que haya reglas de cortafuegos adecuadas para permitir el tráfico entre tus cargas de trabajo de Dataproc y la instancia de Dataproc Metastore.
- Resolución de Cloud DNS: comprueba que la resolución de DNS esté configurada correctamente en tu red de nube privada virtual para resolver el URI del endpoint de Dataproc Metastore en su dirección IP privada.
Pasos del proceso de configuración
Para verificar que tu instancia de Dataproc Metastore tiene acceso a la red, sigue estos pasos:
1. Configurar el acceso privado a servicios
Dataproc Metastore usa Private Service Access para establecer una conexión privada entre tu red de nube privada virtual y la red del productor de servicios gestionada por Google en la que reside tu instancia de Dataproc Metastore.
- Verificar la conexión de acceso a servicios privados:
- En la Google Cloud consola, ve a Red de nube privada virtual > Red de VPC emparejada.
- Verifica que existe una conexión de peering llamada
servicenetworking-googleapis-com
y que su estado esACTIVE
. - Si falta esta conexión o no está activa, sigue las instrucciones de Configurar el acceso privado a los servicios. Esto incluye la asignación de un intervalo de direcciones IP a la red del productor de servicios.
2. Configurar reglas de cortafuegos
Verifica que las reglas de cortafuegos de tu red de nube privada virtual (o del proyecto host de la nube privada virtual compartida, si procede) permitan el tráfico necesario.
- Regla de salida de la carga de trabajo a Metastore:
- Comprueba que una regla de cortafuegos de salida permita el tráfico TCP saliente de tu clúster de Dataproc o de tus cargas de trabajo de Dataproc sin servidor al intervalo de direcciones IP de tu instancia de Dataproc Metastore en el puerto
9083
. Este es el puerto predeterminado de Hive Metastore. - Si usas el acceso privado a servicios, este tráfico se enrutará de forma privada.
- Comprueba que una regla de cortafuegos de salida permita el tráfico TCP saliente de tu clúster de Dataproc o de tus cargas de trabajo de Dataproc sin servidor al intervalo de direcciones IP de tu instancia de Dataproc Metastore en el puerto
- Reglas de entrada (menos habituales para las comunicaciones entre el cliente y Metastore):
- Por lo general, no es necesario configurar reglas de entrada en tu nube privada virtual para el tráfico desde la instancia de Dataproc Metastore hasta tu carga de trabajo, ya que la comunicación suele originarse en la carga de trabajo. Sin embargo, comprueba que no haya reglas de entrada demasiado restrictivas que bloqueen por error las respuestas necesarias.
3. Verificar la resolución de DNS
Tus cargas de trabajo de Dataproc deben resolver el URI del endpoint de Dataproc Metastore en su dirección IP privada.
- Emparejamiento de DNS o zonas privadas: si utilizas servidores DNS personalizados o zonas de Cloud DNS privadas, verifica que las consultas de DNS del endpoint de Dataproc Metastore (por ejemplo,
your-metastore-endpoint.us-central1.dataproc.cloud.google.com
) se reenvían o resuelven correctamente al intervalo de IP privadas que usa Acceso privado a servicios. - Prueba de resolución de DNS: desde una VM de la misma subred que tu carga de trabajo de Dataproc, usa
nslookup
odig
para verificar que el endpoint de Dataproc Metastore se resuelve en una dirección IP privada.
Solucionar problemas de conectividad de red
Si tienes problemas de conectividad después de configurar el acceso a la red, sigue estos pasos para solucionarlos:
- Revisa el estado de Dataproc Metastore: comprueba que tu instancia de Dataproc Metastore tenga el estado
HEALTHY
en laGoogle Cloud consola. - Consulta Cloud Logging: examina Cloud Logging de tu instancia de Dataproc Metastore y las cargas de trabajo de Dataproc relacionadas para ver si hay mensajes de error relacionados con la red o tiempos de espera de conexión.
- Usa las pruebas de conectividad de Network Intelligence Center: usa las pruebas de conectividad de Google Cloudpara diagnosticar la ruta de red desde las VMs de tu carga de trabajo de Dataproc hasta el endpoint de Dataproc Metastore.
- Consulta la sección Solución de problemas generales: para obtener un diagnóstico de red más detallado, consulta lo siguiente:
Siguientes pasos
- Consulta más información sobre Dataproc Metastore.
- Consulta las opciones de redes de Dataproc.
- Familiarízate con el emparejamiento entre redes de VPC.