En esta página, se muestra cómo crear una copia de seguridad y restablecer un esquema de Ranger en Dataproc con clústeres de Ranger.
Antes de comenzar
Crea un bucket si es necesario. Debes tener acceso a un bucket de Cloud Storage, que usarás para almacenar y restablecer un esquema de Ranger.
Sigue estos pasos para crear un bucket:
- En la consola de Google Cloud, ve a la página Buckets de Cloud Storage.
- Haga clic en Crear bucket.
- En la página Crear un bucket, ingresa la información de tu bucket. Para ir al paso siguiente, haz clic en Continuar.
- En Nombre de tu bucket, ingresa un nombre que cumpla con los requisitos de nomenclatura de buckets.
-
En Elige dónde almacenar tus datos, haz lo siguiente:
- Selecciona una opción de Tipo de ubicación.
- Selecciona una opción de Ubicación.
- Para Elegir una clase de almacenamiento predeterminada para tus datos, selecciona una clase de almacenamiento.
- En Elige cómo controlar el acceso a los objetos, selecciona una opción de Control de acceso.
- Para la Configuración avanzada (opcional), especifica un método de encriptación, una política de retención o etiquetas de bucket.
- Haga clic en Crear.
Crea una copia de seguridad de un esquema de Ranger
Usa SSH para conectarte al nodo principal de Dataproc del clúster con el esquema de Ranger. Ejecuta los comandos de esta sección en la sesión de la terminal SSH que se ejecuta en el nodo principal.
Configurar variables de entorno
BUCKET_NAME=bucket name \ MYSQL_PASSWORD=MySQL password SCHEMA_FILE=schema filename
Reemplaza lo siguiente:
MySQL password: Puedes abrir
/etc/mysql/my.cnf
en el clúster. de la instancia principal para copiar la contraseña de MySQL.bucket name: Es el nombre del bucket de Cloud Storage que se usará. para almacenar el esquema de Ranger.
schema filename: Especifica un nombre de archivo. sin la extensión de nombre de archivo
.sql
. Se guardó el esquema de Ranger a este archivo en el nodo principal y, luego, se guarda en bucket name en Cloud Storage .
Detén los servicios de Hive.
sudo systemctl stop hive-metastore.service sudo systemctl stop hive-server2.service
Evitar cambios en las tablas de esquema de Ranger
mysql -u root -p${MYSQL_PASSWORD} REVOKE ALL PRIVILEGES ON ranger.* from 'rangeradmin'@'localhost'; GRANT SELECT ON ranger.* TO 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
Guarda el esquema de Ranger en un archivo
.sql
.mysqldump -u root -p${MYSQL_PASSWORD} ranger > ${SCHEMA_FILE}.sql
Restablece los privilegios de guardaparques.
mysql -u root -p${MYSQL_PASSWORD} REVOKE SELECT ON ranger.* from 'rangeradmin'@'localhost'; GRANT ALL PRIVILEGES ON ranger.* to 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
Reinicia los servicios de Hive y Ranger.
sudo systemctl start hive-metastore.service sudo systemctl start hive-server2.service sudo systemctl restart ranger-admin.service sudo systemctl restart ranger-usersync.service
Copia el esquema de Ranger en Cloud Storage.
gcloud storage cp ${SCHEMA_FILE}.sql gs://${BUCKET_NAME}
Restablece un esquema de Ranger
Usa SSH para conectarte al nodo principal de Dataproc del clúster en el que restablecerá el esquema del clúster. Ejecuta los comandos de esta sección en la sesión de la terminal SSH que se ejecuta en el nodo principal.
Configurar variables de entorno
BUCKET_NAME=bucket name \ MYSQL_PASSWORD=MySQL password SCHEMA_FILE=schema filename
Reemplaza lo siguiente:
MySQL password: Puedes abrir
/etc/mysql/my.cnf
en el clúster. de la instancia principal para copiar la contraseña de MySQL.bucket name: Es el nombre del bucket de Cloud Storage. que contiene el esquema de Ranger guardado.
schema filename: Es el nombre del esquema de Ranger. nombre de archivo, sin la extensión del nombre de archivo
.sql
, guardado en bucket name en Cloud Storage.
Detén los servicios de Hive.
sudo systemctl stop hive-metastore.service sudo systemctl stop hive-server2.service
Evitar cambios en las tablas de esquema de Ranger
mysql -u root -p${MYSQL_PASSWORD} REVOKE ALL PRIVILEGES ON ranger.* from 'rangeradmin'@'localhost'; GRANT SELECT ON ranger.* TO 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
Copia el archivo
.sql
del esquema de Ranger en Cloud Storage en el clúster en tu nodo principal.gcloud storage cp ${BUCKET_NAME}/${SCHEMA_FILE}.sql .
Restablece el esquema de Ranger. En este paso, se reemplaza el contenido del esquema existente de Ranger.
mysqldump -u root -p${MYSQL_PASSWORD} ranger < ${SCHEMA_FILE}.sql
Restablece los privilegios de guardaparques.
mysql -u root -p${MYSQL_PASSWORD} REVOKE SELECT ON ranger.* from 'rangeradmin'@'localhost'; GRANT ALL PRIVILEGES ON ranger.* to 'rangeradmin'@'localhost'; FLUSH PRIVILEGES; SHOW GRANTS FOR 'rangeradmin'@'localhost'; exit;
Actualiza los archivos de configuración de Ranger. Cambia el host de la base de datos de Ranger a uno nuevo nombre de host de la base de datos en los siguientes archivos con las siguientes propiedades:
Archivo Propiedad ranger-hdfs-security.xml
ranger.plugin.hdfs.policy.rest.url
ranger-yarn-security.xml
ranger.plugin.yarn.policy.rest.url
Reinicia los servicios de Hive y Ranger.
sudo systemctl start hive-metastore.service sudo systemctl start hive-server2.service sudo systemctl restart ranger-admin.service sudo systemctl restart ranger-usersync.service