Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta página, se explican las funciones de administración que proporciona Cloud Data Fusion Studio para administrar las configuraciones.
Cloud Data Fusion sigue una jerarquía, en la que cada instancia puede tener varios espacios de nombres. Desde Cloud Data Fusion Studio, los administradores pueden administrar todos los espacios de nombres de forma centralizada o individual.
Cloud Data Fusion Studio proporciona los siguientes controles de sistema y espacio de nombres.
Administración del sistema
Si haces clic en Administrador del sistema en Cloud Data Fusion Studio, se mostrarán las siguientes pestañas:
La pestaña Administración: Consulta el estado del servicio de varios servicios de Cloud Data Fusion. También puedes ver los registros de cada uno de los
servicios.
La pestaña Configuración: Crea, visualiza y edita los siguientes controles:
Perfiles de procesamiento del sistema. Los perfiles de procesamiento indican qué aprovisionador usar cuando se crea un clúster para la ejecución de la canalización y se aplican las configuraciones asociadas.
Los aprovisionadores son responsables de crear, inicializar y destruir el entorno de nube en el que se ejecutan las canalizaciones. Cada aprovisionador expone un conjunto de configuraciones que se usan para controlar qué tipo de clúster se crea y se borra. Los diferentes aprovisionadores crean diferentes tipos de clústeres.
Cada perfil de procesamiento tiene un alcance: sistema o usuario. Puedes usar un perfil de procesamiento del sistema para cualquier espacio de nombres que se encuentre debajo de él. Los perfiles de procesamiento del usuario existen dentro de un espacio de nombres, y solo las canalizaciones de ese espacio de nombres pueden usar los perfiles de procesamiento del usuario.
En la pestaña Configuraciones del administrador del sistema, puedes crear un perfil de procesamiento del sistema que se aplique a todos los espacios de nombres. Cloud Data Fusion asigna un perfil de procesamiento predeterminado.
Cuando creas un perfil de procesamiento, seleccionas el aprovisionador, que el perfil usa para crear y configurar los detalles del entorno de ejecución en la nube.
Preferencias del sistema
Las preferencias son configuraciones predefinidas que se aplican en varios niveles dentro de
Cloud Data Fusion, incluido el sistema en sí, los espacios de nombres, las aplicaciones
(que contienen canalizaciones) y los programas individuales dentro de las canalizaciones. Las preferencias proporcionan una forma de establecer valores predeterminados para las configuraciones de uso general. Estos valores predeterminados pueden heredarse en canalizaciones y programas en niveles inferiores, lo que reduce las tareas de configuración repetitivas. Para obtener más información, consulta Administra macros, preferencias y argumentos del entorno de ejecución.
Acción de llamada HTTP
La acción de llamada HTTP en la página Administrador del sistema te permite interactuar con la propia API de Cloud Data Fusion o, posiblemente, con otras APIs de Google Cloud servicios, directamente desde la interfaz de Studio de Cloud Data Fusion. Sin embargo, para compilar canalizaciones de procesamiento de datos con fuentes de datos externas, usa el complemento HTTP y su ejecutor de llamadas HTTP dentro de tus canalizaciones para obtener una solución más integral. Difiere ligeramente de la acción de llamada HTTP, pero los
conceptos subyacentes son similares.
Configuraciones y casos de uso
La acción de llamada HTTP se usa principalmente para tareas administrativas o
de configuración en Cloud Data Fusion. Te permite interactuar
con la API de Cloud Data Fusion o con otros Google Cloud servicios
que exponen una API de HTTP, directamente desde Studio de Cloud Data Fusion.
Configuraciones
Puedes definir los siguientes detalles para una llamada HTTP:
URL: Es el extremo de destino del servicio web al que deseas llamar.
Método: Es el método HTTP que se usará, como GET, POST o PUT.
Opcional: Encabezados: Cualquier encabezado personalizado necesario para la solicitud.
Opcional: Cuerpo: Datos que se enviarán en el cuerpo de la solicitud, como en las llamadas a POST y PUT.
Luego, puedes ejecutar la llamada HTTP definida y ver la respuesta del servicio web en Cloud Data Fusion Studio.
Casos de uso
Probar las llamadas a la API de Cloud Data Fusion Puedes usar la acción de llamada HTTP para probar o explorar las funciones de la API de Cloud Data Fusion directamente desde la interfaz web. Esta acción puede ser útil para comprender el comportamiento de la API o solucionar posibles problemas.
Administrar espacios de nombres (avanzado) Si bien hay una IU dedicada para la administración de espacios de nombres, la acción de llamada HTTP se puede usar para tareas avanzadas realizando llamadas directamente a la API de Cloud Data Fusion para la creación, eliminación o configuración de espacios de nombres.
Interactuar con otros Google Cloud servicios (limitado).
Si otros Google Cloud servicios que usas tienen una API de HTTP documentada públicamente, puedes usar la acción de llamada HTTP para interactuar con esos servicios, aunque este es un caso de uso poco común.
Consideraciones importantes
Seguridad: Ten cuidado cuando uses la acción de llamada HTTP,
especialmente con datos sensibles o llamadas a la API de Cloud Data Fusion que
podrían afectar tu entorno. Asegúrate de comprender las implicaciones de cada llamada a la API antes de ejecutarla.
Limitaciones: La acción de llamada HTTP se usa principalmente para tareas administrativas y pruebas. No está diseñado para compilar
canalizaciones de procesamiento de datos complejas que impliquen la manipulación de datos dentro
de Cloud Data Fusion.
Alternativa para canalizaciones: Para integrar fuentes de datos o servicios externos en tus canalizaciones de datos, usa el complemento HTTP y su ejecutor de llamadas HTTP asociado dentro de las definiciones de tus canalizaciones. Esto proporciona una forma más sólida y controlada de administrar las interacciones HTTP en tus flujos de trabajo de procesamiento de datos.
Administración de espacios de nombres
Si haces clic en Administrador de espacios de nombres en Studio de Cloud Data Fusion, puedes gestionar las configuraciones del espacio de nombres específico. Para cada espacio de nombres, puedes definir los siguientes aspectos:
Perfiles de cálculo: Los perfiles configurados en el administrador de espacios de nombres son perfiles de cálculo de usuario. Solo las canalizaciones de ese espacio de nombres pueden usar estos perfiles de procesamiento del usuario. Para obtener más información, consulta Administra perfiles de procesamiento.
Preferencias: Las preferencias definidas a nivel del espacio de nombres se aplican al espacio de nombres, a las aplicaciones (que contienen canalización) y a los programas individuales dentro de las canalizaciones. Para obtener más información, consulta Administra macros, preferencias y argumentos del entorno de ejecución.
Conexiones: Cloud Data Fusion te permite volver a usar las conexiones a fuentes y receptores en las canalizaciones de datos. Puedes agregar conexiones en la página Administrador de espacio de nombres. Para obtener más información, consulta Cómo crear y administrar conexiones.
Controladores: Algunos complementos de Cloud Data Fusion requieren que se agregue un controlador de JDBC al espacio de nombres. Por ejemplo, antes de que puedas ejecutar una canalización con un
complemento de origen por lotes de MySQL, debes agregar el controlador de MySQL compatible al
espacio de nombres. Puedes subir o quitar controladores JDBC a un espacio de nombres desde la página Administrador de espacios de nombres o directamente desde el centro. Para obtener más información, consulta Controladores de complementos.
Administración de control de código fuente: Para administrar de manera eficiente el proceso de desarrollo de las canalizaciónes implementadas, la administración de control de código fuente te permite conectar un espacio de nombres con el repositorio de tu sistema de control de código fuente. Para obtener más información, consulta Administra canalizaciones con la administración de control de código fuente.
Cuenta de servicio: Para controlar el acceso a los Google Cloud recursos, los espacios de nombres en Cloud Data Fusion usan el
Agente de servicio de la API de Cloud Data Fusion de forma predeterminada.
Para lograr un mejor aislamiento de datos, puedes asociar una cuenta de servicio de Identity and Access Management (IAM) personalizada (conocida como cuenta de servicio por espacio de nombres) con cada espacio de nombres. La cuenta de servicio de IAM personalizada, que puede ser diferente para diferentes espacios de nombres, te permite controlar el acceso a los recursos de Google Cloud entre espacios de nombres para las operaciones de tiempo de diseño de canalización en Cloud Data Fusion, como la vista previa de canalización, Wrangler y la validación de canalización. Para obtener más información, consulta Control de acceso con una cuenta de servicio de espacio de nombres.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eCloud Data Fusion Studio enables administrators to manage configurations across multiple namespaces, either centrally or individually, offering both system and namespace-specific controls.\u003c/p\u003e\n"],["\u003cp\u003eSystem administrators can manage compute profiles, define system-wide preferences, and view the health status of Cloud Data Fusion services through the Management and Configuration tabs.\u003c/p\u003e\n"],["\u003cp\u003eThe HTTP call action allows for direct interaction with Cloud Data Fusion's API and other Google Cloud service APIs for administrative tasks, but the HTTP plugin is recommended for building pipelines with external data sources.\u003c/p\u003e\n"],["\u003cp\u003eNamespace administrators can configure user compute profiles, preferences, connections, drivers, source control management, and service accounts, each specific to the namespace.\u003c/p\u003e\n"],["\u003cp\u003eCompute profiles determine which provisioner is used to create the cloud environment for pipelines, with system profiles applying to all namespaces and user profiles confined to a single namespace.\u003c/p\u003e\n"]]],[],null,["# Manage Studio administration\n\nThis page explains the administration capabilities that the Cloud Data Fusion Studio provides to manage configurations. Cloud Data Fusion follows a hierarchy, where each instance can have multiple [namespaces](/data-fusion/docs/how-to/control-access-in-namespace). From the Cloud Data Fusion Studio, administrators can centrally manage all namespaces, or manage them individually. Cloud Data Fusion Studio provides the following system and namespace controls.\n\n\u003cbr /\u003e\n\nSystem administration\n---------------------\n\nClicking **System admin** in the Cloud Data Fusion Studio displays the\nfollowing tabs:\n\n- The **Management** tab: view the health status of various Cloud Data Fusion services. You can also view logs for each of the services.\n- The **Configuration** tab: create, view, and edit the following controls:\n\n - **Namespaces** . For more information, see [Access control with a namespace service account](/data-fusion/docs/how-to/control-access-in-namespace).\n - **System compute profiles** . [Compute profiles](/data-fusion/docs/concepts/overview#concepts) indicate which provisioner to use when creating a cluster for pipeline execution and applying the associated configurations.\n\n*Provisioners* are responsible for creating, initializing, and destroying the\ncloud environment that pipelines run in. Each provisioner exposes a set of\nconfigurations that are used to control what type of cluster is created\nand deleted. Different provisioners create different types of clusters.\n| **Note:** The Dataproc provisioner is recommended.\n\nEach compute profile has a scope: system or user. You can use a system compute\nprofile for any namespaces under it. User compute profiles exist within a\nnamespace, and only pipelines in that namespace can use the user compute\nprofiles.\n\nOn the system administrator **Configurations** tab, you can create a system\ncompute profile that's applied to all the namespaces. Cloud Data Fusion\nassigns a default compute profile.\n\nWhen you create a compute profile, you select the provisioner, which the profile\nuses to create and configure the cloud runtime details.\n| **Note:** In general, provisioner configurations can be overridden at runtime. For more information, see [Manage compute profiles](/data-fusion/docs/how-to/manage-compute-profiles).\n\nSystem preferences\n------------------\n\nPreferences are predefined configurations that apply at various levels within\nCloud Data Fusion, including the system itself, namespaces, applications\n(which contain pipelines), and individual programs within pipelines. Preferences\nprovide a way to set default values for commonly used configurations. These\ndefaults can be inherited by pipelines and programs at lower levels, reducing\nrepetitive configuration tasks. For more information, see [Manage macros,\npreferences, and runtime arguments](/data-fusion/docs/how-to/manage-macros-prefs-and-runtime-args).\n\n### HTTP call action\n\nThe HTTP call action on the **System admin** page lets you interact with\nCloud Data Fusion's own API, or potentially other Google Cloud service\nAPIs, directly from the Cloud Data Fusion Studio interface. However, for\nbuilding data processing pipelines with external data sources, instead use the\nHTTP plugin and its HTTP call Executor within your pipelines for a more\ncomprehensive solution. It differs slightly from the HTTP call action, but the\nunderlying concepts are alike. \n\n#### Configurations and use cases\n\nThe HTTP call action is primarily used for administrative tasks or\nconfiguration purposes within Cloud Data Fusion. It lets you interact\nwith the Cloud Data Fusion API or other Google Cloud services\nthat expose an HTTP API, directly from the Cloud Data Fusion\nStudio.\n\n##### Configurations\n\nYou can define the following details for an HTTP call:\n\n- **URL**: the target endpoint of the web service you want to call.\n- **Method** : the HTTP method to use, such as `GET`, `POST`, or `PUT`.\n- Optional: **Headers**: any custom headers required for the request.\n- Optional: **Body** : data to be sent in the request body, such as for `POST` and `PUT` calls.\n\nYou can then execute the defined HTTP call and view the response from the\nweb service within the Cloud Data Fusion Studio.\n\n##### Use cases\n\n- **Test Cloud Data Fusion API calls.** You can use the HTTP call action to test or explore Cloud Data Fusion API functionalities directly from the web interface. This action can be helpful for understanding API behavior or troubleshooting potential issues.\n- **Manage namespaces (advanced).** While there's a dedicated UI for namespace management, the HTTP call action can be used for advanced tasks by directly making calls to the Cloud Data Fusion API for namespace creation, deletion, or configuration.\n- **Interacting with other Google Cloud services (limited).** If other Google Cloud services you use have a publicly documented HTTP API, you can use the HTTP call action to interact with those services, though this is an uncommon use case.\n\n##### Important considerations\n\n- **Security**: be cautious when using the HTTP call action, especially with sensitive data or Cloud Data Fusion API calls that could impact your environment. Be sure that you understand the implications of each API call before executing it.\n- **Limitations**: the HTTP call action is primarily for administrative tasks and testing purposes. It's not designed for building complex data processing pipelines that involve data manipulation within Cloud Data Fusion.\n- **Alternative for pipelines**: for integrating external data sources or services into your data pipelines, use the HTTP plugin and its associated HTTP call executor within your pipeline definitions. This provides a more robust and controlled way to manage HTTP interactions within your data processing workflows.\n\nNamespace administration\n------------------------\n\nClicking **Namespace admin** in the Cloud Data Fusion Studio lets you\nmanage the configurations for the specific namespace. For each namespace, you\ncan define the following aspects:\n\n- **Compute profiles** : the profiles set up in **Namespace admin** are *user* compute profiles. Only pipelines in that namespace can use these user compute profiles. For more information, see [Manage compute profiles](/data-fusion/docs/how-to/manage-compute-profiles).\n- **Preferences** : preferences defined at namespace level are applicable to the namespace, applications (which contain pipelines), and individual programs within pipelines. For more information, see [Manage macros,\n preferences, and runtime arguments](/data-fusion/docs/how-to/manage-macros-prefs-and-runtime-args).\n- **Connections** : Cloud Data Fusion lets you reuse connections to sources and sinks in data pipelines. You can add connections in the Namespace Admin page. For more information, see [Create and manage connections](/data-fusion/docs/how-to/managing-connections).\n- **Drivers** : some plugins in Cloud Data Fusion require a JDBC driver to be added to the namespace. For example, before you can run a pipeline with a MySQL batch source plugin, you must add the supported MySQL driver to the namespace. You can upload or remove JDBC drivers to a namespace from the Namespace Admin page, or directly from the Hub. For more information, see [Plugin drivers](/data-fusion/docs/how-to/source-control-management).\n- **Source Control Management** : to efficiently manage the development process of deployed pipelines, Source Control Management lets you connect a namespace with the repository of your source control system. For more information, see [Manage pipelines using Source Control Management](/data-fusion/docs/how-to/source-control-management).\n- **Service account** : to control access to Google Cloud resources, namespaces in Cloud Data Fusion use the [Cloud Data Fusion API Service Agent](/iam/docs/understanding-roles#datafusion.serviceAgent) by default.\n\nFor better data isolation, you can associate a customized\nIdentity and Access Management (IAM) service account (known as a Per Namespace\nService Account) with each namespace. The customized IAM service\naccount, which can be different for different namespaces, lets you control\naccess to Google Cloud resources between namespaces for pipeline\ndesign-time operations in Cloud Data Fusion, such as pipeline preview,\nWrangler, and pipeline validation. For more information, see\n[Access control with namespace service account](/data-fusion/docs/how-to/control-access-in-namespace).\n\nWhat's next\n-----------\n\n- Learn more about [compute profiles](/data-fusion/docs/how-to/manage-compute-profiles).\n- Learn more about [macros, preferences, and runtime arguments](/data-fusion/docs/how-to/manage-macros-prefs-and-runtime-args)."]]