이 페이지에서는 Cloud Data Fusion에서 서비스 계정이 사용되는 방법을 설명합니다. 자세한 내용은 서비스 계정 사용을 참조하세요.
테넌트 및 고객 프로젝트
Cloud Data Fusion은 서비스 계정을 설정하여 다음 프로젝트의 리소스에 액세스합니다.
테넌트 프로젝트
Cloud Data Fusion은 사용자를 대신하여 파이프라인을 관리하는 데 필요한 리소스와 서비스를 보관할 테넌트 프로젝트를 만듭니다. 예를 들어 고객 프로젝트에 있는 Dataproc 클러스터에서 파이프라인을 실행합니다. 테넌트 프로젝트는 사용자에게 노출되지 않지만 비공개 인스턴스를 만들 때 테넌트 프로젝트 이름을 사용하여 VPC 피어링을 설정해야 할 수 있습니다.
자세한 내용은 테넌트 프로젝트에 대한 Service Infrastructure 문서를 참조하세요.
고객 프로젝트
사용자가 이 프로젝트를 만들고 소유합니다. 기본적으로 Cloud Data Fusion은 파이프라인을 실행하기 위해 이 프로젝트에 임시 Dataproc 클러스터를 만듭니다.
다음 다이어그램은 테넌트 프로젝트에서 실행 중인 Cloud Data Fusion 인스턴스와 고객 프로젝트의 Dataproc 클러스터에서 실행되는 파이프라인을 보여줍니다.
Cloud Data Fusion의 서비스 계정
서비스 계정은 Cloud Data Fusion에 ID를 제공하여 Cloud Data Fusion이 리소스에 액세스할 수 있게 합니다.
Cloud Data Fusion API를 사용 설정하면 Cloud Data Fusion은 서비스 계정을 만들어 서비스 네트워킹, Dataproc, Cloud Storage, BigQuery, Spanner, Bigtable 리소스와 같은 리소스에 대한 액세스 권한을 얻습니다. 이 서비스 계정을 Cloud Data Fusion API 서비스 에이전트라고 합니다.
역할은 이 서비스 에이전트에 자동으로 부여됩니다.
서비스 계정은 계정 고유의 이메일 주소로 식별됩니다.
Cloud Data Fusion에서 사용되는 서비스 계정 유형은 다음과 같습니다. 자세한 내용은 서비스 계정 유형을 참조하세요.
서비스 에이전트, 즉 Cloud Data Fusion이 고객을 대신하여 작업할 수 있도록 고객 리소스에 대한 액세스 권한을 얻기 위해 만드는 Cloud Data Fusion API 서비스 에이전트입니다. 테넌트 프로젝트에서 고객 프로젝트 리소스에 액세스하는 데 사용됩니다. 예를 들어 미리보기는 Dataproc 클러스터 대신 메모리에서 실행됩니다.
Cloud Data Fusion이 다른 Google Cloud 리소스에 액세스하는 작업을 배포하기 위해 만드는 기본 Compute Engine 서비스 계정입니다. 기본적으로 Dataproc 클러스터 VM에 연결하여 파이프라인 실행 중에 Cloud Data Fusion이 Dataproc 리소스에 액세스할 수 있도록 합니다. Cloud Data Fusion 콘솔→시스템 관리자→구성 탭에서 프로필을 만들고 커스텀 서비스 계정을 추가하여 Cloud Data Fusion Enterprise 버전에서 사용자 관리 서비스 계정으로 파이프라인을 실행할 수 있습니다. 버전 6.2.3 이상에서는 Cloud Data Fusion 인스턴스를 만들 때 Dataproc 클러스터에 연결할 커스텀 서비스 계정을 선택할 수 있습니다. 자세한 내용은
Dataproc의 서비스 계정을 참조하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eCloud Data Fusion uses service accounts to access resources in both tenant and customer projects, enabling it to manage pipelines on the user's behalf.\u003c/p\u003e\n"],["\u003cp\u003eThe Cloud Data Fusion API Service Agent is a service account created automatically when enabling the Cloud Data Fusion API, granting it access to resources like Service Networking, Dataproc, Cloud Storage, and others.\u003c/p\u003e\n"],["\u003cp\u003eA default Compute Engine service account is also created to deploy jobs that access other Google Cloud resources, which can attach to a Dataproc cluster VM to enable Cloud Data Fusion to access Dataproc resources during pipeline runs.\u003c/p\u003e\n"],["\u003cp\u003eIn Cloud Data Fusion Enterprise edition, pipelines can run from a user-managed service account by creating a profile in the Cloud Data Fusion console, enhancing control and customization.\u003c/p\u003e\n"],["\u003cp\u003eCustomer project is owned by the customer and is the location where the ephemeral Dataproc cluster is located in order to run the user's pipelines.\u003c/p\u003e\n"]]],[],null,["# Service accounts in Cloud Data Fusion\n\nThis page describes how service accounts are used in Cloud Data Fusion. For\nmore information, see [Use service accounts](/iam/docs/service-accounts).\n\n### Tenant and customer projects\n\nCloud Data Fusion sets up service accounts to access resources in the\nfollowing projects:\n\nTenant project\n\n: Cloud Data Fusion creates a tenant project to hold the resources and\n services it needs to manage pipelines on your behalf. For example: running\n pipelines on your Dataproc clusters that reside in your customer\n project. A tenant project is not exposed to you, but when you create a\n private instance, you might need to use the tenant project name to set up VPC\n peering.\n\n For more information, see the Service Infrastructure documentation about\n [tenant projects](/service-infrastructure/docs/glossary#tenant).\n\nCustomer project\n\n: You create and own this project. By default, Cloud Data Fusion creates an\n ephemeral Dataproc cluster in this project to run the your\n pipelines.\n\nThe following diagram shows a Cloud Data Fusion instance running in a\ntenant project and a pipeline running on a Dataproc cluster in a\ncustomer project.\n\nService accounts in Cloud Data Fusion\n-------------------------------------\n\nA service account provides an identity for Cloud Data Fusion, which gives\nCloud Data Fusion access to your resources.\n\nWhen you enable the Cloud Data Fusion API and create a\nCloud Data Fusion instance, a service account is added to your project to\naccess resources like Service Networking,\nDataproc, Cloud Storage, BigQuery, Spanner,\nand Bigtable. This service account is called the\n[Cloud Data Fusion API Service Agent](/iam/docs/understanding-roles#datafusion.serviceAgent).\nRoles are automatically granted to this service agent.\n\nA service account is identified by its email address, which is unique to the\naccount.\n\nThe following types of service accounts are used in Cloud Data Fusion. For\nmore information, see [Types of service accounts](/iam/docs/service-account-types).\n\nWhat's next\n-----------\n\n- Learn about [controlling access to data](/data-fusion/docs/access-control).\n- [Give Service Account User permissions](/data-fusion/docs/how-to/granting-service-account-permission).\n- See Cloud Data Fusion [pricing](/data-fusion/pricing)."]]