프로비저닝 도구는 파이프라인이 실행되는 클라우드 클러스터를 만들고 해체하는 작업을 담당합니다. 다양한 프로비저닝 도구로 여러 가지 클라우드에서 서로 다른 유형의 클러스터를 만들 수 있습니다.
각 프로비저닝 도구는 실행을 위해 생성되는 클러스터의 유형을 제어하는 구성 설정 집합을 노출합니다. 예를 들어 Dataproc 및 Amazon EMR 프로비저닝 도구에는 클러스터 크기 설정이 있습니다. 프로비저닝 도구에는 개별 클라우드와 통신하고 필요한 컴퓨팅 노드를 프로비저닝하는 데 필요한 사용자 인증 정보에 대한 설정도 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eProvisioners manage the creation and deletion of cloud clusters for pipeline execution.\u003c/p\u003e\n"],["\u003cp\u003eDifferent provisioners enable the creation of various cluster types on different cloud platforms.\u003c/p\u003e\n"],["\u003cp\u003eProvisioners offer configuration settings to define the characteristics of the created cluster and credentials for cloud access.\u003c/p\u003e\n"],["\u003cp\u003eCloud Data Fusion supports Dataproc, Amazon EMR, and Remote Hadoop provisioners.\u003c/p\u003e\n"]]],[],null,["# Provisioners in Cloud Data Fusion\n\nA provisioner is responsible for creating and tearing down the cloud cluster\nwhere the pipeline is executed. Different provisioners are capable of\ncreating different types of clusters on various clouds.\n\nEach provisioner exposes a set of configuration settings that control the type\nof cluster that's created for a run. For example, the Dataproc\nand Amazon EMR provisioners have cluster size settings. Provisioners also have\nsettings for the credentials required to talk to their respective clouds and\nprovision the required compute nodes.\n\nSupported provisioners in Cloud Data Fusion\n-------------------------------------------\n\nCloud Data Fusion supports the following provisioners:\n\n[Dataproc](/data-fusion/docs/concepts/dataproc)\n: A fast, easy-to-use, and fully-managed cloud service for running Apache Spark\n and Apache Hadoop clusters.\n\nAmazon Elastic MapReduce (EMR)\n: Provides a managed Hadoop framework that processes vast amounts of data across\n dynamically scalable Amazon EC2 instances.\n\nRemote Hadoop\n: Runs jobs on a pre-existing Hadoop cluster, either on-premises or in the\n cloud."]]