이 페이지에서는 멀티 테이블 소스를 사용하여 Microsoft SQL Server 데이터베이스에서 여러 테이블을 읽는 방법을 설명합니다. 파이프라인을 여러 테이블에서 읽으려면 다중 테이블 소스를 사용합니다. 파이프라인을 단일 테이블에서 읽으려면 SQL Server 테이블에서 읽기를 참조하세요.
멀티 테이블 소스는 여러 스키마가 포함된 데이터를 출력하고 데이터 출처 테이블을 나타내는 테이블 이름 필드를 포함합니다. 멀티 테이블 소스를 사용할 때는 멀티 테이블 싱크, BigQuery 멀티 테이블 또는 GCS 멀티 파일 중 하나를 사용하세요.
시작하기 전에
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.
- Cloud Data Fusion 인스턴스를 만듭니다.
- SQL Server 데이터베이스가 Cloud Data Fusion에서 연결을 허용할 수 있는지 확인합니다. 이를 안전하게 수행하려면 비공개 Cloud Data Fusion 인스턴스를 만드는 것이 좋습니다.
Cloud Data Fusion 인스턴스 보기
Cloud Data Fusion을 사용할 때는 Google Cloud 콘솔과 별도의 Cloud Data Fusion UI를 모두 사용합니다. Google Cloud 콘솔에서 Google Cloud 프로젝트를 만들고 Cloud Data Fusion 인스턴스를 만들고 삭제할 수 있습니다. Cloud Data Fusion UI에서는 스튜디오 또는 Wrangler와 같은 다양한 페이지를 통해 Cloud Data Fusion 기능을 사용할 수 있습니다.
Google Cloud 콘솔에서 Cloud Data Fusion 페이지로 이동합니다.
Cloud Data Fusion 웹 인터페이스에서 인스턴스를 열려면 인스턴스를 클릭한 후 인스턴스 보기를 클릭합니다.
SQL Server 비밀번호를 보안 키로 저장합니다.
SQL Server 비밀번호를 보안 키로 추가하여 Cloud Data Fusion 인스턴스에서 암호화합니다. 이 가이드의 뒷부분에서 비밀번호가 Cloud KMS를 통해 검색되도록 합니다.
Cloud Data Fusion 페이지의 오른쪽 상단 모서리에서 시스템 관리자를 클릭합니다.
구성 탭을 클릭합니다.
HTTP 호출을 클릭합니다.
드롭다운 메뉴에서 PUT을 선택합니다.
경로 필드에
namespaces/NAMESPACE_ID/securekeys/PASSWORD
를 입력합니다.본문 필드에
{"data":"SQL_SERVER_PASSWORD"}
를 입력합니다.보내기를 클릭합니다.
응답이 상태 코드 200
인지 확인합니다.
SQL Server용 JDBC 드라이버 가져오기
허브 사용
Cloud Data Fusion UI에서 허브를 클릭합니다.
검색창에
Microsoft SQL Server JDBC Driver
를 입력합니다.Microsoft SQL Server JDBC 드라이버를 클릭합니다.
다운로드를 클릭합니다. 표시된 다운로드 단계를 따릅니다.
배포를 클릭합니다. 이전 단계에서 JAR 파일을 업로드합니다.
마침을 클릭합니다.
스튜디오 사용
Microsoft.com을 방문합니다.
다운로드를 선택하고 다운로드를 클릭합니다.
Cloud Data Fusion UI에서
메뉴를 클릭하고 스튜디오 페이지로 이동합니다.추가를 클릭합니다.
드라이버에서 업로드를 클릭합니다.
2단계에서 다운로드한 JAR 파일을 업로드합니다.
다음을 클릭합니다.
이름을 입력하여 드라이버를 구성합니다.
클래스 이름 필드에
com.microsoft.sqlserver.jdbc.SQLServerDriver
를 입력합니다.마침을 클릭합니다.
Multiple Table 플러그인 배포
Cloud Data Fusion 웹 UI에서 허브를 클릭합니다.
검색창에
Multiple table plugins
를 입력합니다.Multiple Table 플러그인을 클릭합니다.
배포를 클릭합니다.
마침을 클릭합니다.
파이프라인 만들기를 클릭합니다.
SQL Server에 연결
Cloud Data Fusion UI에서
메뉴를 클릭하고 스튜디오 페이지로 이동합니다.스튜디오에서 소스 메뉴를 펼칩니다.
여러 데이터베이스 테이블을 클릭합니다.
여러 데이터베이스 테이블 노드 위에 마우스 포인터를 올려놓고 속성을 클릭합니다.
참조 이름 필드에 SQL Server 소스를 식별하는 데 사용할 참조 이름을 지정합니다.
JDBC 연결 문자열 필드에 JDBC 연결 문자열을 입력합니다. 예를 들면
jdbc:sqlserver://mydbhost:1433
입니다. 자세한 내용은 연결 URL 빌드를 참조하세요.JDBC 플러그인 이름, 데이터베이스 사용자 이름, 데이터베이스 사용자 비밀번호를 입력합니다.
검증을 클릭합니다.
닫기를 클릭합니다.
BigQuery 또는 Cloud Storage에 연결
Cloud Data Fusion UI에서
메뉴를 클릭하고 스튜디오 페이지로 이동합니다.싱크를 펼칩니다.
BigQuery 멀티 테이블 또는 GCS 멀티 파일을 클릭합니다.
여러 데이터베이스 테이블 노드를 BigQuery 멀티 테이블 또는 GCS 멀티 파일에 연결합니다.
BigQuery 멀티 테이블 또는 GCS 멀티 파일 노드 위에 마우스 포인터를 올려놓고 속성을 클릭한 다음 싱크를 구성합니다.
자세한 내용은 Google BigQuery 멀티 테이블 싱크 및 Google Cloud Storage 멀티 파일 싱크를 참조하세요.
검증을 클릭합니다.
닫기를 클릭합니다.
파이프라인 미리보기 실행
Cloud Data Fusion UI에서
메뉴를 클릭하고 스튜디오 페이지로 이동합니다.미리보기를 클릭합니다.
실행을 클릭합니다. 미리보기가 완료될 때까지 기다립니다.
파이프라인 배포
Cloud Data Fusion UI에서
메뉴를 클릭하고 스튜디오 페이지로 이동합니다.배포를 클릭합니다.
파이프라인 실행
Cloud Data Fusion UI에서
메뉴를 클릭합니다.목록을 클릭합니다.
파이프라인을 클릭합니다.
파이프라인 세부정보 페이지에서 실행을 클릭합니다.
다음 단계
- Cloud Data Fusion 자세히 알아보기
- 가이드 중 하나 따르기