SQL Server 테이블에서 읽기


이 페이지에서는 Microsoft SQL Server 테이블에서 데이터를 읽도록 데이터 파이프라인을 설정하는 방법을 설명합니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  5. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  6. API Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc 사용 설정

    API 사용 설정

  7. Cloud Data Fusion 인스턴스를 만듭니다.
  8. SQL Server 데이터베이스가 Cloud Data Fusion에서의 연결을 허용해야 합니다. 보안상의 이유로 비공개 Cloud Data Fusion 인스턴스를 사용합니다.

Cloud Data Fusion 인스턴스 열기

  1. Google Cloud Console에서 Cloud Data Fusion 인스턴스 페이지를 엽니다.

    인스턴스로 이동

  2. 인스턴스의 작업 열에서 인스턴스 보기를 클릭하여 Cloud Data Fusion에서 인스턴스를 엽니다.

SQL Server 비밀번호를 보안 키로 저장합니다.

Cloud Data Fusion 인스턴스에서 SQL Server 비밀번호를 보안 키로 추가합니다.

  1. Cloud Data Fusion에서 시스템 관리자를 클릭합니다.

  2. 구성 탭을 클릭합니다.

  3. HTTP 호출을 클릭합니다.

    구성

  4. PUT을 선택합니다.

  5. 경로 필드에 namespaces/NAMESPACE_ID/securekeys/password 를 입력합니다.

  6. 본문 필드에 {"data":"password"}를 입력합니다. password를 SQL Server 비밀번호로 바꿉니다.

  7. 보내기를 클릭합니다.

    비밀번호

계속하려면 응답에 상태 코드 200이 있어야 합니다.

SQL Server용 JDBC 드라이버 가져오기

Cloud Data Fusion의 허브 또는 Pipeline Studio에서 드라이버를 가져올 수 있습니다.

허브

  1. Cloud Data Fusion UI에서 허브를 클릭합니다.

  2. 검색창에 SQL Server JDBC Driver를 입력하고 드라이버를 선택합니다.

  3. 다운로드를 클릭합니다. 표시된 다운로드 단계를 따릅니다.

  4. 배포를 클릭합니다. 이전 단계에서 JAR 파일을 업로드합니다.

  5. 마침을 클릭합니다.

Pipeline Studio

  1. Microsoft.com으로 이동합니다.

  2. 다운로드를 선택하고 다운로드를 클릭합니다.

  3. Cloud Data Fusion에서 메뉴를 클릭하고 Pipeline Studio 페이지로 이동합니다.

  4. 추가를 클릭합니다.

  5. 드라이버에 대해 업로드를 클릭합니다.

  6. jre7 폴더에 있는 JAR 파일을 선택합니다.

  7. 다음을 클릭합니다.

  8. 드라이버를 구성하려면 이름클래스 이름을 입력합니다.

  9. 마침을 클릭합니다.

SQL Server 플러그인 배포

  1. Cloud Data Fusion에서 허브를 클릭합니다.

  2. 검색창에 SQL Server Plugins를 입력합니다.

  3. SQL Server 플러그인을 클릭합니다.

  4. 배포를 클릭합니다.

  5. 마침을 클릭합니다.

  6. 파이프라인 만들기를 클릭합니다.

SQL Server에 연결

Wrangler 또는 Pipeline Studio에서 Cloud Data Fusion의 SQL Server에 연결할 수 있습니다.

Wrangler

  1. Cloud Data Fusion에서 메뉴를 클릭하고 Wrangler 페이지로 이동합니다.

  2. 연결 추가를 클릭합니다.

    연결 추가 창이 열립니다.

  3. SQL Server를 클릭하여 드라이버가 설치되었는지 확인합니다.

    JAR이 업로드되었습니다.

  4. 필수 연결 필드에 세부정보를 입력합니다. 비밀번호 필드에서 이전에 저장한 보안 키를 선택합니다. 이렇게 하면 비밀번호가 Cloud KMS를 통해 검색됩니다.

    비밀번호 선택

  5. 데이터베이스에 연결을 설정할 수 있는지 확인하려면 연결 테스트를 클릭합니다.

  6. 연결 추가를 클릭합니다.

SQL Server 데이터베이스가 연결되고 SQL Server 테이블에서 읽는 파이프라인을 만든 후에는 변환을 적용하고 출력을 싱크에 쓸 수 있습니다.

Pipeline Studio

  1. Cloud Data Fusion 인스턴스를 열고 Pipeline Studio 페이지로 이동합니다.

  2. 소스 메뉴를 확장하고 SQL Server를 클릭합니다.

    SQL Server.

  3. SQL Server 노드에서 속성을 클릭합니다.

    속성.
  4. 참조 이름 필드에 SQL Server 소스를 식별하는 이름을 입력합니다.

  5. 데이터베이스 필드에 연결할 데이터베이스의 이름을 입력합니다.

  6. 쿼리 가져오기 필드에 실행할 쿼리를 입력합니다. 예를 들면 SELECT * FROM table WHERE $CONDITIONS입니다.

  7. 검증을 클릭합니다.

  8. 닫기 를 클릭합니다.

SQL Server 데이터베이스가 연결되고 SQL Server 테이블에서 읽는 파이프라인을 만든 후에는 원하는 변환을 추가하고 출력을 싱크에 기록합니다.

다음 단계