빠른 시작: Cloud Console 사용

이 페이지에서는 Google Cloud Console을 사용하여 공개 데이터 세트의 테이블을 쿼리하고 샘플 데이터를 BigQuery 테이블에 로드하는 방법을 설명합니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  4. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 다음으로 이동합니다. BigQuery API를 사용 설정합니다.

    API 사용 설정

  5. 선택사항: 프로젝트에 대한 결제를 사용 설정합니다. 결제를 사용 설정하거나 신용카드를 제공하지 않는 경우 이 문서의 단계가 계속 작동합니다. BigQuery는 단계를 수행하기 위한 샌드박스를 제공합니다.

공개 데이터세트 쿼리하기

Cloud Console을 사용하여 BigQuery 공개 데이터 세트를 포함한 테이블을 쿼리할 수 있습니다.

이 예시에서는 미국 이름 데이터 공개 데이터세트를 쿼리해 1910년부터 2013년까지 미국에서 가장 흔한 이름을 확인합니다.

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

공개 데이터 세트를 쿼리하려면 다음 단계를 따르세요.

  1. Cloud Console에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 편집기 탭이 표시되지 않으면 새 쿼리 작성을 클릭합니다.

    편집기 탭

  3. 편집기 필드에 다음을 붙여넣습니다.

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    

    쿼리가 유효하면 쿼리에서 처리할 데이터 양과 함께 체크표시가 나타납니다. 쿼리가 유효하지 않으면 느낌표가 오류 메시지와 함께 표시됩니다.

    쿼리 검사기

  4. 실행을 클릭합니다. 쿼리 결과 섹션에는 경과 시간과 쿼리에서 처리한 데이터 양이 표시됩니다.

  5. 자세한 쿼리 결과를 보려면 결과 탭을 클릭합니다. 테이블의 헤더 행에는 쿼리에서 선택한 각 열 이름이 포함됩니다.

    Cloud Console의 쿼리 결과

데이터 세트 만들기 및 쿼리

다음으로 데이터세트를 만들고 데이터를 테이블에 로드하고 쿼리합니다.

데이터세트 만들기

Cloud Console을 사용하여 데이터를 저장하는 데이터 세트를 만듭니다.

  1. Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 패널에서 프로젝트 이름을 클릭합니다.

  3. 작업 보기 옵션을 펼치고 데이터 세트 만들기를 클릭합니다.

  4. 데이터 세트 만들기 페이지에서 다음을 수행합니다.

    • 데이터 세트 IDbabynames을 입력합니다.
    • 데이터 위치 드롭다운 목록에서 us(미국 내 여러 리전)를 선택합니다. 공개 데이터 세트는 us 멀티 리전 위치에 저장됩니다. 편의상 같은 위치에 데이터 세트를 저장합니다.
  5. 나머지 기본 설정은 그대로 두고 데이터 세트 만들기를 클릭합니다.

데이터 다운로드

다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공합니다.

데이터 세트에 대한 자세한 내용은 사회보장 관리의 데이터 세트 정보 페이지를 참조하세요.

  1. 아기 이름 ZIP 파일을 다운로드합니다.

  2. 파일 압축을 풉니다.

    데이터 세트 스키마에 대한 자세한 내용은 ZIP 파일의 NationalReadMe.pdf 파일을 참조하세요.

  3. 데이터가 어떻게 표시되는지 확인하려면 yob2014.txt 파일을 엽니다. 이 파일에는 이름, 성별(M 또는 F), 해당 이름을 가진 아이의 수의 쉼표로 구분된 값이 포함됩니다. 파일에는 헤더 행이 없습니다.

  4. 나중에 찾을 수 있도록 yob2014.txt 파일의 위치를 기록해 둡니다.

테이블에 데이터 로드

다음으로 새 테이블에 데이터를 로드합니다.

  1. 탐색기 패널에서 앞서 만든 babynames 데이터 세트를 클릭합니다.

  2. 작업 보기 옵션을 펼치고 열기를 클릭합니다.

  3. 세부정보 패널에서 테이블 만들기를 클릭합니다.

    달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.

  4. 테이블 만들기 페이지에서 다음을 수행합니다.

    • 소스 섹션의 다음 항목으로 테이블 만들기에서 업로드를 선택합니다.
    • 파일 선택에서 탐색을 클릭하고 yob2014.txt 파일로 이동한 후 열기를 클릭합니다.
    • 파일 형식 드롭다운 목록에서 CSV를 선택합니다.
    • 대상 섹션의 테이블 이름 필드에 names_2014를 입력합니다.
    • 스키마 섹션에서 텍스트로 수정 전환을 클릭하고 다음 스키마 정의를 텍스트 필드에 붙여넣습니다.

        name:string,gender:string,count:integer
        

  5. 테이블 만들기를 클릭합니다.

    BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다. BigQuery에서 데이터 로드를 완료하면 작업 기록 패널에 체크표시가 나타납니다.

테이블 데이터 미리보기

테이블 데이터를 미리보려면 다음 단계를 수행합니다.

  1. 탐색기 패널에서 babynames 데이터 세트를 펼친 후 names_2014 테이블을 선택합니다.

  2. 세부정보 패널에서 미리보기를 클릭합니다. BigQuery는 테이블의 처음 몇 행을 표시합니다.

    Cloud Console 테이블 미리보기

테이블 데이터 쿼리

그런 다음 테이블을 쿼리합니다. 이 프로세스는 공개 테이블 대신 사용자 테이블을 쿼리한다는 점을 제외하고 위의 예시와 동일합니다.

  1. 새 쿼리 작성을 클릭합니다. 새 편집기 탭이 열립니다.

  2. 편집기 필드에 다음 쿼리를 붙여넣습니다. 이 쿼리에서는 2014년에 미국에서 가장 많이 사용된 남자 아이 이름 5개를 보여줍니다.

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 실행을 클릭합니다. 쿼리 결과 섹션에 결과가 표시됩니다.

    이름 쿼리 결과

삭제

이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 수행합니다.

  1. Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 패널에서 앞서 만든 babynames 데이터 세트를 클릭합니다.

  3. 작업 보기 옵션을 펼치고 삭제를 클릭합니다.

  4. 데이터 세트 삭제 대화상자에서 삭제 명령어를 확인하고 단어 delete를 입력한 다음 삭제를 클릭합니다.

다음 단계