빠른 시작: Cloud Console 사용

Google Cloud Console을 시각적 인터페이스로 사용하여 쿼리 실행, 데이터 로드, 데이터 내보내기 등의 태스크를 수행할 수 있습니다. 이 빠른 시작에서는 Cloud Console을 사용하여 공개 데이터 세트에서 테이블을 쿼리하는 방법과 샘플 데이터를 BigQuery로 로드하는 방법을 보여줍니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 다음으로 이동합니다. BigQuery API를 사용 설정합니다.

    API 사용 설정

  4. 프로젝트에 신용 카드를 제공하지 않거나 결제를 사용 설정하지 않으려면 BigQuery에서 제공하는 샌드박스를 사용합니다. 이 주제의 단계는 프로젝트에 결제가 사용 설정되었는지 여부에 관계없이 프로젝트에 적용됩니다. 필요에 따라 결제를 사용 설정하려면 결제 사용 설정 방법 알아보기를 참조하세요.

공개 데이터 세트 쿼리하기

Cloud Console은 BigQuery에서 제공하는 공개 데이터 세트를 포함해 테이블을 쿼리할 수 있는 인터페이스를 제공합니다.

이 예에서는 미국 이름 데이터 공개 데이터 세트를 쿼리해 1910년~2013년에 미국에서 가장 많이 쓰인 이름을 확인합니다.

기본적으로 Cloud Console에 BigQuery 공개 데이터세트가 표시됩니다. 공개 데이터 세트 프로젝트를 수동으로 열려면 브라우저에 다음 URL을 입력합니다.

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

공개 데이터 세트의 데이터를 쿼리하려면 다음 단계를 따르세요.

  1. Cloud Console에서 BigQuery 페이지로 이동합니다.

    BigQuery 페이지로 이동

  2. 편집기 탭이 표시되지 않으면 새 쿼리 작성을 클릭합니다.

    편집기 탭

  3. 다음 쿼리를 복사하여 편집자 필드에 붙여넣습니다.

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 쿼리가 유효하면 쿼리에서 처리할 데이터 양과 함께 체크표시가 나타납니다. 이 측정항목은 쿼리 실행 비용을 파악하는 데 도움이 됩니다. 쿼리가 유효하지 않으면 느낌표가 오류 메시지와 함께 표시됩니다.

    쿼리 검사기

  5. 실행을 클릭합니다. 쿼리 결과 페이지가 쿼리 창 아래에 표시됩니다. 쿼리 결과 페이지 상단에 경과 시간과 쿼리에 의해 처리된 데이터가 표시됩니다. Query complete... 메시지 아래의 표에는 쿼리에서 선택한 각 열의 이름이 포함된 헤더 행이 있는 쿼리 결과가 표시됩니다.

    Cloud Console의 쿼리 결과

테이블에 데이터 로드

다음으로 테이블에 데이터를 로드하고 쿼리합니다.

데이터 다운로드

다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공하였습니다.

  1. 아기 이름 ZIP 파일을 다운로드합니다.

  2. 머신에 파일을 추출합니다.

    ZIP 파일에는 데이터 세트를 설명하는 NationalReadMe.pdf 파일이 포함되어 있습니다. 데이터세트에 대해 자세히 알아보세요.

  3. yob2014.txt 파일을 열어 데이터를 살펴봅니다. 파일은 쉼표로 구분된 값(CSV) 파일이며 이름, 성별(M 또는 F), 해당 이름을 가진 아이의 수까지 3개의 열이 있습니다. 파일에는 헤더 행이 없습니다.

  4. 나중에 찾을 수 있도록 yob2014.txt 파일의 위치를 기록해 둡니다.

데이터 세트 생성

다음으로 Cloud Console에서 데이터를 저장할 데이터 세트를 만듭니다.

  1. 필요한 경우 Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery 페이지로 이동

  2. 탐색기 패널에서 프로젝트 이름을 클릭합니다.

  3. 작업 옵션을 펼치고 데이터 세트 만들기를 클릭합니다.

  4. 데이터 세트 만들기 페이지에서 다음을 수행합니다.

    • 데이터 세트 IDbabynames을 입력합니다.
    • 데이터 위치미국(US)을 선택합니다. 현재 공개 데이터 세트는 US 멀티 리전 위치에 저장됩니다. 여기서는 편의상 같은 위치에 데이터 세트를 배치합니다.

      데이터 세트 만들기 페이지

  5. 다른 기본 설정은 모두 그대로 두고 데이터세트 만들기를 클릭합니다.

새 테이블에 데이터 로드

다음으로 새 테이블에 데이터를 로드합니다.

  1. 탐색기 패널에서 앞서 만든 babynames 데이터 세트를 클릭합니다.

  2. 작업 옵션을 펼치고 열기를 클릭합니다.

  3. 세부정보 패널에서 테이블 만들기를 클릭합니다.

    달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.

  4. 테이블 만들기 페이지에서 다음을 수행합니다.

    • 소스 섹션의 다음 항목으로 테이블 만들기에서 업로드를 선택합니다.
    • 파일 선택에서 탐색을 클릭하고 yob2014.txt 파일로 이동한 후 열기를 클릭합니다.
    • 파일 형식의 경우 CSV를 선택합니다.
    • 대상 섹션의 테이블 이름names_2014를 입력합니다.
    • 스키마 섹션에서 텍스트로 수정 전환을 클릭하고 다음 스키마 정의를 상자에 붙여넣습니다.

        name:string,gender:string,count:integer
        

      새 테이블 페이지

  5. 테이블 만들기를 클릭합니다.

  6. BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다. BigQuery에서 데이터 로드를 완료하면 작업 기록 패널에 체크표시가 나타납니다.

테이블 미리보기

데이터의 처음 몇 행을 미리 보려면 다음 단계를 따르세요.

  1. 탐색기 패널에서 babynames를 펼치고 names_2014를 선택합니다.

  2. 세부정보 패널에서 미리보기를 클릭합니다. BigQuery는 테이블의 처음 몇 행을 표시합니다.

    Cloud Console 테이블 미리보기

테이블 쿼리

이제 데이터를 테이블에 로드했으므로 쿼리할 수 있습니다. 이 프로세스는 공개 테이블 대신 사용자 테이블을 쿼리한다는 점을 제외하고 위의 예시와 동일합니다.

  1. 새 쿼리 작성을 클릭합니다. 새 쿼리 편집기 탭이 열립니다.

  2. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다. 이 쿼리에서는 2014년에 미국에서 가장 많이 사용된 남자 이름 상위 5개를 보여줍니다.

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 실행을 클릭합니다. 쿼리 창 아래에 결과가 표시됩니다.

    이름 쿼리 결과

삭제

이 빠른 시작에서 사용한 리소스의 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 따르세요.

  1. 필요한 경우 Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery 페이지로 이동

  2. 탐색기 패널에서 앞서 만든 babynames 데이터 세트를 클릭합니다.

  3. 작업 옵션을 펼치고 삭제를 클릭합니다.

  4. 데이터 세트 삭제 대화상자에서 데이터 세트 이름(babynames)을 입력하여 삭제 명령어를 확인한 후 삭제를 클릭합니다. 이 작업은 데이터 세트, 테이블, 모든 데이터를 삭제합니다.

다음 단계