빠른 시작: GCP Console에서 웹 UI 사용

GCP Console에서 BigQuery 웹 UI를 그래픽 인터페이스로 사용하면 쿼리 실행, 데이터 로드, 데이터 내보내기와 같은 작업을 완료할 수 있습니다. 이 빠른 시작에서는 GCP Console을 사용하여 공개 데이터세트에서 테이블을 쿼리하는 방법과 샘플 데이터를 BigQuery에 로드하는 방법을 설명합니다.

시작하기 전에

  1. Google 계정에 로그인합니다.

    아직 계정이 없으면 새 계정을 등록하세요.

  2. Google Cloud Platform 프로젝트를 선택하거나 만듭니다.

    리소스 관리 페이지로 이동

  3. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 BigQuery API를 사용 설정합니다.

    API 사용 설정

    로 이동합니다.
  4. 프로젝트에 신용 카드를 제공하지 않거나 결제를 사용 설정하지 않으려면 BigQuery에서 제공하는 샌드박스를 사용합니다. 이 주제의 단계는 프로젝트에 결제가 사용 설정되었는지 여부에 관계없이 프로젝트에 적용됩니다. 필요에 따라 결제를 사용 설정하려면 결제를 사용 설정하는 방법 알아보기를 참조하세요.

공개 데이터세트 쿼리

BigQuery 웹 UI는 BigQuery에서 제공하는 공개 데이터세트를 포함한 테이블을 쿼리하기 위한 인터페이스를 제공합니다.

이 예시에서는 미국 이름 데이터 공개 데이터세트를 쿼리해 1910년부터 2013년까지 미국에서 가장 흔한 이름을 확인합니다.

기본적으로 GCP Console에 BigQuery 공개 데이터세트가 표시됩니다. 공개 데이터세트 프로젝트를 수동으로 열려면 브라우저에 다음 URL을 입력합니다.

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

공개 데이터세트의 데이터를 쿼리하려면 다음 단계를 따르세요.

  1. GCP Console에서 BigQuery 웹 UI로 이동합니다.

    BigQuery 웹 UI로 이동

  2. 창 오른쪽 상단에 있는 새 쿼리 작성을 클릭합니다. 이 텍스트가 흐리게 표시되면 쿼리 편집기가 이미 열려 있는 것입니다.

    쿼리 작성 버튼

  3. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다.

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 창 오른쪽 하단에 있는 녹색 체크표시를 클릭하여 쿼리 검사기를 표시합니다.

    쿼리 검사기

    쿼리가 유효하면 녹색 체크표시 아이콘이 표시됩니다. 쿼리가 유효하지 않으면 빨간색 느낌표 아이콘이 표시됩니다. 쿼리가 유효한 경우 검사기는 쿼리가 처리할 데이터의 양도 보여줍니다. 처리된 데이터는 쿼리 실행 비용을 파악하는 데 유용합니다.

  5. 실행을 클릭합니다. 쿼리 결과 페이지가 쿼리 창 아래에 표시됩니다. 쿼리 결과 페이지 상단에 경과 시간과 쿼리에 의해 처리된 데이터가 표시됩니다. Query complete... 메시지 아래의 표에는 쿼리에서 선택한 각 열의 이름이 포함된 헤더 행이 있는 쿼리 결과가 표시됩니다.

    BigQuery 웹 UI 쿼리 결과

테이블에 데이터 로드

다음으로 테이블에 데이터를 로드하고 쿼리합니다.

데이터 다운로드

다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공하였습니다.

  1. baby names zip 파일을 다운로드합니다.

  2. 컴퓨터에 파일의 압축을 풉니다.

    zip 파일에는 데이터세트 스키마를 설명하는 NationalReadMe.pdf 파일이 포함되어 있습니다. 데이터세트에 대해 자세히 알아보세요.

  3. yob2014.txt 파일을 열어 데이터를 살펴봅니다. 파일은 쉼표로 구분된 값(CSV) 파일이며 이름, 성별(M 또는 F), 해당 이름을 가진 아이의 수까지 3개의 열이 있습니다. 파일에는 헤더 행이 없습니다.

  4. 나중에 찾을 수 있도록 yob2014.txt 파일의 위치를 기록해 둡니다.

데이터세트 만들기

다음으로 데이터를 저장하기 위해 웹 UI에 데이터세트를 만듭니다.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 프로젝트 이름을 클릭합니다.

  3. 오른쪽의 세부정보 패널에서 데이터세트 만들기를 클릭합니다.

    BigQuery 웹 UI 쿼리 결과

  4. 데이터세트 만들기 페이지에서 다음 안내를 따릅니다.

    • 데이터세트 IDbabynames를 입력합니다.
    • 데이터 위치미국(US)을 선택합니다. 현재 공개 데이터세트는 US 멀티 리전 위치에 저장됩니다. 여기에서는 편의상 같은 위치에 데이터세트를 배치해야 합니다.

      데이터세트 만들기 페이지

  5. 다른 기본 설정은 모두 그대로 두고 데이터세트 만들기를 클릭합니다.

새 테이블에 데이터 로드

다음으로 새 테이블에 데이터를 로드합니다.

  1. 탐색 패널의 리소스 섹션에서 방금 만든 babynames 데이터세트를 클릭합니다.

  2. 우측의 세부정보 패널에서 테이블 만들기를 클릭합니다.

    달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.

  3. 테이블 만들기 페이지에서 다음을 수행합니다.

    • 소스에서 빈 테이블을 클릭하고 업로드를 선택합니다.
    • 파일 선택에서 탐색을 클릭하고 yob2014.txt 파일로 이동한 후 열기를 클릭합니다.
    • 파일 형식에서 Avro를 클릭하고 CSV를 선택합니다.
    • 대상 섹션의 테이블 이름names_2014를 입력합니다.
    • 스키마 섹션에서 텍스트로 수정 전환을 클릭하고 다음 스키마 정의를 상자에 붙여넣습니다.

        name:string,gender:string,count:integer
        

      새 테이블 페이지

  4. 테이블 만들기를 클릭합니다.

  5. BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다. BigQuery에서 데이터를 로드하는 동안에는 탐색 패널의 작업 기록 옆에 (1 running) 문자열이 표시됩니다. 이 문자열은 데이터가 로드되면 사라집니다.

테이블 미리보기

(1 running) 문자열이 사라지면 테이블에 액세스할 수 있습니다. 데이터의 처음 몇 행을 미리보려면 다음 안내를 따르세요.

  1. 탐색 패널에서 babynames > names_2014를 선택합니다.

  2. 세부정보 패널에서 미리보기 탭을 클릭합니다.

    BigQuery 웹 UI 테이블 미리보기

테이블 쿼리

이제 데이터를 테이블에 로드했으므로 쿼리할 수 있습니다. 이 프로세스는 공개 테이블 대신 사용자 테이블을 쿼리한다는 점을 제외하고 위의 예시와 동일합니다.

  1. 필요하면 새 쿼리 작성 버튼을 클릭합니다. 이전에 쿼리 창을 닫지 않았다면 버튼이 계속 보일 것입니다.

  2. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다. 이 쿼리에서는 2014년에 미국에서 가장 많이 사용된 남자 이름 상위 5개를 보여줍니다.

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 실행을 클릭합니다. 쿼리 창 아래에 결과가 표시됩니다.

    이름 쿼리 결과

삭제

이 빠른 시작에서 사용한 리소스 비용이 GCP 계정에 청구되지 않도록 다음을 수행합니다.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 만든 babynames 데이터세트를 클릭합니다.

  3. 세부정보 패널의 우측에서 데이터세트 삭제를 클릭합니다. 이렇게 하면 데이터세트, 테이블, 모든 데이터가 삭제됩니다.

  4. 데이터세트 삭제 대화상자에 데이터세트 이름(babynames)을 입력한 후 삭제를 클릭하여 삭제 명령어를 확인합니다.

다음 단계

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

도움이 필요하시나요? 지원 페이지를 방문하세요.