빠른 시작: Google Cloud Console에서 웹 UI 사용

Cloud Console에서 BigQuery 웹 UI를 그래픽 인터페이스로 사용하면 쿼리 실행, 데이터 로드, 데이터 내보내기와 같은 작업을 수행할 수 있습니다. 이 빠른 시작에서는 Cloud Console을 사용하여 공개 데이터세트에서 테이블을 쿼리하는 방법과 샘플 데이터를 BigQuery로 로드하는 방법을 보여줍니다.

시작하기 전에

  1. Google 계정으로 로그인합니다.

    아직 계정이 없으면 새 계정을 등록하세요.

  2. Cloud Console의 프로젝트 선택기 페이지에서 Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기 페이지로 이동

  3. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 BigQuery API를 사용 설정합니다.

    API 사용 설정

    로 이동합니다.
  4. 프로젝트에 신용 카드를 제공하지 않거나 결제를 사용 설정하지 않으려면 BigQuery에서 제공하는 샌드박스를 사용합니다. 이 주제의 단계는 프로젝트에 결제가 사용 설정되었는지 여부에 관계없이 프로젝트에 적용됩니다. 필요에 따라 결제를 사용 설정하려면 결제 사용 설정 방법 알아보기를 참조하세요.

공개 데이터세트 쿼리

BigQuery 웹 UI는 BigQuery가 제공하는 공개 데이터세트를 포함한 테이블을 쿼리하기 위한 인터페이스를 제공합니다.

이 예시에서는 미국 이름 데이터 공개 데이터세트를 쿼리해 1910년부터 2013년까지 미국에서 가장 흔한 이름을 확인합니다.

기본적으로 Cloud Console에 BigQuery 공개 데이터세트가 표시됩니다. 공개 데이터세트 프로젝트를 수동으로 열려면 브라우저에 다음 URL을 입력합니다.

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

공개 데이터 세트의 데이터를 쿼리하려면 다음 단계를 따르세요.

  1. Cloud Console에서 BigQuery 웹 UI로 이동합니다.

    BigQuery 웹 UI로 이동

  2. 새 쿼리 작성을 클릭합니다. 이 텍스트가 흐리게 표시되면 쿼리 편집기가 이미 열려 있는 것입니다.

    쿼리 작성 버튼

  3. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다.

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 쿼리 검사기를 보려면 녹색 체크표시를 클릭합니다.

    쿼리 검사기

    쿼리가 유효하면 녹색 체크표시가 나타납니다. 검색어가 유효하지 않으면 빨간색 느낌표가 표시됩니다. 쿼리가 유효한 경우 검사기는 쿼리가 처리할 데이터의 양도 보여줍니다. 처리된 데이터는 쿼리 실행 비용을 파악하는 데 유용합니다.

  5. 실행을 클릭합니다. 쿼리 결과 페이지가 쿼리 창 아래에 나타납니다. 쿼리 결과 페이지 상단에 경과 시간과 쿼리에 의해 처리된 데이터가 표시됩니다. Query complete... 메시지 아래의 표에는 쿼리에서 선택한 각 열의 이름이 포함된 헤더 행이 있는 쿼리 결과가 표시됩니다.

    BigQuery 웹 UI 쿼리 결과

테이블에 데이터 로드

다음으로 테이블에 데이터를 로드하고 쿼리합니다.

데이터 다운로드

다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공하였습니다.

  1. 아기 이름 ZIP 파일을 다운로드합니다.

  2. 머신에 파일을 추출합니다.

    ZIP 파일에는 데이터세트를 설명하는 NationalReadMe.pdf 파일이 포함되어 있습니다. 데이터세트에 대해 자세히 알아보세요.

  3. yob2014.txt 파일을 열어 데이터를 살펴봅니다. 파일은 쉼표로 구분된 값(CSV) 파일이며 이름, 성별(M 또는 F), 해당 이름을 가진 아이의 수까지 3개의 열이 있습니다. 파일에는 헤더 행이 없습니다.

  4. 나중에 찾을 수 있도록 yob2014.txt 파일의 위치를 기록해 둡니다.

데이터세트 생성

다음으로 데이터를 저장하기 위해 웹 UI에 데이터세트를 만듭니다.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 프로젝트 이름을 클릭합니다.

  3. 오른쪽의 세부정보 패널에서 데이터세트 만들기를 클릭합니다.

    BigQuery 웹 UI 쿼리 결과

  4. 데이터 세트 만들기 페이지에서 다음을 수행합니다.

    • 데이터세트 IDbabynames을 입력합니다.
    • 데이터 위치미국(US)을 선택합니다. 현재 공개 데이터 세트는 US 멀티 리전 위치에 저장됩니다. 여기서는 편의상 같은 위치에 데이터 세트를 배치합니다.

      데이터 세트 만들기 페이지

  5. 다른 기본 설정은 모두 그대로 두고 데이터세트 만들기를 클릭합니다.

새 테이블에 데이터 로드

다음으로 새 테이블에 데이터를 로드합니다.

  1. 탐색 패널의 리소스 섹션에서 방금 만든 babynames 데이터세트를 클릭합니다.

  2. 우측의 세부정보 패널에서 테이블 만들기를 클릭합니다.

    달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.

  3. 테이블 만들기 페이지에서 다음을 수행합니다.

    • 소스에서 빈 테이블을 클릭하고 업로드를 선택합니다.
    • 파일 선택에서 탐색을 클릭하고 yob2014.txt 파일로 이동한 후 열기를 클릭합니다.
    • 파일 형식에서 Avro를 클릭하고 CSV를 선택합니다.
    • 대상 섹션의 테이블 이름names_2014를 입력합니다.
    • 스키마 섹션에서 텍스트로 편집 토글을 클릭하고 다음 스키마 정의를 상자에 붙여 넣습니다.

        name:string,gender:string,count:integer
        

      새 테이블 페이지

  4. 테이블 만들기를 클릭합니다.

  5. BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다. BigQuery에서 데이터를 로드하는 동안에는 탐색 패널의 작업 기록 옆에 (1 running) 문자열이 표시됩니다. 이 문자열은 데이터가 로드되면 사라집니다.

테이블 미리보기

(1 running) 문자열이 사라지면 테이블에 액세스할 수 있습니다. 데이터의 처음 몇 행을 미리 보려면 다음 단계를 따르세요.

  1. 탐색 패널에서 babynames > names_2014를 선택합니다.

  2. 세부정보 패널에서 미리보기 탭을 클릭합니다.

    BigQuery 웹 UI 테이블 미리보기

테이블 쿼리

이제 데이터를 테이블에 로드했으므로 쿼리할 수 있습니다. 이 프로세스는 공개 테이블 대신 사용자 테이블을 쿼리한다는 점을 제외하고 위의 예시와 동일합니다.

  1. 필요하면 새 쿼리 작성 버튼을 클릭합니다. 이전에 쿼리 창을 닫지 않았다면 버튼이 계속 보일 것입니다.

  2. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다. 이 쿼리에서는 2014년에 미국에서 가장 많이 사용된 남자 이름 상위 5개를 보여줍니다.

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 실행을 클릭합니다. 쿼리 창 아래에 결과가 표시됩니다.

    이름 쿼리 결과

삭제

이 빠른 시작에서 사용한 리소스의 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 따르세요.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 만든 babynames 데이터세트를 클릭합니다.

  3. 세부정보 패널의 우측에서 데이터세트 삭제를 클릭합니다. 이 작업으로 데이터세트, 테이블, 모든 데이터가 삭제됩니다.

  4. 데이터세트 삭제 대화상자에서 데이터세트 이름(babynames)을 입력하여 삭제 명령어를 확인한 후 삭제를 클릭합니다.

다음 단계