빠른 시작: GCP Console에서 웹 UI 사용

GCP Console에서 BigQuery 웹 UI를 그래픽 인터페이스로 사용하면 쿼리 실행, 데이터 로드, 데이터 내보내기와 같은 작업을 완료할 수 있습니다. 이 빠른 시작에서는 GCP Console을 사용하여 공개 데이터세트에서 테이블을 쿼리하는 방법과 샘플 데이터를 BigQuery에 로드하는 방법을 설명합니다.

시작하기 전에

  1. Google 계정에 로그인합니다.

    아직 계정이 없으면 새 계정을 등록하세요.

  2. Google Cloud Platform 프로젝트를 선택하거나 만듭니다.

    리소스 관리 페이지로 이동

  3. Google Cloud Platform 프로젝트에 결제가 사용 설정되어 있는지 확인하세요.

    결제 사용 설정 방법 알아보기

  4. 새 프로젝트에서는 BigQuery가 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 다음으로 이동하세요. {% dynamic if "no_credentials" in setvar.task_params %}{% dynamic setvar credential_type %}NO_AUTH{% dynamic endsetvar %}{% dynamic if not setvar.redirect_url %}{% dynamic setvar redirect_url %}https://console.cloud.google.com{% dynamic endsetvar %}{% dynamic endif %}{% dynamic endif %}{% dynamic if setvar.in_henhouse_no_auth_whitelist %}{% dynamic if not setvar.credential_type %}{% dynamic setvar credential_type %}NO_AUTH{% dynamic endsetvar %}{% dynamic endif %}{% dynamic elif setvar.in_henhouse_service_account_whitelist %}{% dynamic if not setvar.credential_type %}{% dynamic setvar credential_type %}SERVICE_ACCOUNT{% dynamic endsetvar %}{% dynamic endif %}{% dynamic endif %}{% dynamic if not setvar.service_account_roles and setvar.credential_type == "SERVICE_ACCOUNT" %}{% dynamic setvar service_account_roles %}{% dynamic endsetvar %}{% dynamic endif %}{% dynamic setvar console %}{% dynamic if "no_steps" not in setvar.task_params %}
  5. {% dynamic endif %}{% dynamic if setvar.api_list %}{% dynamic if setvar.in_henhouse_no_auth_whitelist or setvar.in_henhouse_service_account_whitelist %}GCP Console 프로젝트를 설정합니다.

    프로젝트 설정

    다음을 수행하려면 클릭:

    • 프로젝트를 만들거나 선택합니다.
    • 해당 프로젝트에 {% dynamic if setvar.api_names %}{% dynamic print setvar.api_names %}{% dynamic else %}필요한{% dynamic endif %}{% dynamic if "," in setvar.api_list %} API{% dynamic elif "API" in setvar.api_names %}{% dynamic else %} API{% dynamic endif %}를 사용 설정합니다.
    • {% dynamic if setvar.credential_type == 'SERVICE_ACCOUNT' %}
    • 서비스 계정을 만듭니다.
    • 비공개 키를 JSON으로 다운로드합니다.
    • {% dynamic endif %}

    언제든지 GCP Console에서 이 리소스를 보고 관리할 수 있습니다.

    {% dynamic else %}{% dynamic if "no_text" not in setvar.task_params %}{% dynamic if setvar.api_names %}{% dynamic print setvar.api_names %}{% dynamic else %}필요한{% dynamic endif %}{% dynamic if "," in setvar.api_list %} APIs{% dynamic elif "API" in setvar.api_names %}{% dynamic else %} API{% dynamic endif %}를 사용 설정합니다. {% dynamic endif %}

    {% dynamic if "," in setvar.api_list %} APIs{% dynamic else %} API{% dynamic endif %} 사용 설정

    {% dynamic endif %}{% dynamic endif %}{% dynamic if "no_steps" not in setvar.task_params %}
  6. {% dynamic endif %}{% dynamic endsetvar %}{% dynamic print setvar.console %}

공개 데이터세트 쿼리하기

BigQuery 웹 UI는 BigQuery에서 제공하는 공개 데이터세트를 포함한 테이블을 쿼리하기 위한 인터페이스를 제공합니다.

이 예시에서는 미국 이름 데이터 공개 데이터세트를 쿼리해 1910년부터 2013년까지 미국에서 가장 흔한 이름을 확인합니다.

기본적으로 GCP Console에 BigQuery 공개 데이터세트가 표시됩니다. 공개 데이터세트 프로젝트를 수동으로 열려면 브라우저에 다음 URL을 입력합니다.

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

공개 데이터세트의 데이터를 쿼리하려면 다음 단계를 따르세요.

  1. GCP Console에서 BigQuery 웹 UI로 이동합니다.

    BigQuery 웹 UI로 이동

  2. 창의 오른쪽 상단에 있는 새 쿼리 작성을 클릭합니다. 이 텍스트가 비활성화되어 있으면 쿼리 편집기가 이미 열려 있는 것입니다.

    쿼리 작성 버튼

  3. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다.

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 창 오른쪽 하단에 있는 녹색 체크표시를 클릭하여 쿼리 검사기를 표시합니다.

    쿼리 검사기

    쿼리가 유효하면 녹색 체크표시 아이콘이 표시됩니다. 쿼리가 유효하지 않으면 빨간색 느낌표 아이콘이 표시됩니다. 쿼리가 유효한 경우 검사기는 쿼리가 처리할 데이터의 양도 보여줍니다. 처리된 데이터는 쿼리 실행 비용을 파악하는 데 유용합니다.

  5. 실행을 클릭합니다. 쿼리 결과 페이지가 쿼리 창 아래에 표시됩니다. 쿼리 결과 페이지 상단에 경과 시간과 쿼리에 의해 처리된 데이터가 표시됩니다. Query complete... 메시지 아래의 표에는 쿼리에서 선택한 각 열의 이름이 포함된 헤더 행이 있는 쿼리 결과가 표시됩니다.

    BigQuery 웹 UI 쿼리 결과

테이블에 데이터 로드

다음으로 테이블에 데이터를 로드하고 데이터를 쿼리합니다.

빠른 시작의 이 부분을 실행하려면 청구가 사용 설정되어 있어야 합니다. 자세한 내용은 시작하기 전에를 참조하세요.

데이터 다운로드

다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공하였습니다.

  1. baby names zip 파일을 다운로드합니다.

  2. 컴퓨터에 파일의 압축을 풉니다.

    zip 파일에는 데이터세트 스키마를 설명하는 NationalReadMe.pdf 파일이 포함되어 있습니다. 데이터세트에 대해 자세히 알아보세요.

  3. yob2014.txt 파일을 열어 데이터를 살펴봅니다. 파일은 쉼표로 구분된 값(CSV) 파일이며 이름, 성별(M 또는 F), 해당 이름을 가진 아이의 수까지 3개의 열이 있습니다. 파일에는 헤더 행이 없습니다.

  4. 나중에 찾을 수 있도록 yob2014.txt 파일의 위치를 기록해 둡니다.

데이터세트 만들기

다음으로 데이터를 저장하기 위해 웹 UI에 데이터세트를 만듭니다.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 프로젝트 이름을 클릭합니다.

  3. 오른쪽의 세부정보 패널에서 데이터세트 만들기를 클릭합니다.

    BigQuery 웹 UI 쿼리 결과

  4. 데이터세트 만들기 페이지에서 다음 안내를 따릅니다.

    • 데이터세트 IDbabynames를 입력합니다.
    • 데이터 위치미국(US)을 선택합니다. 현재 공개 데이터세트는 US 다중 리전 위치에 저장되어 있습니다. 여기에서는 편의상 같은 위치에 데이터세트를 배치해야 합니다.

      데이터세트 만들기 페이지

  5. 다른 기본 설정은 모두 그대로 두고 데이터세트 만들기를 클릭합니다.

새 테이블에 데이터 로드

다음으로 새 테이블에 데이터를 로드합니다.

  1. 탐색 패널의 리소스 섹션에서 방금 만든 babynames 데이터세트를 클릭합니다.

  2. 우측의 세부정보 패널에서 테이블 만들기를 클릭합니다.

    달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.

  3. 테이블 만들기 페이지에서 다음을 수행합니다.

    • 소스에서 빈 테이블을 클릭하고 업로드를 선택합니다.
    • 파일 선택에서 탐색을 클릭하고 yob2014.txt 파일로 이동한 후 열기를 클릭합니다.
    • 파일 형식에서 Avro를 클릭하고 CSV를 선택합니다.
    • 대상names_2014를 입력합니다.
    • 스키마 섹션에서 텍스트로 수정 전환을 클릭하고 다음 스키마 정의를 상자에 붙여넣습니다.

      name:string,gender:string,count:integer

      새 테이블 페이지

  4. 테이블 만들기를 클릭합니다.

  5. BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다. BigQuery에서 데이터를 로드하는 동안에는 탐색 패널의 작업 기록 옆에 (1 running) 문자열이 표시됩니다. 이 문자열은 데이터가 로드되면 사라집니다.

테이블 미리보기

(1 running) 문자열이 사라진 후 테이블에 액세스할 수 있습니다. 데이터의 처음 몇 행을 미리보려면 다음을 수행하세요.

  1. 탐색 패널에서 babynames > names_2014를 선택합니다.

  2. 세부정보 패널에서 미리보기 탭을 클릭합니다.

    BigQuery 웹 UI 테이블 미리보기

테이블 쿼리

이제 데이터를 테이블에 로드했으므로 쿼리할 수 있습니다. 이 프로세스는 공개 테이블 대신 사용자 테이블을 쿼리한다는 점을 제외하고 위의 예시와 동일합니다.

  1. 필요하면 새 쿼리 작성 버튼을 클릭합니다. 이전에 쿼리 창을 닫지 않았다면 버튼이 계속 보일 것입니다.

  2. 다음 쿼리를 복사하여 쿼리 텍스트 영역에 붙여넣습니다. 이 쿼리에서는 2014년에 미국에서 가장 많이 사용된 남자 이름 상위 5개를 보여줍니다.

    SELECT
     name, count
    FROM
     `babynames.names_2014`
    WHERE
     gender = 'M'
    ORDER BY count DESC LIMIT 5
    
  3. 실행을 클릭합니다. 쿼리 창 아래에 결과가 표시됩니다.

    이름 쿼리 결과

삭제

이 빠른 시작에서 사용한 리소스 비용이 GCP 계정에 청구되지 않도록 다음을 수행합니다.

  1. 필요하면 BigQuery 웹 UI를 엽니다.

    BigQuery 웹 UI로 이동

  2. 탐색 패널의 리소스 섹션에서 만든 babynames 데이터세트를 클릭합니다.

  3. 세부정보 패널의 우측에서 데이터세트 삭제를 클릭합니다. 이렇게 하면 데이터세트, 테이블, 모든 데이터가 삭제됩니다.

  4. 데이터세트 삭제 대화상자에 데이터세트 이름(babynames)을 입력한 후 삭제를 클릭하여 삭제 명령어를 확인합니다.

다음 단계

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

도움이 필요하시나요? 지원 페이지를 방문하세요.