지리정보 분석 시작하기


이 튜토리얼에서는 지리정보 분석을 소개합니다. 지리정보 분석을 사용하면 BigQuery에서 지리정보 데이터를 분석하고 시각화할 수 있습니다.

목표

이 가이드의 목표는 다음과 같습니다.

  • 지리정보 분석 함수를 사용하여 위도와 경도 열을 지리적 점으로 변환
  • 30대가 넘는 대여 가능한 자전거를 보유한 모든 Citi Bike 정차장을 찾는 쿼리 실행
  • BigQuery Geo Viz에서 결과 시각화

비용

이 튜토리얼에서는 BigQuery를 포함하여 비용이 청구될 수 있는 Google Cloud 구성요소를 사용합니다.

다음에 대한 비용이 부과됩니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  6. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면 다음으로 이동합니다.

    Enable the BigQuery API.

    Enable the API

샘플 데이터 탐색

이 가이드에서는 Google Cloud 공개 데이터세트 프로그램을 통해 제공되는 데이터세트를 사용합니다. 공개 데이터세트는 BigQuery에 저장되며 일반 대중이 사용할 수 있는 모든 데이터세트입니다. 공개 데이터세트는 사용자가 액세스하고 애플리케이션에 통합할 수 있도록 BigQuery가 호스팅하는 데이터세트입니다. 이러한 데이터세트의 저장 비용은 Google에서 부담하며 프로젝트를 통해 데이터에 대한 공개 액세스 권한을 부여합니다. 사용자에게는 데이터에 대한 쿼리 요금만 부과됩니다(쿼리 가격 책정 세부정보에 따라 매월 1TB까지는 무료).

NYC Citi Bike 운행 데이터세트

NYC 도심 자전거 운행

미국 최대 규모의 자전거 공유 프로그램인 Citi Bike는 맨해튼, 브루클린, 퀸즈, 저지시티에 자전거 10,000대와 600개의 정차장을 보유하고 있습니다. 이 데이터 세트에는 2013년 9월 Citi Bike가 설립된 이후의 Citi Bike 운행 정보가 포함되어 있으며 매일 업데이트됩니다. 이 데이터는 Citi Bike에서 처리하여 시스템 수리 및 조사를 위해 수집한 운행과 잘못된 시작으로 간주되는 길이 60초 이하의 운행을 삭제했습니다.

citibike_stations 테이블의 세부정보를 확인하여 BigQuery 콘솔에서 데이터 탐색을 시작할 수 있습니다.

citibike_stations 스키마로 이동

이 테이블에 있는 열 3개는 이 가이드와 관련이 있습니다.

  • bike_stations.longitude: 대여소의 경도입니다. 값은 십진수 도 형식의 유효한 WGS 84개 경도입니다.
  • bike_stations.latitude: 대여소의 위도입니다. 값은 십진수 도 형식의 유효한 WGS 84개 위도입니다.
  • num_bikes_available: 대여 가능한 자전거 수입니다.

사용 가능한 자전거가 30대 이상인 자전거 정차장에 대한 쿼리 실행

이 튜토리얼 섹션에서는 30대가 넘는 대여 가능한 자전거를 보유한 모든 Citi Bike 정차장을 찾는 GoogleSQL 쿼리를 실행합니다.

쿼리 세부정보

다음 GoogleSQL 쿼리는 30대가 넘는 자전거를 보유한 Citi Bike 정차장을 찾는 데 사용됩니다.

SELECT
  ST_GeogPoint(longitude, latitude)  AS WKT,
  num_bikes_available
FROM
  `bigquery-public-data.new_york.citibike_stations`
WHERE num_bikes_available > 30

이 쿼리 절은 다음을 수행합니다.

  • SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
    SELECT 절은 num_bikes_available 열을 선택하고 ST_GeogPoint 함수를 사용하여 latitudelongitude 열의 값을 GEOGRAPHY 유형(점)으로 변환합니다.
  • FROM `bigquery-public-data.new_york.citibike_stations`
    FROM 절은 쿼리 대상 테이블인 citibike_stations를 지정합니다.
  • WHERE num_bikes_available > 30
    WHERE 절은 30대가 넘는 자전거를 보유한 정차장만 표시하도록 num_bikes_available 열의 값을 필터링합니다.

쿼리 실행

Google Cloud Console을 사용하여 쿼리를 실행하려면 다음 안내를 따르세요.

  1. Google Cloud Console에서 BigQuery 페이지로 이동합니다.

    BigQuery 페이지로 이동

  2. 쿼리 편집기 텍스트 영역에 다음 GoogleSQL 쿼리를 입력합니다.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
  3. 실행을 클릭합니다.

    쿼리를 완료하는 데 시간이 다소 걸립니다. 쿼리가 실행된 후 결과가 쿼리 결과 창에 표시됩니다.

    자전거 대여소 쿼리 결과

Geo Viz에서 쿼리 결과 시각화

다음으로는 BigQuery Geo Viz(Google Maps API를 이용하여 BigQuery에서 지리공간 데이터를 시각화하는 웹 도구)로 결과를 시각화합니다.

Geo Viz 시작 및 인증

Geo Viz를 사용하기 전에 BigQuery의 데이터에 대한 액세스 권한을 인증하고 부여해야 합니다.

Geo Viz를 설정하려면 다음 안내를 따르세요.

  1. Geo Viz 웹 도구를 엽니다.

    Geo Viz 웹 도구 열기

    이 도구를 승인하고 사용하려면 쿠키를 사용 설정해야 할 수 있습니다.

  2. 1단계 쿼리에서 승인을 클릭합니다.

    Geo Viz 승인 버튼

  3. 계정 선택 대화상자에서 Google 계정을 클릭합니다.

    계정 선택 대화상자

  4. 액세스 대화상자에서 허용을 클릭하여 BigQuery 데이터에 액세스할 수 있는 권한을 Geo Viz에 부여합니다.

    액세스 허용 대화상자

지리정보 데이터에서 GoogleSQL 쿼리 실행

액세스 권한을 인증하고 부여한 후 다음 단계는 Geo Viz에서 쿼리를 실행하는 것입니다.

쿼리를 실행하려면 다음 안내를 따르세요.

  1. 1단계 데이터 선택에서 프로젝트 ID 필드에 프로젝트 ID를 입력합니다.

  2. 쿼리 창에 다음 GoogleSQL 쿼리를 입력합니다.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
  3. 실행을 클릭합니다.

  4. 쿼리가 완료되면 결과 표시를 클릭합니다. 2단계인 열 정의도 클릭할 수 있습니다.

    결과 보기

  5. 그러면 2단계로 넘어갑니다. 2단계에서 도형 열WKT를 선택합니다. 그러면 지도에 자전거 대여소에 해당하는 점이 표시됩니다.

    매핑된 결과

시각화 형식 지정

스타일 섹션에는 맞춤설정을 위한 시각 스타일의 목록이 나와 있습니다. 특정 속성은 특정한 데이터 유형에만 적용됩니다. 예를 들어 circleRadius는 점에만 영향을 미칩니다.

지원되는 스타일 속성은 다음과 같습니다.

  • fillColor. 다각형 또는 점의 채우기 색상입니다. 예를 들어 'linear' 또는 'interval' 함수는 숫자 값을 색상 그라디언트에 매핑하는 데 사용될 수 있습니다.
  • fillOpacity. 다각형 또는 점의 채우기 불투명도입니다. 값은 0에서 1 사이여야 합니다. 여기서 0은 투명이고, 1은 불투명입니다.
  • strokeColor. 다각형 또는 선의 획이나 윤곽선 색상입니다.
  • strokeOpacity. 다각형 또는 선의 획이나 윤곽선 불투명도입니다. 값은 0에서 1 사이여야 합니다. 여기서 0은 투명이고, 1은 불투명입니다.
  • strokeWeight. 다각형 또는 선의 획 또는 윤곽선 너비(픽셀 단위)입니다.
  • circleRadius. 점을 나타내는 원의 반지름(픽셀 단위)입니다. 예를 들어 산점도 스타일을 만들기 위해 'linear' 함수를 사용하여 숫자 값을 점 크기에 매핑할 수 있습니다.

각 스타일마다 글로벌 값(모든 결과에 적용됨) 또는 데이터 기반 값(각 결과 행의 데이터에 따라 서로 다른 방식으로 적용됨)이 지정될 수 있습니다. 데이터 기반 값의 경우 결과를 결정하는 데 다음이 사용됩니다.

  • function. 필드 값에서 스타일 값을 계산하는 데 사용되는 함수입니다.
  • identity. 각 필드의 데이터 값이 스타일 값으로 사용됩니다.
  • categorical. 도메인에 나열된 각 필드의 데이터 값이 범위 내의 해당 스타일과 일대일로 매핑됩니다.
  • interval. 각 필드의 데이터 값이 도메인에서 가장 가까운 값으로 내림된 후 범위 내의 해당 스타일로 스타일링됩니다.
  • linear. 각 필드의 데이터 값이 도메인의 여러 값에 대하여 선형으로 보간된 후 범위 내의 해당 스타일의 혼합으로 스타일이 지정됩니다.
  • field. 데이터에서 지정된 필드가 스타일 지정 함수의 입력으로 사용됩니다.
  • domain. 필드의 샘플 입력값의 순서가 지정된 목록입니다. 샘플 입력(도메인)은 지정한 함수에 따라 샘플 출력(범위)과 페어링되고 모든 입력의 스타일 값을 유추하는 데 사용됩니다(도메인에 나열되지 않은 값까지 포함). 도메인의 값은 시각화하는 필드의 값과 동일한 유형(텍스트, 숫자 등)이어야 합니다.
  • range. 스타일 규칙의 샘플 출력 값 목록입니다. 범위의 값은 제어할 스타일 속성과 동일한 유형(색상 또는 숫자)이어야 합니다. 예를 들어 fillColor 속성 범위에는 색상만 포함해야 합니다.

지도의 형식을 지정하려면 다음 안내를 따르세요.

  1. 2단계의 스타일 추가 또는 3단계 스타일을 클릭합니다.

  2. 점의 색상을 변경합니다. fillColor를 클릭합니다.

  3. 필드에 파란색을 나타내는 HTML 색상 코드인 #0000FF를 입력합니다.

  4. 스타일 적용을 클릭합니다.

    색상 채우기

  5. 지도를 확인합니다. 점 중 하나를 클릭하면 해당 값이 표시됩니다.

    지점 세부정보

  6. fillOpacity를 클릭합니다.

  7. 필드에 0.5를 입력하고 스타일 적용을 클릭합니다.

    불투명도 채우기

  8. 지도를 확인합니다. 이제 점의 채우기 색상이 반투명해졌습니다.

    반투명 점이 있는 지도

  9. 사용 가능한 자전거 수에 따라 점의 크기를 변경합니다. circleRadius를 클릭합니다.

  10. circleRadius 패널에서 다음을 수행합니다.

    1. 데이터 기반을 클릭합니다.
    2. 함수linear를 선택합니다.
    3. 필드에서 num_bikes_available을 선택합니다.
    4. 도메인에서 첫 번째 상자에 30을 입력하고 두 번째 상자에 60을 입력합니다.
    5. 범위에서 첫 번째 상자에 5를 입력하고 두 번째 상자에 20를 입력합니다.

      원 반지름

  11. 지도를 확인합니다. 이제 각 원의 반경이 해당 위치에서 사용 가능한 자전거 수에 해당합니다.

    최종 지도

  12. Geo Viz를 닫습니다.

정리

이 튜토리얼에서 사용된 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 프로젝트를 삭제하거나 프로젝트를 유지하고 개별 리소스를 삭제하세요.

  • 만든 프로젝트를 삭제할 수 있습니다.
  • 또는 나중에 사용할 수 있도록 프로젝트를 유지할 수 있습니다.

프로젝트를 삭제하는 방법은 다음과 같습니다.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

다음 단계