Looker Blocks™는 일반적인 분석 패턴과 데이터 소스를 위해 사전 빌드된 데이터 모델입니다. 처음부터 시작하는 것이 아니라 다른 이가 이미 진행한 작업을 재사용하고 블록을 정확한 사양으로 맞춤설정합니다. Looker 블록은 최적화된 SQL 패턴부터 완전 구축된 데이터 모델까지 Looker에서 빠르고 유연한 데이터 모델링을 위한 시작점으로 사용할 수 있습니다.
사용 가능한 블록
선택할 수 있는 다양한 Looker 블록이 있습니다. 사용 가능한 블록을 확인하려면 Looker Marketplace의 블록 섹션을 확인하세요.
관심 있는 블록을 클릭하여 해당 특정 사용 안내를 확인합니다.
일부 Looker 블록은 Looker Marketplace를 사용하여 빠르게 설치할 수 있습니다. Looker Marketplace를 통해 블록을 배포하려면 먼저 Looker 관리자가 Marketplace 기능을 사용 설정해야 합니다. local_dependency
매개변수가 포함된 블록을 설치하려면 로컬 프로젝트 가져오기 실험실 기능을 사용 설정해야 합니다. Looker Marketplace에서 제공하는 Looker 블록 설치 및 맞춤설정에 대한 자세한 내용은 Looker Marketplace 문서 페이지를 참조합니다.
표준화 및 맞춤설정
다양한 블록의 사용 편의성은 데이터베이스 스키마의 표준화 정도에 따라 달라집니다. 대부분의 Looker 블록은 데이터 스키마에 대한 몇 가지 맞춤설정이 필요합니다. 단, 구현하기는 가장 간단하지만 맞춤설정이 불가능한 데이터 블록은 예외입니다.
공개 데이터 세트와 전체 LookML 모델이 모두 포함된 데이터 블록은 단순히 GitHub 저장소에서 LookML 모델을 복사하여 모델링된 테이블에 액세스하기만 하면 됩니다. 자세한 안내는 이 페이지의 데이터 블록 사용을 참조합니다.
Segment 및 Snowplow와 같은 데이터 수집 애플리케이션은 상대적으로 표준화된 형식으로 이벤트를 추적합니다. 이렇게 하면 이러한 애플리케이션을 사용하는 모든 고객이 사용할 수 있는 데이터 정리, 변환, 분석이 가능한 템플릿화된 설계 패턴을 만들 수 있습니다.
Salesforce와 같은 다른 웹 애플리케이션을 사용하면 내부 사용자를 위한 커스텀 필드를 추가할 수 있습니다. 그렇기 때문에 데이터가 표준화되지 않은 형식으로 생성됩니다. 따라서 일부 데이터 모델을 템플릿화하여 분석을 시작할 수 있지만 표준화되지 않은 부분을 맞춤설정해야 합니다.
마지막으로, 일반적인 비즈니스 인사이트를 위한 블록이 있습니다. 데이터 소스에 상관없이 최적화된 SQL 또는 LookML 디자인 패턴입니다. 예를 들어 많은 기업이 시간 경과에 따른 고객의 평생 가치를 분석하려고 합니다. 이러한 패턴에는 몇 가지 가정이 있으며, 특정 비즈니스 요구에 맞게 맞춤설정할 수 있습니다. 이러한 패턴은 특정 유형의 분석을 수행하는 최선의 방법에 대한 Looker의 관점을 반영합니다.
Looker를 처음 사용하는 경우 Looker 분석가가 이러한 모델을 최대한 활용할 수 있도록 지원할 수 있습니다.
LookML에 블록 추가
- 일부 블록은 동일한 파일의 Explore 및 보기를 모두 보여줍니다. 이는 보기 쉽게 하기 위한 것이지만, 일반적으로 LookML의 적절한 섹션을 데이터 모델의 적절한 위치에 복사하는 것이 좋습니다. 자세한 내용은 모델 및 뷰 파일 이해 문서 페이지를 참조합니다.
- 일부 경우에는 데이터 모델에 예시를 저장할 새로운 LookML 파일을 만들고 싶을 수 있습니다.
데이터 블록 사용
데이터 블록은 데이터 세트와 데이터 모델을 제공하는 특수한 유형의 Looker 블록입니다. Looker 데이터 블록에는 다음과 같은 공개 데이터 소스가 포함됩니다.
- 인구통계 데이터: 미국 지역사회의 주, 카운티, 우편번호 표 형식 영역, 인구조사 블록 그룹 수준의 일반적인 인구통계 측정항목입니다.
- 날씨 데이터: 1920년부터 전날까지의 미국 날씨 정보를 우편번호 수준으로 보고합니다. 이 블록은 밤에 업데이트됩니다.
사용 가능한 블록 전체 목록을 보려면 Looker Marketplace의 차단 섹션을 참조하세요.
다른 데이터베이스의 데이터 세트에 액세스
데이터 블록의 데이터 세트에 액세스하는 절차는 데이터베이스 스키마에 따라 다릅니다. 다음 섹션에는 이러한 데이터베이스의 데이터 세트에 액세스하는 방법에 대한 안내가 포함되어 있습니다.
Google BigQuery에서 데이터 세트에 액세스
기존 Google BigQuery 계정이 있는 경우 Looker의 BigQuery 호스팅 데이터 세트에 액세스할 수 있습니다. 이 페이지의 프로젝트에 데이터 블록 추가 섹션으로 건너뜁니다.
아직 Google BigQuery 계정이 없으면 무료 체험판을 설정한 후 BigQuery에서 Looker의 공개 데이터 세트에 액세스할 수 있습니다.
다른 데이터베이스의 데이터 세트에 액세스
Amazon Redshift, MySQL, PostgreSQL 또는 Oracle을 사용 중이신가요?
이러한 각 데이터 세트의 변환된 데이터를 원하는 데이터베이스로 직접 가져올 수 있도록 Google Cloud 서비스 및 S3 모두에서 공개적으로 사용할 수 있도록 했습니다.
또한 GitHub 저장소 내 각 데이터세트에서 데이터 정의 언어(DDL)를 사용할 수 있도록 했습니다. 선택한 데이터베이스에서 데이터 유형에 대해 DDL 문을 수정해야 할 수도 있지만, 각 테이블의 열 유형을 알 수 있어야 합니다.
다음 위치 중 하나에서 데이터를 직접 다운로드합니다.
- Google Cloud 서비스:
_gs://looker-datablocks/_
- S3:
_s3://looker-datablocks/_
- S3 버킷 웹 링크: http://looker-datablocks.s3-website-us-east-1.amazonaws.com/
LookML 모델 액세스
GitHub 저장소 중 하나를 Looker 또는 회사에서 호스팅하는 새 GitHub 저장소로 포크한 후 인스턴스 내에서 확장 또는 조정할 수 있습니다.
- 인구통계 데이터(American Community Survey) - https://github.com/llooker/datablocks-acs
- 날씨(GSOD) - https://github.com/llooker/datablocks-gsod
프로젝트에 데이터 블록 추가
이 섹션에서 설명하는 메서드 외에도 LookML 상세검색을 사용하여 프로젝트에서 뷰의 LookML와 Explore를 사용해 빌드할 수도 있습니다.
프로젝트에 데이터 블록을 추가하려면 다음을 따릅니다.
Looker 인스턴스에 새 프로젝트를 추가합니다.
앞에서 언급한 GitHub 저장소를 포크하거나 복사하여 사전 빌드된 LookML에 액세스합니다. 새 GitHub 저장소를 만들어야 합니다.
저장소에서 다른 데이터베이스 언어 파일을 삭제합니다. Looker 블록에는 일반적으로 Google BigQuery, Amazon Redshift, Snowflake에 대한 파일이 포함됩니다. 예를 들어 Google BigQuery에서 데이터 블록을 설정하는 경우 Google BigQuery 뷰 파일, Google BigQuery Explore 파일, Google BigQuery 모델 파일만 필요합니다.
모델 파일의 연결 이름을 데이터 블록의 데이터가 있는 데이터베이스 연결로 바꿉니다. Google BigQuery 또는 Snowflake를 사용하는 경우 확장하거나 세분화할 데이터베이스 연결을 사용합니다.
모든 조인 논리는 각 저장소의
.explore
파일에 있습니다. 프로젝트 매니페스트를 설정한 후 다음 단계에 이 파일을 포함합니다.데이터 블록을 확장하거나 세분화할 기본 Looker 프로젝트에서 프로젝트 매니페스트 파일을 만듭니다.
기본 Looker 프로젝트의 데이터 블록을 참조하려면 프로젝트 매니페스트 파일에 다음 LookML을 추가합니다.
project_name: "<your_project_name\>"
local_dependency: {
project: "<project_name_of_datablock\>"
}
설정 고려사항 및 옵션
Google BigQuery: 모델링된 올바른 파일 세트를 사용해야 합니다. Google BigQuery를 사용하는 경우 파일 이름에 _bq_
가 있는 모든 파일을 참조할 수 있습니다. Google BigQuery 모델 언어를 자체 데이터베이스 언어에 맞게 조정해야 할 수 있습니다.
확장 프로그램: 모델 확장 프로그램으로 인해 여러 연결에서 문제가 발생할 수 있으므로 모든 프로젝트는 Explore 파일의 확장 프로그램을 허용하도록 설정되었습니다.
파생 테이블 조인: 기본 파생 테이블 문서를 확인하는 것이 좋습니다. Looker가 공개적으로 사용 가능한 데이터 세트에서 다양한 수준의 집계를 통해 SQL을 작성하고 모델에 조인할 수 있습니다.
결과 세트 병합: 쿼리 결과 세트를 조합하여 데이터 세트의 결과 세트를 병합할 수도 있습니다.
인구통계 데이터 세트의 설정 예시
S3 또는 Google Cloud 서비스 버킷에서 원시 데이터를 다운로드하거나 Looker 데이터베이스에 연결하여 데이터에 액세스합니다.
LookML에서 인구통계 데이터 블록 모델을 Looker 인스턴스에서 별도의 프로젝트로 가져옵니다.
include
매개변수를 사용하여 뷰 파일을 가져옵니다.그런 다음 뷰 파일을 확장 또는 조정하거나 기본 파생 테이블을 사용하여 Explore에 필요한 집계 수준의 데이터를 가져옵니다.
이 예에서는 인구통계 데이터가 Google의 전자상거래 데이터 세트의 집계 수준과 서로 다르기 때문에(블록 그룹과 우편번호를 비교) 기본 파생 테이블을 사용하여 우편번호 수준까지 통계를 집계합니다. 이렇게 하면 복잡한 다대다 조인이 사라집니다.
include: "/american_community_survey/bq.explore" view: zipcode_income_facts { derived_table: { persist_for: "10000 hours" explore_source: fast_facts { column: ZCTA5 { field: tract_zcta_map.ZCTA5 } column: income_household { field: bg_facts.avg_income_house } column: total_population { field: bg_facts.total_population } } } dimension: ZCTA5 {} dimension: income_household { hidden: yes }
뷰 파일을 모델에 조인합니다.
include: "acs*.view" explore: order_items { join: users { sql_on: ${users.id} = ${order_items.user_id} ;; type: left_outer relationship: many_to_one } join: zipcode_income_facts { sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;; type: left_outer relationship: many_to_one } }
시각화 블록 사용
Looker에는 다양한 기본 제공 시각화 유형이 포함되어 있습니다. 하지만 Looker의 기본 시각화 유형이 적용되지 않는 차트 요구사항이 있는 경우 자체 커스텀 시각화 유형을 추가할 수도 있습니다. 또한 커스텀 시각화를 개발하여 Looker Marketplace에서 모든 Looker 사용자에게 제공할 수도 있습니다.
시각화 블록은 Looker에서 호스팅하는 사전 빌드된 자바스크립트 시각화 유형입니다. 시각화 블록을 Looker 인스턴스에 추가할 수 있으며 Looker의 기본 시각화 유형과 유사하게 작동합니다. 시각화 메뉴 바에 표시되며 드릴, 다운로드, 임베딩, 예약과 같은 핵심 기능을 포함합니다.
시각화 블록에 대해 자세히 알아보려면 Looker Marketplace의 플러그인 섹션에서 시각화 유형을 선택한 후 코드 보기를 클릭하고 시각화 블록의 READ.ME
파일로 이동합니다. READ.ME
파일은 시각화 예시를 보여주고 시각화 블록에 대한 자세한 정보를 제공합니다. 일부 시각화의 경우 READ.ME
파일은 URL 및 시각화 블록 추가 안내를 제공합니다.
인스턴스에 시각화 유형을 추가하려면 READ.ME
파일(있는 경우)의 안내와 시각화 문서 페이지의 정보를 참조합니다.