BigQuery ML 소개

개요

BigQuery ML을 사용하면 BigQuery에서 표준 SQL 쿼리를 사용하여 머신러닝 모델을 만들고 실행할 수 있습니다. BigQuery ML은 SQL 실무자가 기존 SQL 도구 및 기술로 모델을 빌드할 수 있게 하여 머신러닝을 대중화합니다. BigQuery ML을 사용하면 데이터를 이동해야 할 필요가 없어 개발 속도가 향상됩니다.

BigQuery ML은 현재 다음과 같은 모델 유형을 지원합니다.

  • 선형 회귀 — 이러한 모델은 숫자 값을 예측하는 데 사용할 수 있습니다.
  • 이진 로지스틱 회귀 — 이러한 모델은 두 클래스 중 하나를 예측하는 데 사용할 수 있습니다(예: 이메일의 스팸 여부 식별).
  • 분류를 위한 다중 클래스 로지스틱 회귀 — 이러한 모델은 입력값이 '낮은 값', '중간 값', '높은 값' 중 무엇인지와 같이 3개 이상의 클래스를 예측하는 데 사용할 수 있습니다.

다음을 사용하여 BigQuery ML 기능을 사용할 수 있습니다.

  • BigQuery 웹 UI
  • bq 명령줄 도구
  • BigQuery REST API
  • Jupyter 노트북 또는 비즈니스 인텔리전스 플랫폼과 같은 외부 도구

대규모 데이터 세트의 머신러닝에는 ML 프레임워크에 대한 광범위한 프로그래밍과 지식이 필요합니다. 이러한 요구사항 때문에 각 회사 내 극소수 직원만 솔루션 개발을 담당할 수 있으며, 데이터를 이해하지만 머신러닝과 프로그래밍 전문 지식이 별로 없는 데이터 분석가는 개발에 참여하지 못합니다.

BigQuery ML을 사용하면 데이터 분석가가 기존 SQL 도구와 기술을 통해 머신러닝을 사용할 수 있습니다. 분석가는 BigQuery ML을 사용하여 BigQuery에서 ML 모델을 빌드하고 평가할 수 있습니다. 분석가는 더 이상 소량의 데이터를 스프레드시트 또는 다른 애플리케이션에 내보낼 필요가 없고 데이터 사이언스팀의 제한된 리소스를 기다릴 필요가 없습니다.

BigQuery ML의 장점

BigQuery ML에는 클라우드 기반 데이터 웨어하우스에서 ML을 사용하는 다른 접근 방식에 비해 다음과 같은 장점이 있습니다.

  • BigQuery ML은 기본 데이터 웨어하우스 사용자인 데이터 분석가가 기존 비즈니스 인텔리전스 도구 및 스프레드시트를 사용하여 모델을 빌드하고 실행할 수 있게 하여 ML 사용을 대중화합니다. 따라서 조직에서 예측 분석을 통해 비즈니스 의사 결정을 내릴 수 있습니다.
  • Python 또는 자바를 사용하여 ML 솔루션을 프로그래밍할 필요가 없습니다. 데이터 분석가가 알고 있는 언어인 SQL을 사용하여 BigQuery에서 모델을 학습시키고 액세스할 수 있습니다.
  • BigQuery ML을 사용하면 데이터 웨어하우스에서 데이터를 내보낼 필요가 없으므로 모델 개발 및 혁신 속도가 향상됩니다. 대신에 BigQuery ML은 데이터에 ML을 제공합니다. 데이터를 내보내고 형식을 다시 지정하면 다음과 같은 문제가 생길 수 있습니다.

    • 복잡성 증가 — 여러 도구가 필요합니다.
    • 속도 저하 — Python 기반 ML 프레임워크의 대규모 데이터를 이동하고 형식을 지정하는 것은 BigQuery의 모델 학습보다 시간이 오래 걸립니다.
    • 웨어하우스에서 데이터를 내보내려면 여러 단계를 거쳐야 하며 데이터를 실험할 수 있는 기능이 제한됩니다.
    • HIPAA 가이드라인과 같은 법적 조치로 인해 제한될 수 있습니다.

지원되는 지역

BigQuery ML 역시 BigQuery와 마찬가지로 다중 리전 리소스입니다. 따라서 BigQuery ML에서 지원하는 리전은 BigQuery에서 지원하는 리전과 동일합니다.

데이터 지역은 BigQuery ML 모델 및 학습 데이터를 저장할 데이터세트를 만들 때 지정됩니다. BigQuery ML은 타겟 데이터세트와 동일한 위치에서 데이터를 처리하고 스테이징합니다.

할당량

BigQuery ML 함수 및 CREATE MODEL 문을 사용하는 쿼리에는 BigQuery ML별 한도는 물론 쿼리 작업의 할당량 및 한도가 적용됩니다.

모든 할당량 및 한도에 대한 자세한 내용은 할당량 및 한도를 참조하세요.

가격 책정

BigQuery ML 모델은 테이블 및 보기와 같은 BigQuery 데이터세트에 저장됩니다. BigQuery ML에서 모델을 만들고 사용할 때 부과되는 비용은 데이터를 대상으로 실행하는 쿼리와 모델을 학습시키는 데 사용되는 데이터의 양에 따라 결정됩니다.

BigQuery ML 가격 책정에 대한 자세한 내용은 BigQuery ML 가격 책정을 참조하세요. 저장소 가격 책정에 대한 자세한 내용은 저장소 가격 책정을 참조하세요. 쿼리 가격 책정에 대한 자세한 내용은 쿼리 가격 책정을 참조하세요.

리소스

머신러닝과 BigQuery ML에 대한 자세한 내용은 다음을 참조하세요.

다음 단계

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

도움이 필요하시나요? 지원 페이지를 방문하세요.