데이터 처리 및 분석 개요 | Documentation

데이터 분석 및 파이프라인 개요

데이터를 로드, 변환, 분석하여 비즈니스 인텔리전스 인사이트를 제공합니다.

Google Cloud의 데이터 분석 및 파이프라인 살펴보기

데이터 분석 및 파이프라인 제품, 기능, 절차에 대한 문서 및 클라우드 아키텍처 센터 문서를 읽어보세요.

BigQuery로 데이터 로드 소개

BigQuery에 데이터를 일괄 로드하거나 스트리밍하는 방법을 알아봅니다.

데이터 및 분석 리소스

다양한 데이터와 분석 주제 전반에서 아키텍처 센터 리소스를 사용하는 방식을 계획합니다.open_in_new

점프 스타트 솔루션: 분석 레이크하우스

데이터를 저장, 처리, 활성화하는 분석 레이크하우스를 설계하는 방법을 계획합니다.open_in_new

교육, 블로그 자료 등

교육 과정, 블로그 자료 및 기타 관련 리소스로 이동합니다.

데이터 분석가 교육 과정

데이터 분석가 역할에 필수적인 Google Cloud 기술을 알아봅니다.open_in_new

Looker를 사용한 BI 및 분석 학습 과정

Looker에서 데이터를 탐색하고 사용자를 위한 셀프 서비스 분석을 설정하는 방법을 알아봅니다.open_in_new

데이터 및 분석 워크로드의 결정 트리

데이터 및 분석 워크로드를 실행할 서비스를 선택하는 결정 트리를 봅니다.open_in_new

사용 사례별 데이터 분석 및 파이프라인 제품

섹션을 펼치거나 필터를 사용하여 일반적인 사용 사례에 맞는 제품과 가이드를 찾으세요.

데이터 분석 및 파이프라인 플랫폼과 제품군

인프라를 관리할 필요 없이 머신러닝 및 AI 도구로 로컬 및 외부 데이터를 분석한 후 인사이트를 안전하게 공유하고 시각화하세요.

BigQuery

내장된 ML로 확장성이 우수한 완전 관리형 데이터 웨어하우스를 사용해 데이터를 파악할 수 있습니다.

BigQuery의 BigLake

액세스 위임을 사용하여 외부 데이터 스토어의 구조화된 데이터를 쿼리합니다.

BigQuery 스토리지

대규모 데이터 세트에 대한 분석 쿼리 실행, 처리량이 높은 스트리밍 수집, 처리량이 높은 읽기에 최적화된 스토리지를 사용합니다.

BigQuery로의 마이그레이션 소개

각 마이그레이션 단계를 지원하는 무료 도구를 사용하여 데이터 웨어하우스를 BigQuery로 마이그레이션합니다.

데이터 분석

임시 및 프로그래매틱 분석과 데이터 공유를 지원하는 SQL, 지리정보 분석, BI 도구를 사용하여 대규모 데이터 세트를 쿼리합니다.

Analytics Hub

강력한 보안과 개인 정보 보호 프레임워크로 조직 경계에서 규모에 맞게 데이터와 통계를 공유합니다.

BigQuery 분석

대규모 데이터 세트에서 분석 쿼리를 실행할 때 데이터 분석 투자 효과를 극대화하세요.

BigQuery ML

GoogleSQL 쿼리를 사용하여 머신러닝(ML) 모델을 만들고 실행하며 LLM 및 Cloud AI API에 액세스하여 텍스트 생성 또는 기계 번역과 같은 인공지능(AI) 태스크를 수행합니다.

Dataproc

관리형 Apache Spark 및 Hadoop 서비스를 사용하여 일괄 처리, 쿼리, 스트리밍을 수행합니다.

Earth Engine

Google Earth Engine은 지리정보 처리 서비스입니다. Earth Engine을 사용하면 Google Cloud Platform을 기반으로 대규모 지리정보 처리를 수행할 수 있습니다.

Looker

신뢰할 수 있는 최신 버전의 데이터에 액세스, 분석, 조치

Looker Studio

우수한 데이터 스토리텔링으로 더 나은 비즈니스 의사결정을 지원합니다.

데이터 거버넌스

조직 안팎에서 데이터를 공유하면서 데이터 수명 주기 전반에 걸쳐 품질을 제어하고 관리하세요.

Data Catalog

확장 가능한 완전 관리형 데이터 탐색 및 메타데이터 관리 서비스를 사용해 데이터를 탐색 및 파악합니다.

Dataplex

데이터를 레이크와 영역으로 구성하고 데이터 관리 및 거버넌스를 자동화하여 대규모 분석을 지원합니다.

Sensitive Data Protection

민감한 데이터를 탐색 및 수정합니다.

BigQuery의 데이터 거버넌스 소개

BigQuery 데이터 거버넌스 정책을 구현하고 적용합니다.

데이터 수집

처리량이 높은 서버리스 스토리지 아키텍처로 데이터를 마이그레이션, 스트리밍, 일괄 로드합니다.

BigQuery용 Apache Kafka

Kafka 스트림을 Google Cloud로 직접 수집할 수 있게 해주는 관리형 클라우드 서비스입니다.

BigQuery Data Transfer Service

예약된 일정에 따라 관리형으로 BigQuery로 데이터를 자동으로 이동합니다. 코드를 작성하지 않고도 BigQuery 데이터 웨어하우스의 기반을 마련합니다.

Cloud Data Fusion

코드 작성이 필요 없는 완전 관리형 데이터 통합 그래픽 인터페이스를 사용해 데이터 파이프라인을 신속하게 빌드하고 관리할 수 있습니다.

Dataflow

실시간 일괄 처리를 실행하고 스트림 데이터 처리 파이프라인을 개발합니다.

Dataproc

관리형 Apache Spark 및 Hadoop 서비스를 사용하여 일괄 처리, 쿼리, 스트리밍을 수행합니다.

Dataproc Metastore

Google Cloud에서 실행되는 완전 관리형 Apache Hive 메타스토어(HMS)를 사용하여 데이터 레이크와 메타데이터를 관리합니다.

Dataproc Serverless

서버리스 Dataproc를 사용하여 자체 클러스터를 프로비저닝 및 관리하지 않고 Spark 일괄 워크로드를 실행합니다.

Datastream

사용하기 쉬운 서버리스 변경 데이터 캡처(CDC) 및 복제 서비스입니다.

Pub/Sub

위치와 규모에 관계없이 이벤트 스트림을 수집합니다.

Storage Transfer Service

AWS S3 및 Cloud Storage와 같은 Cloud Storage 서비스 간에 데이터를 전송합니다.

Transfer Appliance

랙형 스토리지를 사용하여 대용량 데이터를 Google Cloud로 전송합니다.

데이터 조정

데이터 소스 및 프로세스 전반에서 원활한 연결을 통해 워크로드 관리 체인을 구성하고 최적화합니다.

Cloud Composer

Apache Airflow를 기반으로 구축된 완전 관리형 조정 서비스를 사용해 워크플로를 생성, 예약, 모니터링, 관리합니다.

Dataform

Dataform은 데이터팀이 BigQuery에서 SQL 워크플로를 빌드, 버전 제어, 조정하는 데 도움이 되는 엔드 투 엔드 환경을 제공합니다.