이 문서에서는 BigQuery에 데이터를 로드하는 방법을 설명합니다. 데이터 통합에 관한 두 가지 일반적인 접근 방식은 데이터를 추출(extract), 로드(load), 변환(transform)하거나(ELT) 추출(extract), 변환(transform), 로드(load)하는(ETL) 것입니다.
BigQuery Data Transfer Service를 사용하면 BigQuery로의 데이터 로드 파이프라인을 자동화하기 위해 로드 작업을 예약할 수 있습니다. 정기적인 간격(예를 들어, 매일 또는 매월)으로 일회성 또는 일괄 데이터 전송을 예약할 수 있습니다. BigQuery 데이터를 항상 최신 상태로 유지하려면 전송을 모니터링하고 기록하면 됩니다.
BigQuery Data Transfer Service에서 지원하는 데이터 소스 목록은 지원되는 데이터 소스를 참고하세요.
스트리밍 로드
이 메서드를 사용하면 메시지 시스템에서 거의 실시간으로 데이터를 로드할 수 있습니다.
BigQuery로 데이터를 스트리밍하려면 Pub/Sub에서 BigQuery 구독을 사용하면 됩니다. Pub/Sub은 BigQuery로의 높은 처리량 데이터 로드를 처리할 수 있습니다. 실시간 데이터 스트리밍을 지원하여 데이터가 생성될 때마다 데이터를 로드합니다. 자세한 내용은 BigQuery 구독을 참고하세요.
변경 데이터 캡처(CDC)
이 메서드를 사용하면 데이터베이스에서 BigQuery로 데이터를 거의 실시간으로 복제할 수 있습니다.
Datastream은 거의 실시간 복제를 사용하여 데이터베이스에서 BigQuery 데이터로 데이터를 스트리밍할 수 있습니다. Datastream은 CDC 기능을 활용하여 데이터 소스의 행 수준 변경사항을 추적하고 복제합니다.
이 메서드를 사용하면 외부 데이터를 BigQuery에 로드하지 않고도 외부 데이터에 액세스할 수 있습니다.
BigQuery는 Cloud Storage 및 제휴 쿼리를 통해 일부 외부 데이터 소스에 대한 액세스를 지원합니다. 이 방법의 장점은 후속 사용을 위해 데이터를 변환하기 전에 데이터를 로드할 필요가 없다는 것입니다. 외부 데이터에 대해 SELECT 문을 실행하여 변환을 실행할 수 있습니다.
BigQuery를 사용하면 Cloud Storage 또는 Spanner와 같은 Google Cloud 서비스나 Amazon Web Services(AWS) 또는 Microsoft Azure와 같은 서드 파티 소스에서 BigQuery 외부에 저장된 데이터를 쿼리하는 외부 연결을 만들 수 있습니다. 이러한 외부 연결에는 BigQuery Connection API가 사용됩니다. 자세한 내용은 연결 소개를 참조하세요.
데이터를 획득하는 다른 방법
데이터를 직접 BigQuery에 로드하지 않고도 데이터에 대한 쿼리를 실행할 수 있습니다. 다음 섹션에서는 몇 가지 대안을 설명합니다.
다음 목록에서는 몇 가지 대안을 설명합니다.
공개 데이터에 대한 쿼리 실행
공개 데이터세트는 BigQuery에 저장되고 일반 대중에 공유되는 데이터세트입니다. 자세한 내용은 BigQuery 공개 데이터세트를 참조하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eBigQuery supports two primary data integration approaches: Extract, Load, Transform (ELT) and Extract, Transform, Load (ETL).\u003c/p\u003e\n"],["\u003cp\u003eData can be loaded into BigQuery using batch loading for large datasets, streaming for near real-time data, or Change Data Capture (CDC) for replicating database changes in near real time.\u003c/p\u003e\n"],["\u003cp\u003eBigQuery allows federation to external data sources, enabling access without requiring data to be loaded into BigQuery itself.\u003c/p\u003e\n"],["\u003cp\u003eProgrammatic methods include creating load jobs for batch loading data from Cloud Storage or local files, as well as using Dataflow or the BigQuery Storage Write API for streaming data from custom sources.\u003c/p\u003e\n"],["\u003cp\u003eBigQuery offers alternative ways to access data without direct loading such as Public datasets, shared datasets via Analytics Hub, and log data from Cloud Logging or Log Analytics.\u003c/p\u003e\n"]]],[],null,["# Introduction to loading data\n============================\n\nThis document explains how you can load data into BigQuery. The two\ncommon approaches to data integration are to extract, load, and\ntransform (ELT) or to extract, transform, load (ETL) data.\n\nFor an overview of ELT and ETL approaches, see\n[Introduction to loading, transforming, and exporting data](/bigquery/docs/load-transform-export-intro).\n\nMethods of loading or accessing external data\n---------------------------------------------\n\nIn the BigQuery page, in the\n[**Add data** dialog](/bigquery/docs/bigquery-web-ui#add_data), you can view all\navailable methods to load data into BigQuery or access data from\nBigQuery. Choose one of the following options based on your use\ncase and data sources:\n\nYou can also use the following programmatic methods to load the data:\n\n[Cloud Data Fusion](/data-fusion/docs/concepts/overview) can help facilitate your ETL process. BigQuery also works with\n[3rd party partners that transform and load data into BigQuery](/bigquery/docs/bigquery-ready-partners#etl-data-integration).\n\nBigQuery lets you create external connections to query data that's\nstored outside of BigQuery in Google Cloud services like\nCloud Storage or Spanner, or in third-party sources like\nAmazon Web Services (AWS) or Microsoft Azure. These external connections use the\nBigQuery Connection API. For more information, see [Introduction to connections](/bigquery/docs/connections-api-intro).\n\nOther ways to acquire data\n--------------------------\n\nYou can run queries on data without loading it into BigQuery\nyourself. The following sections describe some alternatives.\n\nThe following list describes some of the alternatives:\n\n### Run queries on public data\n\nPublic datasets are datasets stored in BigQuery and shared with\nthe public. For more information, see\n[BigQuery public datasets](/bigquery/public-data).\n\n### Run queries on shared data\n\nTo run queries on a BigQuery dataset that someone has shared\nwith you, see\n[Introduction to BigQuery sharing (formerly Analytics Hub)](/bigquery/docs/analytics-hub-introduction). Sharing is a data\nexchange platform that enables data sharing.\n\n### Run queries with log data\n\nYou can run queries on logs without creating additional load jobs:\n\n- **Cloud Logging** lets you\n [route logs to a BigQuery destination](/logging/docs/export/configure_export).\n\n- **Log Analytics** lets you\n [run queries that analyze your log data](/logging/docs/log-analytics#analytics).\n\nWhat's next\n-----------\n\n- Learn how to [prepare data](/bigquery/docs/data-prep-introduction) with Gemini in BigQuery.\n- Learn more about transforming data with [Dataform](/dataform/docs/overview).\n- Learn more about monitoring load jobs in the [administrative jobs explorer](/bigquery/docs/admin-jobs-explorer) and [BigQuery metrics](/monitoring/api/metrics_gcp_a_b#gcp-bigquery)."]]