데이터 로드 및 쿼리
데이터 세트를 만들고, 데이터를 테이블에 로드하고, 테이블을 쿼리하여 BigQuery를 시작합니다.
Google Cloud 콘솔에서 이 태스크에 대한 단계별 안내를 직접 수행하려면 둘러보기를 클릭합니다.
시작하기 전에
BigQuery를 탐색하려면 먼저Google Cloud 콘솔에 로그인하여 프로젝트를 만들어야 합니다. 프로젝트에서 결제를 사용 설정하지 않으면 업로드하는 모든 데이터가 BigQuery 샌드박스에 저장됩니다. 샌드박스를 통해 제한된 BigQuery 기능을 사용하면서 BigQuery를 무료로 학습할 수 있습니다. 자세한 내용은 BigQuery 샌드박스 사용 설정을 참고하세요.- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
- 선택사항: 기존 프로젝트를 선택하는 경우 BigQuery API를 사용 설정해야 합니다. BigQuery API는 새 프로젝트에서 자동으로 사용 설정됩니다.
- Google Cloud 콘솔에서 BigQuery 페이지를 엽니다. BigQuery로 이동
- 왼쪽 창에서 탐색기를 클릭합니다.
탐색기 창에서 프로젝트 이름을 클릭합니다.- 작업 보기를 클릭합니다.
- 데이터 세트 만들기를 선택합니다.
- 데이터 세트 만들기 페이지에서 다음을 수행합니다.
- 데이터 세트 ID에
babynames
를 입력합니다. - 위치 유형에 대해 멀티 리전을 선택한 다음 US (미국 내 여러 리전)를 선택합니다. 공개 데이터 세트는
us
멀티 리전 위치에 저장됩니다. 편의상 같은 위치에 데이터 세트를 저장합니다. - 나머지 기본 설정은 그대로 두고
데이터 세트 만들기 를 클릭합니다. 새 브라우저 탭에서 다음 URL을 열어 미국 사회보장국의 데이터를 다운로드합니다.
https://www.ssa.gov/OACT/babynames/names.zip
파일 압축을 풉니다.
데이터 세트 스키마에 대한 자세한 내용은 ZIP 파일의
NationalReadMe.pdf
파일을 참조하세요.데이터가 어떻게 표시되는지 확인하려면
yob2024.txt
파일을 엽니다. 이 파일에는 이름, 출생 시 성별, 해당 이름을 가진 아이의 수에 대한 쉼표로 구분된 값이 포함되어 있습니다. 파일에는 헤더 행이 없습니다.나중에 찾을 수 있도록
yob2024.txt
파일의 위치를 기록해 둡니다.- 왼쪽 창에서 탐색기를 클릭합니다.
탐색기 창에서 프로젝트 이름을 펼칩니다.- 데이터 세트를 클릭한 다음 babynames 데이터 세트 옆에 있는 작업 보기를 클릭하고 열기를 선택합니다.
달리 명시되지 않는 한 모든 설정에 기본값을 사용합니다.
테이블 만들기를 클릭합니다.
- 테이블 만들기 페이지에서 다음을 수행합니다.
- 소스 섹션의
테이블을 만들 소스 목록에서 업로드를 선택합니다. - 파일 선택 필드에서 찾아보기를 클릭합니다.
- 로컬
yob2024.txt
파일로 이동하여 열고 열기를 클릭합니다. 파일 형식 목록에서 CSV를 선택합니다.- 대상 섹션의
테이블 필드에names_2024
를 입력합니다. - 스키마 섹션에서
텍스트로 수정 전환 버튼을 클릭하고 다음 스키마 정의를 텍스트 필드에 붙여넣습니다. 테이블 만들기 를 클릭합니다.BigQuery가 테이블을 만들고 데이터를 로드할 때까지 기다립니다.
- 왼쪽 창에서 탐색기를 클릭합니다.
탐색기 창에서 프로젝트를 펼치고 데이터 세트를 클릭합니다.babynames
데이터 세트를 클릭한 다음names_2024
테이블을 선택합니다.미리보기 탭을 클릭합니다. BigQuery에서 테이블의 처음 몇 행을 표시합니다.- names_2024 탭 옆에 있는 SQL 쿼리 옵션을 클릭합니다. 새 편집기 탭이 열립니다.
- 쿼리 편집기에 다음 쿼리를 붙여넣습니다. 이 쿼리에서는 2024년에 출생 성별이 남자인 미국에서 태어난 아기의 상위 5개 이름을 검색합니다.
SELECT name, count FROM `babynames.names_2024` WHERE assigned_sex_at_birth = 'M' ORDER BY count DESC LIMIT 5;
실행 을 클릭합니다. 쿼리 결과 섹션에 결과가 표시됩니다.
- Google Cloud 콘솔에서 BigQuery 페이지를 엽니다. BigQuery로 이동
- 왼쪽 창에서 탐색기를 클릭합니다.
- 탐색기 창에서 데이터 세트를 클릭한 다음 앞서 만든
babynames
데이터 세트를 클릭합니다. - 작업 보기 옵션을 펼치고 삭제를 클릭합니다.
- 데이터 세트 삭제 대화상자에서 삭제 명령어를 확인합니다.
delete
단어를 입력한 후 삭제를 클릭합니다. - BigQuery에 데이터를 로드하는 방법에 대한 자세한 내용은 데이터 로드 소개를 참조하세요.
- 데이터 쿼리에 대해 자세히 알아보려면 BigQuery 분석 개요를 참고하세요.
- 중첩 및 반복 데이터가 있는 JSON 파일을 로드하는 방법은 중첩 및 반복 JSON 데이터 로드를 참조하세요.
- 프로그래매틱 방식으로 BigQuery에 액세스하는 방법에 대한 자세한 내용은 REST API 참조 또는 BigQuery 클라이언트 라이브러리 페이지를 확인하세요.
BigQuery 데이터 세트 만들기
Google Cloud 콘솔을 사용하여 데이터를 저장하는 데이터 세트를 만듭니다. 미국 멀티 리전 위치에 데이터 세트를 만듭니다. BigQuery 리전 및 멀티 리전에 대한 자세한 내용은 위치를 참고하세요.
소스 데이터가 포함된 파일 다운로드
다운로드하는 파일에는 약 7MB 분량의 인기 있는 아기 이름 데이터가 포함되어 있으며, 이 데이터는 미국 사회보장국에서 제공합니다.데이터에 대한 자세한 내용은 사회보장국의 인기 있는 이름 배경 정보를 참고하세요.
테이블에 데이터 로드
다음으로 새 테이블에 데이터를 로드합니다.
name:string,assigned_sex_at_birth:string,count:integer
테이블 데이터 미리보기
테이블 데이터를 미리보려면 다음 단계를 수행합니다.

테이블 데이터 쿼리
다음으로 테이블을 쿼리합니다.
Google Cloud 콘솔을 사용하여 공개 데이터 세트의 테이블을 성공적으로 쿼리한 후 샘플 데이터를 BigQuery에 로드했습니다.
삭제
이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 수행합니다.