SQL 셀 사용
이 가이드에서는 SQL 셀을 사용하여 Colab Enterprise 노트북 내에서 데이터를 쿼리하는 방법을 설명합니다.
개요
SQL 셀은 Colab Enterprise 노트북 내에서 SQL 쿼리를 작성, 수정, 실행하기 위한 코드 셀입니다. SQL 셀은 BigQuery용 IPython 매직의 대체 워크플로를 제공합니다.
기능
SQL 셀은 다음과 같은 기능을 제공합니다.
- 테스트 실행 지원: SQL 문 검증 및 쿼리로 처리된 바이트 수 근사치
- 서식 지정: 키워드 린트 및 구문 강조 표시
- BigQuery DataFrame 출력 변수 이름 지정: 다른 노트북 셀 내에서 출력 변수 참조
- 변수 대체: 매개변수화와 이전 쿼리 결과를 쿼리하는 기능을 지원하기 위해 Python 변수와 SQL 셀을 참조합니다.
- 결과 집합 뷰어: 대규모 결과 집합의 페이지로 나누기가 있는 경량 표 형식 결과 집합 뷰어
지원되는 SQL 언어 및 데이터 소스
Colab Enterprise SQL 셀은 GoogleSQL을 지원합니다.
BigQuery 데이터에 SQL 쿼리를 실행할 수 있습니다.
제한사항
프로젝트를 계획할 때 다음 제한사항을 고려하세요.
- 단일 SQL 셀에서 여러 SQL 문을 실행할 수 있지만 마지막 SQL 문의 결과만 DataFrame에 저장됩니다.
시작하기 전에
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
BigQuery 사용자(
roles/bigquery.user
) -
Colab Enterprise 사용자 (
roles/aiplatform.colabEnterpriseUser
) -
Google Cloud 콘솔에서 Colab Enterprise 내 노트북 페이지로 이동합니다.
-
리전 메뉴에서 노트북이 포함된 리전을 선택합니다.
-
열려는 노트북을 클릭합니다. 노트북을 만들지 않았으면 노트북을 만듭니다.
-
툴바에서 SQL 셀을 추가하려면
코드 셀 삽입 옵션 메뉴를 클릭하고 SQL 셀 추가를 선택합니다.SQL 셀이 노트북에 추가됩니다.
-
SQL 셀에 SQL 쿼리를 입력합니다. 지원되는 문과 SQL 언어에 대한 개요는 BigQuery의 SQL 소개를 참고하세요.
변수 이름을 중괄호 (
{ }
)로 묶어 표현식에서 Python 변수를 참조할 수 있습니다. 예를 들어my_threshold
이라는 Python 변수에 값을 지정한 경우 다음과 유사한 쿼리로 결과 집합을 제한할 수 있습니다.SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
-
실행하려는 SQL 셀 위에 마우스 포인터를 올려놓고
셀 실행 버튼을 클릭합니다.
필요한 역할
Colab Enterprise 노트북을 만들고, 런타임에서 노트북 코드를 실행하고, 노트북에서 BigQuery 데이터를 사용하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.
SQL 셀 만들기
Colab Enterprise에서 SQL 셀을 만들려면 다음 단계를 따르세요.
쿼리 입력 및 실행
쿼리의 출력은 SQL 셀의 제목과 동일한 이름의 BigQuery DataFrame으로 자동 저장됩니다.
결과 집합과 상호작용
결과 집합을 BigQuery DataFrame 또는 pandas DataFrame으로 상호작용할 수 있습니다.
동일한 SQL 셀 변수 이름을 사용하여 SQL 문을 연결할 수 있습니다. 예를 들어 결과 집합에서 생성된 BigQuery DataFrame을 중괄호({ }
)로 DataFrame 이름을 묶어 후속 쿼리의 테이블로 사용할 수 있습니다. DataFrame 이름이 df
로 저장된 이전 쿼리의 출력을 참조하는 다음 예를 참고하세요.
SELECT * FROM {df};