목표
이 튜토리얼에서는 Python용 Spanner 클라이언트 라이브러리를 사용하는 방법을 단계적으로 설명합니다.
- Spanner 인스턴스와 데이터베이스 만들기
- 데이터베이스에서 데이터 읽기, 쓰기 및 데이터에서 SQL 쿼리 실행
- 데이터베이스 스키마 업데이트
- 읽기-쓰기 트랜잭션을 사용하여 데이터 업데이트
- 데이터베이스에 보조 색인 추가
- 색인을 사용하여 데이터 읽기 및 데이터에서 SQL 쿼리 실행
- 읽기 전용 트랜잭션을 사용하여 데이터 검색
비용
이 튜토리얼에서는 Google Cloud의 비용 청구 가능한 구성요소인 Spanner를 사용합니다. Spanner 사용 비용에 대한 자세한 내용은 가격 책정을 참조하세요.
시작하기 전에
설정에 설명된 단계를 완료하세요. 기본 Google Cloud 프로젝트 생성, 결제 사용 설정, Cloud Spanner API 사용 설정을 수행하고 Cloud Spanner API 사용에 필요한 사용자 인증 정보를 가져오기 위한 OAuth 2.0 설정을 완료해야 합니다.
특히 gcloud auth
application-default login
을 실행하여 사용자 인증 정보로 로컬 개발 환경을 설정해야 합니다.
로컬 Python 환경 준비
Python 개발 환경 설정의 안내에 따릅니다.
샘플 앱 저장소를 로컬 머신에 클론합니다.
git clone https://github.com/googleapis/python-spanner
또는 zip 파일로 샘플을 다운로드하고 압축을 풉니다.
Spanner 샘플 코드가 있는 디렉터리로 변경합니다.
cd python-spanner/samples/samples
격리된 Python 환경을 만들고 종속 항목을 설치합니다.
virtualenv env source env/bin/activate pip install -r requirements.txt
인스턴스 만들기
Spanner를 처음 사용할 때는 인스턴스를 만들어야 합니다. 이 인스턴스는 Spanner 데이터베이스에서 사용하는 리소스를 할당한 것입니다. 인스턴스를 만들 때는 인스턴스 구성을 선택합니다. 이 구성에 따라 데이터 저장 위치와 사용할 노드 수가 결정되고, 또한 노드 수에 따라 인스턴스의 제공 리소스 및 스토리지 리소스 양이 결정됩니다.
us-central1
리전에 1개의 노드로 Spanner 인스턴스를 만들려면 다음 명령어를 실행합니다.
gcloud spanner instances create test-instance --config=regional-us-central1 \
--description="Test Instance" --nodes=1
그러면 다음과 같은 특성을 가진 인스턴스가 생성됩니다.
- 인스턴스 ID:
test-instance
- 표시 이름:
Test Instance
- 인스턴스 구성:
regional-us-central1
. 리전별 구성은 한 리전에 데이터를 저장하는 반면 멀티 리전 구성은 여러 리전에 데이터를 분산시킵니다. 자세한 내용은 인스턴스 정보를 참조하세요. - 노드 수: 1개.
node_count
에 따라 인스턴스의 데이터베이스에서 사용할 수 있는 제공 리소스 및 스토리지 리소스의 양이 달라집니다. 노드 및 처리 단위에서 자세히 알아보세요.
다음과 같이 표시됩니다.
Creating instance...done.
샘플 파일 살펴보기
샘플 저장소에는 Ruby에서 Spanner를 사용하는 방법을 보여주는 샘플이 있습니다.
Spanner 사용 방법을 보여주는snippets.py
파일을 살펴보세요. 코드는 새 데이터베이스를 만들고 사용하는 방법을 보여줍니다. 데이터는 스키마 및 데이터 모델 페이지에 나와 있는 스키마 예시를 사용합니다.
데이터베이스 만들기
GoogleSQL
python snippets.py test-instance --database-id example-db create_database
PostgreSQL
python pg_snippets.py test-instance --database-id example-db create_database
다음과 같이 표시됩니다.
Created database example-db on instance test-instance
GoogleSQL
PostgreSQL
다음 단계는 데이터베이스에 데이터 쓰기입니다.
데이터베이스 클라이언트 만들기
읽기 또는 쓰기를 수행하려면 먼저Client
를 만들어야 합니다. Client
를 데이터베이스 연결이라고 생각하면 됩니다. Spanner와의 모든 상호작용은 Client
를 거쳐야 합니다. 일반적으로 애플리케이션이 시작될 때 Client
를 만들며, 이후에는 해당 Client
를 재사용하여 트랜잭션을 읽고 쓰고 실행할 수 있습니다. 다음 코드는 클라이언트를 만드는 방법을 보여줍니다.
자세한 내용은 Client
참조에서 확인하세요.
DML을 사용하여 데이터 쓰기
읽기-쓰기 트랜잭션에서 DML(Data Manipulation Language)을 사용하여 데이터를 삽입할 수 있습니다.
execute_update()
메서드를 사용하여 DML 문을 실행합니다.
insert_with_dml
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db insert_with_dml
다음과 같이 표시됩니다.
4 record(s) inserted.
변형을 사용하여 데이터 쓰기
변형을 사용하여 데이터를 삽입할 수도 있습니다.
Batch
객체를 사용하여 데이터를 씁니다. Batch
객체는 변형 작업의 컨테이너입니다. 변형이란 Spanner가 Spanner 데이터베이스의 여러 행과 테이블에 원자적으로 적용하는 일련의 삽입, 업데이트, 삭제입니다.
Batch
클래스의 insert()
메서드는 하나 이상의 삽입 변형을 배치에 추가합니다. 단일 배치의 모든 변형은 원자적으로 적용됩니다.
다음 코드는 변형을 사용하여 데이터를 쓰는 방법을 보여줍니다.
insert_data
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db insert_data
다음과 같이 표시됩니다.
Inserted data.
SQL을 사용하여 데이터 쿼리
Spanner는 데이터 읽기용 SQL 인터페이스를 지원하며 개발자는 Google Cloud CLI를 사용하여 명령줄에서 또는 Python용 Spanner 클라이언트 라이브러리를 사용하여 프로그래매틱 방식으로 액세스할 수 있습니다.
명령줄에서
다음 SQL 문을 실행하여 Albums
테이블에서 모든 열의 값을 읽습니다.
gcloud spanner databases execute-sql example-db --instance=test-instance \
--sql='SELECT SingerId, AlbumId, AlbumTitle FROM Albums'
결과가 다음과 같이 표시됩니다.
SingerId AlbumId AlbumTitle
1 1 Total Junk
1 2 Go, Go, Go
2 1 Green
2 2 Forever Hold Your Peace
2 3 Terrified
Python용 Spanner 클라이언트 라이브러리 사용
명령줄에서 SQL 문 실행 외에도 Python용 Spanner 클라이언트 라이브러리를 프로그래매틱 방식으로 사용하여 같은 SQL 문을 실행할 수 있습니다.
Snapshot
객체의 execute_sql()
메서드를 사용하여 SQL 쿼리를 실행합니다. Snapshot
객체를 가져오려면 with
문에서 Database
클래스의 snapshot()
메서드를 호출합니다.
다음은 쿼리를 실행하고 데이터에 액세스하는 방법입니다.
query_data
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db query_data
다음과 같은 결과가 표시됩니다.
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SQL 매개변수를 사용하여 쿼리
애플리케이션에 자주 실행되는 쿼리가 있는 경우 이를 매개변수화하여 성능을 개선할 수 있습니다. 매개변수화된 결과 쿼리를 캐시하고 다시 사용할 수 있으므로 컴파일 비용이 절감됩니다. 자세한 내용은 쿼리 매개변수를 사용하여 자주 실행되는 쿼리 속도 향상을 참조하세요.
다음 예시에서는 WHERE
절의 매개변수를 사용하여 LastName
의 특정 값이 포함된 레코드를 쿼리합니다.
query_data_with_parameter 인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db query_data_with_parameter
다음과 같은 결과가 표시됩니다.
SingerId: 12, FirstName: Melissa, LastName: Garcia
읽기 API를 사용하여 데이터 읽기
Spanner는 Spanner의 SQL 인터페이스 외에도 읽기 인터페이스도 지원합니다.
Snapshot
객체의 read()
메서드를 사용하여 데이터베이스에서 행을 읽습니다.
Snapshot
객체를 가져오려면 with
문에서 Database
클래스의 snapshot()
메서드를 호출합니다.
KeySet
객체를 사용하여 읽을 키 모음과 키 범위를 정의합니다.
다음은 데이터를 읽는 방법입니다.
read_data
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db read_data
다음과 비슷한 출력이 표시됩니다.
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
데이터베이스 스키마 업데이트
Albums
테이블에 MarketingBudget
이라는 새 열을 추가해야 한다고 가정합니다. 기존 테이블에 새 열을 추가하려면 데이터베이스 스키마를 업데이트해야 합니다. Spanner는 데이터베이스에서 트래픽이 계속 처리되는 동안 데이터베이스의 스키마 업데이트를 지원합니다. 스키마 업데이트 시 데이터베이스를 오프라인으로 전환할 필요가 없고 전체 테이블 또는 열을 잠그지 않습니다. 스키마 업데이트 중에도 데이터베이스에 계속 데이터를 쓸 수 있습니다. 스키마 업데이트에서 지원되는 스키마 업데이트와 스키마 변경 성능에 대해 자세히 알아보세요.
열 추가
명령줄에서 Google Cloud CLI를 사용하거나 Python용 Spanner 클라이언트 라이브러리를 프로그래매틱 방식으로 사용하여 열을 추가할 수 있습니다.
명령줄에서
다음과 같은 ALTER TABLE
명령어를 사용하여 테이블에 새 열을 추가합니다.
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget INT64'
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget BIGINT'
다음과 같이 표시됩니다.
Schema updating...done.
Python용 Spanner 클라이언트 라이브러리 사용
Database
클래스의 update_ddl()
메서드를 사용하여 스키마를 수정합니다.
add_column
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db add_column
다음과 같이 표시됩니다.
Added the MarketingBudget column.
새 열에 데이터 쓰기
다음 코드는 새 열에 데이터를 씁니다. 이 코드는 MarketingBudget
을 Albums(1, 1)
로 키가 지정된 행에서는 100000
으로, Albums(2, 2)
로 키가 지정된 행에서는 500000
으로 설정합니다.
update_data
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db update_data
방금 쓴 값을 가져오기 위해 SQL 쿼리 또는 읽기 호출을 실행할 수도 있습니다.
다음은 쿼리를 실행하는 코드입니다.
이 쿼리를 실행하려면 query_data_with_new_column
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db query_data_with_new_column
다음과 같이 표시됩니다.
SingerId: 2, AlbumId: 2, MarketingBudget: 500000
SingerId: 1, AlbumId: 2, MarketingBudget: None
SingerId: 2, AlbumId: 1, MarketingBudget: None
SingerId: 2, AlbumId: 3, MarketingBudget: None
SingerId: 1, AlbumId: 1, MarketingBudget: 100000
데이터 업데이트
읽기-쓰기 트랜잭션에서 DML을 사용하여 데이터를 업데이트할 수 있습니다.
execute_update()
메서드를 사용하여 DML 문을 실행합니다.
write_with_dml_transaction
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db write_with_dml_transaction
다음과 같이 표시됩니다.
Transferred 200000 from Album2's budget to Album1's
보조 색인 사용
Albums
에서 특정 범위의 AlbumTitle
값이 있는 모든 행을 가져오려고 한다고 가정합니다. SQL 문 또는 읽기 호출을 사용하여 AlbumTitle
열에서 모든 값을 읽은 다음 기준을 충족하지 않는 행을 삭제할 수 있지만 이렇게 전체 테이블 스캔을 수행하는 것은 비용이 많이 들며, 특히 많은 행이 있는 테이블의 경우에는 더욱 그렇습니다. 대신 테이블에 보조 색인을 만들어 기본 키가 아닌 열로 검색하면 행을 빠르게 검색할 수 있습니다.
기존 테이블에 보조 색인을 추가하려면 스키마를 업데이트해야 합니다. 다른 스키마 업데이트와 같이 Spanner는 데이터베이스에서 트래픽이 계속 처리되는 동안 색인을 추가할 수 있습니다. Spanner는 기존 데이터로 색인을 자동 백필합니다. 백필을 완료하는 데 몇 분 정도 걸릴 수 있지만 이 프로세스가 진행되는 동안 데이터베이스를 오프라인으로 전환하거나 색인이 생성되는 테이블에 대한 쓰기를 금지할 필요는 없습니다. 자세한 내용은 보조 색인 추가를 참조하세요.
보조 색인을 추가하고 나면 Spanner는 보조 색인 사용 시 더 빨리 실행될 가능성이 높은 SQL 쿼리에 자동으로 보조 색인을 사용합니다. 읽기 인터페이스를 사용하는 경우에는 사용할 색인을 지정해야 합니다.
보조 색인 추가
명령줄에서 gcloud CLI를 사용하거나 Python용 Spanner 클라이언트 라이브러리를 프로그래매틱 방식으로 사용하여 색인을 추가할 수 있습니다.
명령줄에서
다음과 같은 CREATE INDEX
명령어를 사용하여 데이터베이스에 색인을 추가합니다.
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle)'
다음과 같이 표시됩니다.
Schema updating...done.
Python용 Spanner 클라이언트 라이브러리 사용
Database
클래스의 update_ddl()
메서드를 사용하여 색인을 추가합니다.
add_index
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db add_index
색인을 추가하는 데 몇 분 정도 걸릴 수 있습니다. 색인이 추가되면 다음과 같이 표시됩니다.
Added the AlbumsByAlbumTitle index.
색인을 사용하여 읽기
SQL 쿼리의 경우 Spanner는 자동으로 적절한 색인을 사용합니다. 읽기 인터페이스에서는 사용자가 직접 요청에서 색인을 지정해야 합니다.
읽기 인터페이스에서 색인을 사용하려면 Snapshot
객체의 read()
메서드에 Index
인수를 제공합니다. Snapshot
객체를 가져오려면 with
문에서 Database
클래스의 snapshot()
메서드를 호출합니다.
read_data_with_index
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db read_data_with_index
다음과 같이 표시됩니다.
AlbumId: 2, AlbumTitle: Forever Hold Your Peace
AlbumId: 2, AlbumTitle: Go, Go, Go
AlbumId: 1, AlbumTitle: Green
AlbumId: 3, AlbumTitle: Terrified
AlbumId: 1, AlbumTitle: Total Junk
색인 전용 읽기에 필요한 색인 추가
이전 읽기 예시에는 MarketingBudget
열 읽기가 포함되지 않은 것을 확인할 수 있습니다. 이는 Spanner의 읽기 인터페이스가 색인에 저장되지 않은 값을 찾기 위해 색인을 데이터 테이블에 조인하는 기능을 지원하지 않기 때문입니다.
색인에 MarketingBudget
사본을 저장하는 AlbumsByAlbumTitle
대체 정의를 만듭니다.
명령줄에서
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget)
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) INCLUDE (MarketingBudget)
색인을 추가하는 데 몇 분 정도 걸릴 수 있습니다. 색인이 추가되면 다음과 같이 표시됩니다.
Schema updating...done.
Python용 Spanner 클라이언트 라이브러리 사용
Database
클래스의 update_ddl()
메서드를 사용하여 STORING
절을 포함하는 색인을 추가합니다.
add_storing_index
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db add_storing_index
다음과 같이 표시됩니다.
Added the AlbumsByAlbumTitle2 index.
이제 AlbumsByAlbumTitle2
색인의 AlbumId
, AlbumTitle
, MarketingBudget
열을 모두 가져오는 읽기를 실행할 수 있습니다.
read_data_with_storing_index
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db read_data_with_storing_index
다음과 비슷한 출력이 표시됩니다.
AlbumId: 2, AlbumTitle: Forever Hold Your Peace, MarketingBudget: 300000
AlbumId: 2, AlbumTitle: Go, Go, Go, MarketingBudget: None
AlbumId: 1, AlbumTitle: Green, MarketingBudget: None
AlbumId: 3, AlbumTitle: Terrified, MarketingBudget: None
AlbumId: 1, AlbumTitle: Total Junk, MarketingBudget: 300000
읽기 전용 트랜잭션을 사용하여 데이터 검색
같은 타임스탬프에서 읽기를 하나 이상 실행한다고 가정해 봅시다. 읽기 전용 트랜잭션은 트랜잭션 커밋 기록의 일관된 프리픽스를 관찰하므로 애플리케이션이 항상 일관된 데이터를 가져옵니다.
Snapshot
객체를 사용하여 읽기 전용 트랜잭션을 실행합니다. Snapshot
객체를 가져오려면 with
문에서 Database
클래스의 snapshot()
메서드를 호출합니다.
다음은 같은 읽기 전용 트랜잭션에서 쿼리를 실행하고 읽기를 수행하는 방법을 보여줍니다.
read_only_transaction
인수를 사용하여 샘플을 실행합니다.
python snippets.py test-instance --database-id example-db read_only_transaction
다음과 비슷한 출력이 표시됩니다.
Results from first read:
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
Results from second read:
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
삭제
이 튜토리얼에서 사용한 리소스에 대한 추가 비용이 Cloud Billing 계정에 청구되지 않도록 하려면 데이터베이스와 새로 만든 인스턴스를 삭제합니다.
데이터베이스 삭제
인스턴스를 삭제하면 인스턴스 내의 모든 데이터베이스가 자동으로 삭제됩니다. 다음 단계는 인스턴스를 삭제하지 않고 데이터베이스를 삭제하는 방법을 보여줍니다. 인스턴스에 대한 비용은 여전히 발생합니다.
명령줄에서
gcloud spanner databases delete example-db --instance=test-instance
Google Cloud 콘솔 사용
Google Cloud 콘솔에서 Spanner 인스턴스 페이지로 이동합니다.
인스턴스를 클릭합니다.
삭제할 데이터베이스를 클릭합니다.
데이터베이스 세부정보 페이지에서 삭제를 클릭합니다.
데이터베이스 삭제 여부를 확인하고 삭제를 클릭합니다.
인스턴스 삭제
인스턴스를 삭제하면 해당 인스턴스에서 만든 모든 데이터베이스가 자동으로 삭제됩니다.
명령줄에서
gcloud spanner instances delete test-instance
Google Cloud 콘솔 사용
Google Cloud 콘솔에서 Spanner 인스턴스 페이지로 이동합니다.
인스턴스를 클릭합니다.
삭제를 클릭합니다.
인스턴스 삭제 여부를 확인하고 삭제를 클릭합니다.
다음 단계
가상 머신 인스턴스에서 Spanner에 액세스하는 방법을 알아봅니다.
클라이언트 라이브러리를 사용하여 Cloud 서비스에 인증에서 사용자 인증 정보의 승인 및 인증에 대해 알아봅니다.
Spanner 스키마 설계 권장사항에 대해 자세히 알아봅니다.