가장 오래 실행 중인 쿼리라고도 하는 가장 오래된 활성 쿼리는 데이터베이스에서 실행 기간에 따라 정렬된 활성 상태 쿼리의 목록입니다. 이러한 쿼리에 대한 통계를 가져오면 시스템 지연 시간이 발생하고 그에 따른 CPU 사용량이 높은 이유를 파악할 수 있습니다.
Spanner는 시작 시간에 따라 오름차순으로 정렬되는 DML 문 포함 쿼리를 비롯하여 실행 중인 쿼리를 나열하는 기본 제공되는 테이블 SPANNER_SYS.OLDEST_ACTIVE_QUERIES
를 제공합니다. 변경 내역 쿼리는 포함되지 않습니다.
실행 중인 쿼리가 많으면 시스템에서 이 데이터 수집에 적용하는 메모리 제약조건으로 인해 결과는 총 쿼리의 일부로 제한될 수 있습니다. 따라서 Spanner는 모든 활성 쿼리의 요약 통계를 표시하는 추가적인 SPANNER_SYS.ACTIVE_QUERIES_SUMMARY
테이블을 제공합니다(변경 스트림 제외).
SQL 문을 사용하여 기본 제공되는 테이블 모두에서 정보를 검색할 수 있습니다.
이 문서에서는 두 테이블 모두를 설명하고 이러한 테이블을 사용하는 몇 가지 쿼리 예시와 마지막으로 테이블을 사용하여 활성 쿼리로 인한 문제를 완화하는 방법을 설명합니다.
사용 가능 여부
SPANNER_SYS
데이터는 SQL 인터페이스를 통해서만 사용할 수 있습니다. 예를 들면 다음과 같습니다.
Google Cloud 콘솔에 있는 데이터베이스의 Spanner Studio 페이지
executeQuery
API
Spanner가 제공하는 다른 단일 읽기 메서드는 SPANNER_SYS
를 지원하지 않습니다.
OLDEST_ACTIVE_QUERIES
SPANNER_SYS.OLDEST_ACTIVE_QUERIES
는 시작 시간으로 정렬된 활성 쿼리 목록을 반환합니다. 실행 중인 쿼리가 많으면 Spanner에서 이 데이터 수집에 적용하는 메모리 제약조건으로 인해 결과는 총 쿼리의 일부로 제한될 수 있습니다. 모든 활성 쿼리의 요약 통계를 보려면 ACTIVE_QUERIES_SUMMARY
를 참조하세요.
테이블 스키마
열 이름 | 유형 | 설명 |
---|---|---|
START_TIME |
TIMESTAMP |
쿼리 시작 시간 |
TEXT_FINGERPRINT |
INT64 |
디지털 지문은 트랜잭션과 관련된 작업의 해시입니다. |
TEXT |
STRING |
쿼리 문 텍스트입니다. |
TEXT_TRUNCATED |
BOOL |
TEXT 필드의 쿼리 텍스트가 잘렸다면 True이고 그렇지 않으면 False입니다. |
SESSION_ID |
STRING |
쿼리를 실행하는 세션의 ID입니다. 관측 가능성에 사용됩니다. |
QUERY_ID |
STRING |
쿼리 ID입니다. 쿼리를 취소하려면 CALL cancel_query("query_id") 에서 이 ID를 사용합니다. |
쿼리 예
클라이언트 라이브러리, Google Cloud CLI 또는Google Cloud 콘솔을 사용하여 다음 SQL 문 예시를 실행할 수 있습니다.
가장 오래 실행 중인 쿼리 나열
다음 쿼리는 쿼리 시작 시간을 기준으로 정렬된 가장 오래 실행 중인 쿼리 목록을 반환합니다.
SELECT start_time,
text_fingerprint,
text,
text_truncated,
session_id
FROM spanner_sys.oldest_active_queries
ORDER BY start_time ASC;
start_time | text_fingerprint | text | text_truncated | session_id |
---|---|---|---|---|
2020-07-18T07:52:28.225877Z | -3426560921851907385 | SELECT a.SingerId, a.AlbumId, a.TrackId, b.SingerId as b_id, b.AlbumId as b_albumid, b.TrackId as b_trackId FROM Songs as a CROSS JOIN Songs as b; | False | ACjbPvYsucrtcffHrRK6aObeIjZf12tSUwOsim-g1WC3IhqF4epzICCQR3GCHw |
2020-07-18T07:54:08.622081Z | -9206690983832919848 | SELECT a.SingerId, a.AlbumId, a.TrackId, a.SongName, s.FirstName, s.LastName FROM Songs as a JOIN Singers as s ON s.SingerId = a.SingerId WHERE STARTS_WITH(s.FirstName, 'FirstName') LIMIT 1000000; | False | ACjbPvaF3yKiNfxXFod2LPoFaXjKR759Bw1o34206vv0t7eOrD3wxZhu8U6ohQ |
2020-07-18T07:54:08.631744Z | -105437553161169030 | SELECT a.SingerId, a.AlbumId, a.TrackId, a.SongName, s.FirstName, s.LastName FROM Songs as a JOIN Singers as s ON s.SingerId = a.SingerId WHERE a.SingerId > 7 LIMIT 1000000; | False | ACjbPvanq3MesDNT98t64KdKAz3TlDZoCC-zgW-FJn91cJHuczQ_cOFN_Hdflw |
2020-07-18T07:54:08.720011Z | -9206690983832919848 | SELECT a.SingerId, a.AlbumId, a.TrackId, a.SongName, s.FirstName, s.LastName FROM Songs as a JOIN Singers as s ON s.SingerId = a.SingerId WHERE STARTS_WITH(s.FirstName, 'FirstName') LIMIT 1000000; | False | ACjbPvYIE2QHkhnmMXuAGpB4inK7yMnQjmYgQ9FoygKNaB5KCXu7Sf7f9aghYw |
2020-07-18T07:54:08.731006Z | 6561582859583559006 | SELECT a.SingerId, a.AlbumId, a.TrackId, a.SongName, s.FirstName, s.LastName FROM Songs as a JOIN Singers as s ON s.SingerId = a.SingerId WHERE a.SingerId > 10 LIMIT 1000000; | False | ACjbPvYNZ06N2YyvwV0YMlSRBNDtXBqZEK-iAAyPFnFcTmshPvzWkhr034ud7w |
가장 오래 실행 중인 상위 2개 쿼리 나열
앞의 쿼리를 약간 변형하여 이 예시에서는 쿼리 시작 시간을 기준으로 정렬된 가장 오래 실행 중인 상위 2개 쿼리 반환합니다.
SELECT start_time,
text_fingerprint,
text,
text_truncated,
session_id
FROM spanner_sys.oldest_active_queries
ORDER BY start_time ASC LIMIT 2;
쿼리 출력
start_time | text_fingerprint | text | text_truncated | session_id |
---|---|---|---|---|
2020-07-18T07:52:28.225877Z | -3426560921851907385 | SELECT a.SingerId, a.AlbumId, a.TrackId, b.SingerId as b_id, b.AlbumId as b_albumid, b.TrackId as b_trackId FROM Songs as a CROSS JOIN Songs as b; | False | ACjbPvYsucrtcffHrRK6aObeIjZf12tSUwOsim-g1WC3IhqF4epzICCQR3GCHw |
2020-07-18T07:54:08.622081Z | -9206690983832919848 | SELECT a.SingerId, a.AlbumId, a.TrackId, a.SongName, s.FirstName, s.LastName FROM Songs as a JOIN Singers as s ON s.SingerId = a.SingerId WHERE STARTS_WITH(s.FirstName, 'FirstName') LIMIT 1000000; | False | ACjbPvaF3yKiNfxXFod2LPoFaXjKR759Bw1o34206vv0t7eOrD3wxZhu8U6ohQ |
ACTIVE_QUERIES_SUMMARY
이름에서 알 수 있듯이 기본 제공 테이블인 SPANNER_SYS.ACTIVE_QUERIES_SUMMARY
는 모든 활성 쿼리의 요약 통계를 표시합니다. 다음 스키마에 표시된 것처럼 1초, 10초, 100초의 세 가지 버킷 또는 카운터로 쿼리가 기간별로 그룹화됩니다.
테이블 스키마
열 이름 | 유형 | 설명 |
---|---|---|
ACTIVE_COUNT |
INT64 |
실행 중인 쿼리 총개수입니다. |
OLDEST_START_TIME |
TIMESTAMP |
가장 오래 실행되는 쿼리의 시작 시간에 대한 상한값입니다. |
COUNT_OLDER_THAN_1S |
INT64 |
1초가 지난 쿼리 수입니다. |
COUNT_OLDER_THAN_10S |
INT64 |
10초가 지난 쿼리 수입니다. |
COUNT_OLDER_THAN_100S |
INT64 |
100초가 지난 쿼리 수입니다. |
쿼리는 2개 이상의 버킷에서 집계될 수 있습니다. 예를 들어 쿼리가 12초 동안 실행된 경우 두 기준을 모두 충족하는 COUNT_OLDER_THAN_1S
및 COUNT_OLDER_THAN_10S
로 집계됩니다.
쿼리 예
클라이언트 라이브러리, gcloud spanner 또는Google Cloud 콘솔을 사용하여 다음을 SQL 문 예시를 실행할 수 있습니다.
활성 쿼리 요약 검색
다음 쿼리는 쿼리 실행에 대한 요약 통계를 반환합니다.
SELECT active_count,
oldest_start_time,
count_older_than_1s,
count_older_than_10s,
count_older_than_100s
FROM spanner_sys.active_queries_summary;
쿼리 출력
active_count | oldest_start_time | count_older_than_1s | count_older_than_10s | count_older_than_100s |
---|---|---|---|---|
22 | 2020-07-18T07:52:28.225877Z | 21 | 21 | 1 |
제한사항
가장 포괄적이고 유용한 정보를 제공하는 것을 목표로 하지만 이러한 테이블에 반환되는 데이터에는 쿼리가 포함되지 않는 경우가 있습니다.
변형 적용 단계에 있는 DML 쿼리(UPDATE/INSERT/DELETE)는 포함되지 않습니다.
일시적인 오류로 인해 다시 시작하는 중에는 쿼리가 포함되지 않습니다.
오버로드되거나 응답하지 않는 서버의 쿼리는 포함되지 않습니다.
읽기-쓰기 트랜잭션에서는
OLDEST_ACTIVE_QUERIES
를 사용할 수 없습니다. 읽기 전용 트랜잭션에서도 트랜잭션 타임스탬프를 무시하며, 항상 실행 시의 현재 데이터를 반환합니다. 드물긴 하지만 부분적인 결과로ABORTED
오류가 반환될 수 있습니다. 이 경우 부분 결과를 삭제하고 쿼리를 다시 시도합니다.
활성 쿼리 데이터를 사용하여 높은 CPU 사용률 문제 해결
쿼리 통계 및 트랜잭션 통계는 Spanner 데이터베이스의 지연 시간 문제를 해결할 때 유용한 정보를 제공합니다. 이러한 도구는 이미 완료된 쿼리에 대한 정보를 제공합니다. 하지만 시스템에서 현재 실행 중인 쿼리를 알아야 하는 경우도 있습니다. 예를 들어 CPU 사용률이 매우 높고 다음과 같은 질문에 대한 답을 확인해야 하는 시나리오를 가정해보세요.
- 현재 실행 중인 쿼리 수는?
- 해당 쿼리는 무엇인가요?
- 100초를 넘는 장시간 실행 쿼리는 몇 개인가요?
- 쿼리를 실행 중인 세션은 무엇인가요?
이러한 질문에 대한 답을 확인하여 다음 조치를 취하도록 결정할 수 있습니다.
- 즉시 해결을 위해 쿼리를 실행하는 세션을 삭제합니다.
- 색인을 추가하여 쿼리 성능을 향상시킵니다.
- 주기적 백그라운드 작업과 관련된 경우 쿼리 빈도를 줄입니다.
- 쿼리 실행이 승인되지 않은 사용자 또는 구성요소를 식별합니다.
이 둘러보기에서는 활성 쿼리를 살펴보고 수행할 작업이 있는지 알아봅니다.
활성 쿼리 요약 검색
이 시나리오 예시에서는 정상 CPU 사용량보다 높은 것이 확인되므로 다음 쿼리를 실행하여 활성 쿼리의 요약을 반환합니다.
SELECT active_count,
oldest_start_time,
count_older_than_1s,
count_older_than_10s,
count_older_than_100s
FROM spanner_sys.active_queries_summary;
이 쿼리는 다음과 같은 결과를 반환합니다.
active_count | oldest_start_time | count_older_than_1s | count_older_than_10s | count_older_than_100s |
---|---|---|---|---|
22 |
2020-07-18T07:52:28.225877Z |
21 |
21 |
1 |
100초 넘게 실행되는 쿼리 하나가 있습니다. 이것은 데이터베이스에서 일반적인 경우가 아니므로 추가 조사가 필요합니다.
활성 쿼리 목록 검색
이전 단계에서 100초 넘게 실행되는 쿼리가 있는 것으로 확인되었습니다. 더 자세히 조사하기 위해 다음 쿼리를 실행하여 가장 오래된 상위 5개 쿼리에 대한 추가 정보를 반환합니다.
SELECT start_time,
text_fingerprint,
text,
text_truncated,
session_id,
query_id
FROM spanner_sys.oldest_active_queries
ORDER BY start_time ASC LIMIT 5;
이 예시에서는 대략적으로 2024년 3월 28일 오후 4시 44분 9초(EDT)에 쿼리를 실행했고 다음 결과가 반환되었습니다. 전체 출력을 보려면 가로로 스크롤해야 할 수 있습니다.
start_time | text_fingerprint | text | text_truncated | session_id | query_id |
---|---|---|---|---|---|
2024-03-28 16:44:09.356939+00:00 | -2833175298673875968 | spanner_sys.oldest_active_queries에서 * 선택 | false | ACjbPvYsucrtcffHrRK6aObeIjZf12tSUwOsim-g1WC3IhqF4epzICCQR3GCHw | 37190103859320827 |
2020-07-18T07:52:28.225877Z | -3426560921851907385 | SELECT a.SingerId, a.AlbumId, a.TrackId, b.SingerId as b_id, b.AlbumId as b_albumid, b.TrackId as b_trackId FROM Songs as a CROSS JOIN Songs as b; | false | ACjbPvaF3yKiNfxXFod2LPoFaXjKR759Bw1o34206vv0t7eOrD3wxZhu8U6ohQ | 48946620525959556 |
가장 오래된 쿼리(디지털 지문 = -2833175298673875968
)가 표에 강조표시됩니다. 이것은 비용이 많이 드는 CROSS JOIN
입니다. 조치를 취하기로 결정합니다.
고비용 쿼리 취소
이 예시에서는 비용이 많이 드는 CROSS JOIN
을 실행하는 쿼리가 발견되어 쿼리를 취소하기로 결정합니다. 이전 단계에서 받은 쿼리 결과에는 query_id
가 포함되었습니다. GoogleSQL의 경우에는 CALL cancel_query(query_id)
명령어를, PostgreSQL의 경우에는 spanner.cancel_query(query_id)
명령어를 실행하여 쿼리를 취소할 수 있습니다.
GoogleSQL
CALL cancel_query(query_id)
PostgreSQL
CALL spanner.cancel_query(query_id)
예를 들어 다음에서 CALL
문은 ID가 37190103859320827
인 쿼리를 취소합니다.
CALL cancel_query(37190103859320827)
쿼리가 취소되었는지 확인하려면 spanner_sys.oldest_active_queries
테이블을 쿼리해야 합니다.
이 둘러보기에서는 SPANNER_SYS.OLDEST_ACTIVE_QUERIES
및 SPANNER_SYS.ACTIVE_QUERIES_SUMMARY
를 사용하여 실행 중인 쿼리를 분석하고 필요한 경우 CPU 사용량이 높은 쿼리에 조치를 취하는 방법을 보여줍니다. 물론 비용이 많이 드는 작업을 피하고 사용 사례에 맞게 스키마를 올바르게 설계하는 것이 항상 더 비용이 적습니다. 효율적으로 실행되는 SQL 문 만들기에 대한 자세한 내용은 SQL 권장사항을 참조하세요.
다음 단계
- 다른 점검 도구 알아보기
- Spanner가 각 데이터베이스에 대해 데이터베이스의 정보 스키마 테이블에 저장하는 다른 정보 알아보기
- Spanner 관련 SQL 권장사항에 대해 자세히 알아보기