Cloud TPU 오류 용어집

이 문서에서는 Cloud TPU 서비스의 솔루션과 관련된 일반적인 오류 용어집을 제공합니다.


잘못된 가속기 유형

오류 메시지

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

솔루션

create 명령어에 잘못된 매개변수가 제공되었습니다. 영역에서 가속기의 가용성은 유형, preemptible 플래그, spot 플래그, reserved 플래그와 같은 파라미터에 따라 달라집니다. preemptible, spot, reserved 플래그를 create 명령어에 포함하거나 제외하여 변경할 수 있습니다.

reserved 플래그로 생성된 TPU는 예약된 용량을 사용합니다. spot 또는 preemptible 플래그를 포함하면 우선순위가 더 높은 TPU가 해당 TPU를 선점할 수 있습니다. 이러한 플래그가 하나도 제공되지 않으면 TPU는 주문형이 됩니다. 이러한 플래그를 두 개 이상 사용 설정하는 구성은 유효하지 않습니다. 자세한 내용은 create 명령어 문서를 참고하세요.

각 영역에서 사용할 수 있는 가속기 유형을 확인하려면 TPU 리전 및 영역 문서를 참조하거나 accelerator-types list 명령어를 사용하여 쿼리하세요. 이러한 가속기 유형 중 하나를 사용하도록 create 명령어를 변경한 후 다시 시도해 보세요. 문제가 지속되면 지원팀에 문의하세요.

네트워크를 찾을 수 없습니다.

오류 메시지

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

해결책

네트워크 xxxx를 찾을 수 없습니다. 네트워크가 올바르게 생성되고 설정되었는지 확인합니다. 자세한 내용은 VPC 네트워크 만들기 및 관리를 참고하세요.

서비스 계정 권한 거부됨

오류 메시지

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

해결책

이 오류는 사용자가 IAM 승인 없이 프로젝트에서 노드를 만들거나 나열하려고 시도할 때 발생합니다. 이 문제의 가능한 원인은 Cloud TPU API 서비스 계정에 프로젝트의 필수 역할이 없기 때문입니다. 액세스 계정 관리 문서에서 액세스를 관리하는 방법을 간략히 알아보세요. 단일 역할 부여 또는 취소 단계를 따르고 계정 'service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com'에 'Cloud TPU API 서비스 에이전트' 역할을 부여합니다. 이때 PROJECT_NUMBER를 Google Cloud 콘솔의 프로젝트 설정에서 찾을 수 있는 프로젝트 번호로 바꿔야 합니다. 서비스 에이전트에 관한 자세한 내용은 서비스 에이전트 문서를 참조하세요.

할당량 초과

오류 메시지

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

해결책

프로젝트가 할당량 한도에 도달했습니다. 할당량 작업에 관해 자세히 알아보려면 Cloud 할당량 문서를 참고하세요. TPU Pod의 사용을 관리하는 TPU 할당량과 혼동해서는 안 됩니다.

할당량 상향 요청에 나열된 단계에 따라 적절한 한도 상향을 요청할 수 있습니다. 할당량 페이지에서 이 메시지의 'YYYY' 부분에 지정된 할당량을 검색할 수 있습니다. 일부 할당량은 여러 리전 또는 서비스에 분할됩니다. 오류 메시지에 어떤 값을 늘려야 하는지 표시됩니다.

메시지의 'XXXX' 및 'YYYY' 부분은 다음 중 하나일 수 있습니다.

  • HEALTH_CHECKS - '상태 점검' 할당량
  • FIREWALLS - '방화벽 규칙' 할당량
  • NETWORK_ENDPOINT_GROUPS - 이 리전의 '네트워크 엔드포인트 그룹' 할당량
  • READ_REQUESTS - Compute Engine API 서비스의 '분당 읽기 요청' 할당량
  • OPERATION_READ_REQUESTS - '분당 작업 읽기 요청' 할당량

이 요청은 일반적으로 영업일 기준 2~3일 이내에 처리됩니다. 요청이 긴급한 경우 고객 엔지니어 또는 기술계정 관리자에게 문의하세요.