문자 인식 프로젝트 설정

이 페이지는 개발자가 광학 문자 인식 (OCR) 서비스를 사용하기 위해 Google Distributed Cloud (GDC) 에어 갭 프로젝트를 설정하는 데 도움이 됩니다. 이 프로세스에는 프로젝트 만들기, OCR API 사용 설정, 클라이언트 라이브러리 설치, 환경 변수 정의, 사용자 인증 정보 인증이 포함됩니다. Vertex AI를 처음 사용하는 경우 문자 인식 기능에 대해 자세히 알아보세요.

다음과 같이 GDC 콘솔과 gdcloud CLI를 사용하여 문자 인식 프로젝트를 설정합니다.

  • GDC 콘솔: OCR API를 사용 설정하고 서비스 상태와 엔드포인트를 확인합니다.
  • gdcloud CLI: OCR API와 상호작용하도록 서비스 계정을 구성하고, 클라이언트 라이브러리를 설치하고, API 요청을 인증합니다.

프로젝트 만들기

분산 클라우드 리소스 계층 구조 내에서 문자 인식 프로젝트를 만들면 공동작업자, 사용 설정된 API, 모니터링 도구, 결제 정보, 인증 사용자 인증 정보, 액세스 제어를 포함한 OCR 리소스가 정리됩니다.

프로젝트를 만들려면 Vertex AI용 프로젝트 설정을 참고하세요. API를 호출할 때는 프로젝트 ID가 필요합니다.

개발자 권한 요청

광학 문자 인식 기능에 액세스하고 요청 인증 및 승인을 위한 API 토큰을 생성하려면 프로젝트에 AI OCR 개발자 역할이 있어야 합니다.

프로젝트 IAM 관리자에게 프로젝트 네임스페이스 내의 사용자 또는 서비스 계정에 AI OCR 개발자(ai-ocr-developer) 역할을 부여해 달라고 요청하세요. 이 역할에 대한 자세한 내용은 IAM 권한 준비를 참고하세요.

OCR API 사용 설정

프로젝트에 OCR 사전 학습 API를 사용 설정해야 합니다. 사용 설정하면 OCR 사전 학습 API의 서비스 상태와 엔드포인트를 볼 수 있습니다.

클라이언트 라이브러리 설치

Python 프로그래밍 언어용 클라이언트 라이브러리가 제공됩니다. 이러한 클라이언트 라이브러리를 사용하면 API에 더 쉽게 액세스할 수 있으므로 OCR API를 호출하는 것이 좋습니다.

OCR 클라이언트 라이브러리를 설치하고 다음 단계를 따라 올바른 버전을 사용하고 있는지 확인합니다.

  1. OCR 클라이언트 라이브러리가 설치되어 있는지 확인하고 버전 번호를 가져옵니다.

    pip freeze | grep vision
    

    클라이언트 라이브러리가 이미 설치되어 있으면 다음 예와 비슷한 출력이 표시됩니다.

    google-cloud-vision==3.0.0
    

    가져온 버전 번호는 다음 엔드포인트의 클라이언트 라이브러리와 일치해야 합니다.

    https://GDC_URL/.well-known/static/client-libraries
    

    GDC_URL를 GDC의 조직 URL로 바꿉니다.

  2. 버전 번호가 일치하지 않으면 클라이언트 라이브러리를 제거합니다.

    pip uninstall google-cloud-vision
    
  3. OCR 클라이언트 라이브러리를 제거한 경우 운영체제에 해당하는 파일 이름을 지정하여 다시 설치해야 합니다.

환경 변수 설정

OCR 클라이언트 라이브러리를 설치한 후 Python 스크립트에서 API와 상호작용할 수 있습니다.

프로젝트에서 서비스 계정을 설정하여 승인된 API 호출을 프로그래매틱 방식으로 실행하는 경우 Python 스크립트에서 환경 변수를 정의하여 실행 시 서비스 계정 키와 같은 값에 액세스할 수 있습니다.

다음 단계에 따라 Python 스크립트에서 필수 환경 변수를 설정하세요.

  1. OCR 사전 학습 API와 상호작용할 JupyterLab 노트북을 만듭니다.

  2. JupyterLab 노트북에서 Python 스크립트를 만듭니다.

  3. Python 스크립트에 다음 코드를 추가합니다.

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    APPLICATION_DEFAULT_CREDENTIALS_FILENAME를 프로젝트에서 생성한 서비스 계정 키가 포함된 JSON 파일의 이름(예: my-service-key.json)으로 바꿉니다.

  4. Python 스크립트를 vision.py와 같은 이름으로 저장합니다.

  5. Python 스크립트를 실행하여 환경 변수를 설정합니다.

    python SCRIPT_NAME
    

    SCRIPT_NAME을 Python 스크립트에 지정한 이름(예: vision.py)으로 바꿉니다.

인증 설정

OCR API를 사용하려면 먼저 클라이언트 사용자 인증 정보를 인증하고 프로젝트 리소스에 대한 계정 액세스를 요청해야 합니다. 자세한 내용은 API 요청 인증을 참고하세요.