애플리케이션 배포

Reasoning Engine API에는 다음과 같은 제한사항이 있습니다.

  • Reasoning Engine API는 Python 코드 배포만 지원합니다.
  • Reasoning Engine API는 us-central1 리전에서만 지원됩니다.

시작하기 전에

이 튜토리얼을 실행하기 전에 다음을 따르세요.

  1. 환경 설정
  2. 애플리케이션 개발

ReasoningEngine 인스턴스 만들기

Vertex AI에 애플리케이션을 배포하려면 ReasoningEngine.create를 사용하고 객체를 매개변수로 전달합니다. 애플리케이션에 패키지 종속 항목을 도입하려면 다음 매개변수를 사용하세요.

  • requirements: 외부 PyPI 패키지 종속 항목 목록입니다. 각 줄은 단일 문자열이어야 합니다. 자세한 내용은 요구사항 파일 형식을 참조하세요.
  • extra_packages: 내부 패키지 종속 항목 목록입니다. 이러한 패키지 종속 항목은 애플리케이션에 필요한 로컬 Python 패키지에 해당하는 로컬 파일 또는 디렉터리입니다.

다음 코드는 애플리케이션을 배포하는 방법을 보여줍니다.

remote_app = reasoning_engines.ReasoningEngine.create(
    reasoning_engines.LangchainAgent(
        model=model,
        tools=[get_exchange_rate],
        model_kwargs=model_kwargs,
    ),
    requirements=[
        "google-cloud-aiplatform[reasoningengine,langchain]",
    ],
    display_name="DISPLAY_NAME",  # Optional.
)
remote_app

애플리케이션 배포는 실행하는 데 몇 분 정도 걸립니다. 컨테이너를 빌드하고 백엔드에서 HTTP 서버를 사용 중지합니다. 배포 지연 시간은 필요한 패키지를 설치하는 데 걸리는 총 시간에 따라 달라집니다.

배포된 후 remote_app은 Vertex AI에서 실행되는 reasoning_engines.LangchainAgent 인스턴스에 해당하며 이를 쿼리 또는 삭제할 수 있습니다. 이는 reasoning_engines.LangchainAgent로컬 인스턴스와 별개입니다.

배포된 각 애플리케이션에는 고유한 식별자가 포함됩니다. 다음 명령어를 실행하여 애플리케이션에 대해 resource_name 식별자를 가져옵니다.

remote_app.resource_name

resource_name의 형식은 "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"입니다.

권장사항

  1. 패키지 버전 고정(재현 가능한 빌드의 경우) 추적해야 하는 일반적인 패키지는 google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai, pydantic입니다.
  2. 애플리케이션의 종속 항목 수를 최소화합니다. 이렇게 하면 종속 항목을 업데이트할 때 브레이킹 체인지 수가 줄어들고 시간이 지남에 따라 최신 기능 적용을 위해 애플리케이션을 더 쉽게 업데이트할 수 있습니다.

다음 단계