Vertex AI에 애플리케이션을 배포하려면 ReasoningEngine
의 새 인스턴스를 만들고 애플리케이션 클래스에 매개변수로 전달합니다. 애플리케이션에 대해 패키지 종속 항목을 도입하려면 다음 매개변수를 사용합니다.
requirements
: 외부 PyPI 패키지 종속 항목 목록입니다. 각 줄은 단일 문자열이어야 합니다. 자세한 내용은 요구사항 파일 형식을 참조하세요.extra_packages
: 내부 패키지 종속 항목 목록입니다. 이러한 패키지 종속 항목은 애플리케이션에 필요한 로컬 Python 패키지에 해당하는 로컬 파일 또는 디렉터리입니다.
다음 코드는 애플리케이션을 배포하는 방법을 보여줍니다.
DISPLAY_NAME = "Demo Langchain Application"
remote_app = reasoning_engines.ReasoningEngine.create(
reasoning_engines.LangchainAgent(
model=model,
tools=[get_exchange_rate],
model_kwargs=model_kwargs,
),
requirements=[
"google-cloud-aiplatform[reasoningengine,langchain]",
],
display_name=DISPLAY_NAME,
)
remote_app
Reasoning Engine에 애플리케이션을 배포할 때는 기존 객체를 다시 사용하는 대신 새 객체를 전달합니다. 이렇게 하면 .set_up
메서드의 데이터베이스 연결 및 서비스와 같이 초기화 중에 선택할 수 없는 데이터가 포함된 객체가 생성되는 것을 방지할 수 있습니다.
애플리케이션 배포는 실행하는 데 몇 분 정도 걸립니다. 컨테이너를 빌드하고 백엔드에서 HTTP 서버를 사용 중지합니다. 배포 지연 시간은 필요한 패키지를 설치하는 데 걸리는 총 시간에 따라 달라집니다.
배포된 후 remote_app
은 Vertex AI에서 실행되는 CLASS_NAME
인스턴스에 해당하며 이를 쿼리 또는 삭제할 수 있습니다. 이는 CLASS_NAME
의 로컬 인스턴스와 별개입니다.
배포된 각 애플리케이션에는 고유한 식별자가 포함됩니다. 다음 명령어를 실행하여 애플리케이션에 대해 resource_name
식별자를 가져옵니다.
remote_app.resource_name
resource_name
의 형식은 "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"입니다.