Reasoning Engine API에는 다음과 같은 제한사항이 있습니다.
- Reasoning Engine API는 Python 코드 배포만 지원합니다.
- Reasoning Engine API는
us-central1
리전에서만 지원됩니다.
시작하기 전에
이 튜토리얼을 실행하기 전에 다음을 따르세요.
ReasoningEngine
인스턴스 만들기
Vertex AI에 애플리케이션을 배포하려면 ReasoningEngine.create
를 사용하고 객체를 매개변수로 전달합니다. 애플리케이션에 패키지 종속 항목을 도입하려면 다음 매개변수를 사용하세요.
requirements
: 외부 PyPI 패키지 종속 항목 목록입니다. 각 줄은 단일 문자열이어야 합니다. 자세한 내용은 요구사항 파일 형식을 참조하세요.extra_packages
: 내부 패키지 종속 항목 목록입니다. 이러한 패키지 종속 항목은 애플리케이션에 필요한 로컬 Python 패키지에 해당하는 로컬 파일 또는 디렉터리입니다.
다음 코드는 애플리케이션을 배포하는 방법을 보여줍니다.
remote_app = reasoning_engines.ReasoningEngine.create(
reasoning_engines.LangchainAgent(
model=model,
tools=[get_exchange_rate],
model_kwargs=model_kwargs,
),
requirements=[
"google-cloud-aiplatform[reasoningengine,langchain]",
],
display_name="DISPLAY_NAME", # Optional.
)
remote_app
애플리케이션 배포는 실행하는 데 몇 분 정도 걸립니다. 컨테이너를 빌드하고 백엔드에서 HTTP 서버를 사용 중지합니다. 배포 지연 시간은 필요한 패키지를 설치하는 데 걸리는 총 시간에 따라 달라집니다.
배포된 후 remote_app
은 Vertex AI에서 실행되는 reasoning_engines.LangchainAgent
인스턴스에 해당하며 이를 쿼리 또는 삭제할 수 있습니다. 이는 reasoning_engines.LangchainAgent
의 로컬 인스턴스와 별개입니다.
배포된 각 애플리케이션에는 고유한 식별자가 포함됩니다. 다음 명령어를 실행하여 애플리케이션에 대해 resource_name
식별자를 가져옵니다.
remote_app.resource_name
resource_name
의 형식은 "projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"입니다.
권장사항
- 패키지 버전 고정(재현 가능한 빌드의 경우) 추적해야 하는 일반적인 패키지는
google-cloud-aiplatform
,cloudpickle
,langchain
,langchain-core
,langchain-google-vertexai
,pydantic
입니다. - 애플리케이션의 종속 항목 수를 최소화합니다. 이렇게 하면 종속 항목을 업데이트할 때 브레이킹 체인지 수가 줄어들고 시간이 지남에 따라 최신 기능 적용을 위해 애플리케이션을 더 쉽게 업데이트할 수 있습니다.