이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Vertex AI의 추론 가져오기 개요

추론은 학습된 머신러닝 모델의 출력입니다. 이 페이지에서는 Vertex AI의 모델에서 추론을 수행할 수 있는 워크플로를 간략하게 설명합니다.

Vertex AI에서는 두 가지 추론 수행 방법을 제공합니다.

온라인 추론은 Endpoint에 배포된 모델로 전송된 동기식 요청입니다. 따라서 요청을 전송하기 전에 Model 리소스를 엔드포인트에 배포해야 합니다. 이렇게 하면 컴퓨팅 리소스가 모델과 연결되므로 모델이 짧은 지연 시간으로 온라인 추론을 제공할 수 있습니다. 애플리케이션 입력에 대한 응답으로 요청하거나 적시의 추론이 필요한 상황에서 요청하는 경우에 온라인 추론을 사용하세요.
일괄 추론은 엔드포인트에 배포되지 않은 모델에 전송된 비동기식 요청입니다. BatchPredictionJob 리소스로 요청을 Model 리소스에 직접 보냅니다. 즉각적인 응답이 필요하지 않고 단일 요청을 사용하여 누적된 데이터를 처리하고 싶은 경우에 일괄 추론을 사용하세요.

커스텀 학습 모델에서 추론 가져오기

추론을 수행하려면 먼저 모델을 가져와야 합니다. 가져오면 Vertex AI Model Registry에 Model 리소스가 표시됩니다.

그런 다음, 추론 수행 방법을 알아보려면 다음 문서를 참조하세요.

커스텀 학습 모델과 달리 학습 후에 자동으로 AutoML 모델을 Vertex AI Model Registry로 가져옵니다.

그 외에 AutoML 모델의 워크플로는 비슷하지만 데이터 유형 및 모델 목표에 따라 약간 달라집니다. AutoML 추론 수행에 대한 문서는 다른 AutoML 문서와 함께 제공됩니다. 다음은 문서 링크입니다.

다음 유형의 이미지 AutoML 모델에서 추론을 가져오는 방법을 알아봅니다.

다음 유형의 테이블 형식 AutoML 모델에서 추론을 수행하는 방법을 알아봅니다.

BigQuery ML 모델에서 추론을 가져오는 방법에는 두 가지가 있습니다.