Vertex AI 예측 수행 개요

예측은 학습된 머신러닝 모델 출력입니다. 이 페이지에서는 Vertex AI의 모델에서 예측을 수행할 수 있는 워크플로를 간략하게 설명합니다.

Vertex AI에서는 두 가지 예측 수행 방법을 제공합니다.

온라인 예측은 endpoint에 배포된 모델로 전송된 동기식 요청입니다. 따라서 요청을 전송하기 전에 Model 리소스를 엔드포인트에 배포해야 합니다. 이렇게 하면 컴퓨팅 리소스가 모델과 연결되므로 지연 시간이 짧은 온라인 예측을 제공할 수 있습니다. 애플리케이션 입력에 대한 응답으로 요청하거나 적시의 추론이 필요한 상황에서 요청하는 경우에 온라인 예측을 사용하세요.
일괄 예측은 엔드포인트에 배포되지 않은 모델에 전송된 비동기식 요청입니다. BatchPredictionsJob 리소스로 요청을 Model 리소스에 직접 보냅니다. 즉각적인 응답이 필요하지 않고 단일 요청을 사용하여 누적된 데이터를 처리하고 싶은 경우에 일괄 예측을 사용하세요.

커스텀 학습 모델에서 예측 수행

예측을 수행하려면 먼저 모델을 가져와야 합니다. 가져오면 Vertex AI Model Registry에 Model 리소스가 표시됩니다.

그런 다음 예측 수행 방법을 알아보려면 다음 문서를 참조하세요.

커스텀 학습 모델과 달리 학습 후에 자동으로 AutoML 모델을 Vertex AI Model Registry로 가져옵니다.

그 외에 AutoML 모델의 워크플로는 비슷하지만 데이터 유형 및 모델 목표에 따라 약간 달라집니다. AutoML 예측 수행에 대한 문서는 다른 AutoML 문서와 함께 제공됩니다. 다음은 문서 링크입니다.

다음 유형의 이미지 AutoML 모델에서 예측을 가져오는 방법을 알아봅니다.

다음 유형의 테이블 형식 AutoML 모델에서 예측을 수행하는 방법을 알아봅니다.

다음 유형의 텍스트 AutoML 모델에서 예측을 가져오는 방법을 알아봅니다.

다음 유형의 테이블 형식 AutoML 모델에서 예측을 가져오는 방법을 알아봅니다.