일부 데이터 유형의 경우 생성하여 엔드포인트에 배포한 후 AutoML 모델에서 온라인(실시간) 예측을 요청할 수 있습니다. 온라인 예측은 비동기식 요청인 일괄 예측과 달리 동기식 요청입니다.
애플리케이션 입력에 대한 응답으로 요청하거나 적시의 추론이 필요한 다른 상황에서 요청하는 경우에는 온라인 예측을 사용합니다.
온라인 예측을 수행하려면 분석을 위해 하나 이상의 테스트 항목을 모델에 제출하면 모델이 모델의 목표에 따른 결과를 반환합니다. 예측 결과에 대한 자세한 내용은 AutoML 모델의 결과 해석을 참조하세요.
Google Cloud 콘솔을 사용한 온라인 예측
Google Cloud 콘솔을 사용하여 온라인 예측을 요청합니다. 모델을 엔드포인트에 배포해야 합니다.
Google Cloud 콘솔의 Vertex AI 섹션에서 모델 페이지로 이동합니다.
모델 목록에서 예측을 요청할 모델의 이름을 클릭합니다.
배포 및 테스트 탭을 선택합니다.
모델 테스트 섹션에서 테스트 항목을 추가하여 예측을 요청합니다.
온라인 예측의 메서드와 입력은 모델의 목표에 따라 다릅니다. 예를 들어 텍스트 목표에 대한 AutoML 모델을 사용하려면 텍스트 필드에 콘텐츠를 입력하고 예측을 클릭해야 합니다. 이미지 목표에 대한 AutoML 모델을 사용하려면 이미지를 업로드하여 예측을 요청해야 합니다. 테이블 형식 모델의 경우 기준 예측 데이터가 자동으로 입력되거나, 자체 예측 데이터를 입력하고 예측을 클릭할 수 있습니다.
테이블 형식 모델의 로컬 특성 중요도에 대한 자세한 내용은 설명 가져오기를 참조하세요.
예측이 완료되면 Vertex AI가 콘솔에 결과를 반환합니다.
API로 온라인 예측
Vertex AI API를 사용하여 온라인 예측을 요청합니다. 모델을 엔드포인트에 배포해야 합니다.
이미지
이미지 데이터 유형 목표에는 분류와 객체 감지가 포함됩니다.
Edge 모델 예측: 예측에 AutoML 이미지 Edge 모델을 사용하는 경우 예측 요청을 보내기 전에 JPEG가 아닌 예측 파일을 JPEG 파일로 변환해야 합니다. 샘플 Python 사전 처리 함수는 Google Cloud AutoML API 저장소용 Python 클라이언트를 참조하세요.
분류
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [{ "content": "CONTENT" }], "parameters": { "confidenceThreshold": THRESHOLD_VALUE, "maxPredictions": MAX_PREDICTIONS } }
다음을 바꿉니다.
- CONTENT: base64 인코딩 이미지 콘텐츠입니다.
- THRESHOLD_VALUE(선택사항): 모델은 신뢰도가 이 값 이상인 예측만 반환합니다.
- MAX_PREDICTIONS(선택사항): 모델은 신뢰도 점수가 높은 순으로 최대 이 수의 예측을 반환합니다.
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 엔드포인트가 있는 리전. 예를 들면
us-central1
입니다. - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- CONTENT: base64 인코딩 이미지 콘텐츠입니다.
- THRESHOLD_VALUE(선택사항): 모델은 신뢰도가 이 값 이상인 예측만 반환합니다.
- MAX_PREDICTIONS(선택사항): 모델은 신뢰도 점수가 높은 순으로 최대 이 수의 예측을 반환합니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [{ "content": "CONTENT" }], "parameters": { "confidenceThreshold": THRESHOLD_VALUE, "maxPredictions": MAX_PREDICTIONS } }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": [ { "confidences": [ 0.92629629373550415 ], "ids": [ "354376995678715904" ], "displayNames": [ "sunflower" ] } ], "deployedModelId": "2119225099654529024" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
객체 감지
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [{ "content": "CONTENT" }], "parameters": { "confidenceThreshold": THRESHOLD_VALUE, "maxPredictions": MAX_PREDICTIONS } }
다음을 바꿉니다.
- CONTENT: base64 인코딩 이미지 콘텐츠입니다.
- THRESHOLD_VALUE(선택사항): 모델은 신뢰도가 이 값 이상인 예측만 반환합니다.
- MAX_PREDICTIONS(선택사항): 모델은 신뢰도 점수가 높은 순으로 최대 이 수의 예측을 반환합니다.
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 엔드포인트가 있는 리전. 예를 들면
us-central1
입니다. - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- CONTENT: base64 인코딩 이미지 콘텐츠입니다.
- THRESHOLD_VALUE(선택사항): 모델은 신뢰도가 이 값 이상인 예측만 반환합니다.
- MAX_PREDICTIONS(선택사항): 모델은 신뢰도 점수가 높은 순으로 최대 이 수의 예측을 반환합니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [{ "content": "CONTENT" }], "parameters": { "confidenceThreshold": THRESHOLD_VALUE, "maxPredictions": MAX_PREDICTIONS } }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": [ { "confidences": [ 0.975873291, 0.972160876, 0.879488528, 0.866532683, 0.686478078 ], "displayNames": [ "Salad", "Salad", "Tomato", "Tomato", "Salad" ], "ids": [ "7517774415476555776", "7517774415476555776", "2906088397049167872", "2906088397049167872", "7517774415476555776" ], "bboxes": [ [ 0.0869686604, 0.977020741, 0.395135701, 1 ], [ 0, 0.488701463, 0.00157663226, 0.512249 ], [ 0.361617863, 0.509664357, 0.772928834, 0.914706349 ], [ 0.310678929, 0.45781514, 0.565507233, 0.711237729 ], [ 0.584359646, 1, 0.00116168708, 0.130817384 ] ] } ], "deployedModelId": "3860570043075002368" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
테이블 형식
테이블 형식 목표로는 분류와 회귀가 있습니다.
분류
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [ { PREDICTION_DATA_ROW } ] }
다음을 바꿉니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 문자열 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"length":3.6, "material":"cotton", "tag_array": ["abc","def"]
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
endpoints.predict 메서드를 사용하여 온라인 예측을 요청합니다.
다음 예시는 로컬 특성 기여 분석이 없는 테이블 형식 분류 모델에 대한 온라인 예측 요청을 보여줍니다. 로컬 특성 기여 분석을 반환하려면 설명 가져오기를 참조하세요.
요청 데이터를 사용하기 전에 다음을 바꿉니다.
-
LOCATION: 엔드포인트가 있는 리전.
us-central1
). - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 문자열 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"length":3.6, "material":"cotton", "tag_array": ["abc","def"]
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
DEPLOYED_MODEL_ID:
predict
메서드에 의해 출력되고explain
메서드에 의해 입력으로 수락되는 값. 예측을 생성하는 데 사용되는 모델의 ID입니다. 이전에 요청한 예측에 대한 설명을 요청해야 하고 2개 이상의 모델을 배포했다면 이 ID를 사용하여 이전 예측을 제공한 동일한 모델에 대한 설명을 반환할 수 있습니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [ { PREDICTION_DATA_ROW } ] }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": [ { "scores": [ 0.96771615743637085, 0.032283786684274673 ], "classes": [ "0", "1" ] } ] "deployedModelId": "2429510197" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
예측
예측 모델에서는 온라인 예측을 지원하지 않습니다. 대신 일괄 예측을 사용합니다.회귀
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [ { PREDICTION_DATA_ROW } ] }
다음을 바꿉니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 숫자 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"age":3.6, "sq_ft":5392, "code": "90331"
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
endpoints.predict 메서드를 사용하여 온라인 예측을 요청합니다.
다음 예시는 로컬 특성 기여 분석이 없는 테이블 형식 회귀 모델에 대한 온라인 예측 요청을 보여줍니다. 로컬 특성 기여 분석을 반환하려면 설명 가져오기를 참조하세요.
요청 데이터를 사용하기 전에 다음을 바꿉니다.
-
LOCATION: 엔드포인트가 있는 리전.
us-central1
). - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 숫자 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"age":3.6, "sq_ft":5392, "code": "90331"
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
DEPLOYED_MODEL_ID:
predict
메서드에 의해 출력되고explain
메서드에 의해 입력으로 수락되는 값. 예측을 생성하는 데 사용되는 모델의 ID입니다. 이전에 요청한 예측에 대한 설명을 요청해야 하고 2개 이상의 모델을 배포했다면 이 ID를 사용하여 이전 예측을 제공한 동일한 모델에 대한 설명을 반환할 수 있습니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [ { PREDICTION_DATA_ROW } ] }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": [ [ { "value": 65.14233, "lower_bound": 4.6572 "upper_bound": 164.0279 } ] ], "deployedModelId": "DEPLOYED_MODEL_ID" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
텍스트
텍스트 데이터 유형 목표에는 분류, 항목 추출, 감정 분석이 포함됩니다.
분류
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
다음을 바꿉니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 엔드포인트가 있는 리전. 예를 들면
us-central1
입니다. - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
- DEPLOYED_MODEL_ID: 예측을 위해 사용된 배포된 모델의 ID입니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": [ { "ids": [ "1234567890123456789", "2234567890123456789", "3234567890123456789" ], "displayNames": [ "GreatService", "Suggestion", "InfoRequest" ], "confidences": [ 0.8986392080783844, 0.81984345316886902, 0.7722353458404541 ] } ], "deployedModelId": "0123456789012345678" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
항목 추출
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
다음을 바꿉니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 엔드포인트가 있는 리전. 예를 들면
us-central1
입니다. - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
- DEPLOYED_MODEL_ID: 예측을 위해 사용된 배포된 모델의 ID입니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "predictions": { "ids": [ "1234567890123456789", "2234567890123456789", "3234567890123456789" ], "displayNames": [ "SpecificDisease", "DiseaseClass", "SpecificDisease" ], "textSegmentStartOffsets": [13, 40, 57], "textSegmentEndOffsets": [29, 51, 75], "confidences": [ 0.99959725141525269, 0.99912621492484128, 0.99935531616210938 ] }, "deployedModelId": "0123456789012345678" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
감정 분석
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
다음을 바꿉니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
다음 명령어를 실행합니다.
gcloud ai endpoints predict ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
REST 및 명령줄
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 엔드포인트가 있는 리전. 예를 들면
us-central1
입니다. - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- CONTENT: 예측을 수행할 텍스트 스니펫입니다.
- DEPLOYED_MODEL_ID: 예측을 위해 사용된 배포된 모델의 ID입니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict
JSON 요청 본문:
{ "instances": [{ "mimeType": "text/plain", "content": "CONTENT" }] }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:predict" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "prediction": { sentiment": 8 }, "deployedModelId": "1234567890123456789" }
Java
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Java API 참조 문서를 참조하세요.
Node.js
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Node.js API 참조 문서를 참조하세요.
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
테이블 형식 모델에서 설명 가져오기
AutoML 테이블 형식 모델의 경우, 설명(특성 기여 분석이라고도 함)을 사용하여 온라인 예측을 요청하면 모델이 예측에 어떻게 도착했는지 확인할 수 있습니다. 로컬 특성 중요도 값은 각 특성이 이 예측의 예측 결과에 기여한 정도를 나타냅니다.
로컬 특성 중요도 결과 해석에 대해 자세히 알아보세요.
특성 기여 분석은 Vertex Explainable AI를 통한 Vertex AI 예측에 포함되어 있습니다. Explainable AI에 대해 자세히 알아보세요.
Console
Google Cloud 콘솔을 사용하여 온라인 예측을 요청하면 로컬 특성 중요도 값이 자동으로 반환됩니다.
미리 채워진 예측 값을 사용한 경우 로컬 특성 중요도 값은 모두 0입니다. 미리 채워진 값은 기준 예측 데이터이므로 반환되는 예측이 기준 예측 값입니다.
gcloud
다음 콘텐츠로
request.json
라는 파일을 만듭니다.{ "instances": [ { PREDICTION_DATA_ROW } ] }
다음을 바꿉니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 문자열 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"length":3.6, "material":"cotton", "tag_array": ["abc","def"]
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
다음 명령어를 실행합니다.
gcloud ai endpoints explain ENDPOINT_ID \ --region=LOCATION \ --json-request=request.json
다음을 바꿉니다.
- ENDPOINT_ID: 엔드포인트의 ID입니다.
- LOCATION: Vertex AI를 사용하는 리전
원하는 경우
Endpoint
의 특정DeployedModel
에 설명 요청을 보내려면--deployed-model-id
플래그를 지정할 수 있습니다.gcloud ai endpoints explain ENDPOINT_ID \ --region=LOCATION \ --deployed-model-id=DEPLOYED_MODEL_ID \ --json-request=request.json
앞에서 설명한 자리표시자 외에도 다음을 바꿉니다.
-
DEPLOYED_MODEL_ID(선택사항): 설명을 가져올 배포된 모델의 ID입니다. ID는
predict
메서드의 응답에 포함됩니다. 특정 모델에 대한 설명을 요청해야 하며 동일 엔드포인트에 배포된 모델이 2개 이상 있는 경우, 이 ID를 사용하여 특정 모델에 대한 설명이 반환되도록 할 수 있습니다.
REST 및 명령줄
다음 예시는 로컬 특성 기여 분석이 있는 테이블 형식 분류 모델에 대한 온라인 예측 요청을 보여줍니다. 요청 형식은 회귀 모델의 경우에도 동일합니다.
요청 데이터를 사용하기 전에 다음을 바꿉니다.
-
LOCATION: 엔드포인트가 있는 리전.
us-central1
). - PROJECT: 프로젝트 ID
- ENDPOINT_ID: 엔드포인트의 ID입니다.
-
PREDICTION_DATA_ROW: JSON 객체를 해당 특성 값으로서의 특성 이름 및 값으로 바꿉니다. 예를 들어 숫자, 문자열 배열, 카테고리의 세 가지 특성이 있는 데이터 세트의 경우 데이터 행은 다음 예시 요청과 유사합니다.
"length":3.6, "material":"cotton", "tag_array": ["abc","def"]
학습에 포함된 모든 기능에 값을 제공해야 합니다. 예측에 사용되는 데이터의 형식은 학습에 사용되는 형식과 일치해야 합니다. 자세한 내용은 예측용 데이터 형식을 참조하세요.
-
DEPLOYED_MODEL_ID(선택사항): 설명을 가져올 배포된 모델의 ID입니다. ID는
predict
메서드의 응답에 포함됩니다. 특정 모델에 대한 설명을 요청해야 하며 동일 엔드포인트에 배포된 모델이 2개 이상 있는 경우, 이 ID를 사용하여 특정 모델에 대한 설명이 반환되도록 할 수 있습니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:explain
JSON 요청 본문:
{ "instances": [ { PREDICTION_DATA_ROW } ], "deployedModelId": "DEPLOYED_MODEL_ID" }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:explain"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth application-default print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/endpoints/ENDPOINT_ID:explain" | Select-Object -Expand Content
Python
Vertex AI용 클라이언트 라이브러리를 설치하고 사용하는 방법은 Vertex AI 클라이언트 라이브러리를 참조하세요. 자세한 내용은 Vertex AI Python API 참조 문서를 참조하세요.
결과 해석에 대한 샘플 응답 및 정보는 AutoML 모델의 예측 결과 해석을 참조하세요.
이전에 반환된 예측에 대한 설명 가져오기
설명은 리소스 사용량을 증가시키므로, 필요한 경우 상황에 대한 설명 요청을 예약하는 것이 좋습니다. 간혹 예측이 이상점이거나 합리적이기 않은 경우 이미 수신된 예측 결과에 대한 설명을 요청하는 것이 유용할 수 있습니다.
모든 예측이 동일한 모델에서 오는 경우 이번에는 요청된 설명과 함께 요청 데이터를 다시 전송하면 됩니다. 그러나 예측을 반환하는 모델이 여러 개 있는 경우에는 올바른 모델로 설명 요청을 보내야 합니다. 원래 예측 요청의 응답에 포함되기도 한, 요청의 배포된 모델 ID를 포함하여 특정 모델에 대한 설명을 확인할 수 있습니다. 배포된 모델 ID는 모델 ID와 다릅니다.