AlloyDB 데이터베이스에서 온라인 예측 호출

문서 버전을 선택합니다.

이 페이지에서는 PostgreSQL용 AlloyDB 데이터베이스에서 온라인 예측을 호출하는 방법을 설명합니다.

AlloyDB를 사용하면 SQL 코드에서 ml_predict_row() 함수를 호출하여 온라인 예측을 수행할 수 있습니다. AlloyDB에서 머신러닝(ML) 모델을 사용하는 방법에 관한 자세한 내용은 생성형 AI 애플리케이션 빌드를 참고하세요.

시작하기 전에

AlloyDB 데이터베이스에서 온라인 예측을 호출할 수 있으려면 먼저 데이터베이스를 준비하고 적합한 ML 모델을 선택해야 합니다.

데이터베이스 준비

  1. 데이터베이스와 Vertex AI 간의 통합을 설정합니다.

  2. 데이터베이스 사용자에게 ml_predict_row() 함수를 실행하여 예측을 실행할 수 있는 권한을 부여합니다.

    1. 인스턴스에 psql 클라이언트 연결에 설명된 대로 psql 클라이언트를 클러스터의 기본 인스턴스에 연결합니다.

    2. psql 명령 프롬프트에서 데이터베이스에 연결하고 권한을 부여합니다.

      \c DB_NAME
      
      GRANT EXECUTE ON FUNCTION ml_predict_row TO USER_NAME;
      

      다음을 바꿉니다.

      • DB_NAME: 권한을 부여해야 하는 데이터베이스의 이름입니다.

      • USER_NAME: 권한을 부여해야 하는 사용자의 이름입니다.

ML 모델 선택

ml_predict_row() 함수를 호출할 때 ML 모델의 위치를 지정해야 합니다. 지정하는 모델은 다음 중 하나일 수 있습니다.

  • Vertex AI Model Garden에서 실행 중인 모델

    ml_predict_row() 함수는 테이블 형식 또는 커스텀 모델에서만 예측 호출을 지원합니다.

  • Identity and Access Management(IAM) 권한으로 액세스할 수 있고 활성 엔드포인트가 포함된 Vertex AI 모델

    AlloyDB는 온라인 예측을 위해 비공개 엔드포인트를 지원하지 않습니다.

온라인 예측 호출

ml_predict_row() SQL 함수를 사용하여 데이터에 대해 온라인 예측을 호출합니다.

이 함수의 초기 인수 형식은 사용하려는 ML 모델이 Vertex AI Model Garden에 있는지 또는 Google Cloud 프로젝트에서 실행되는 엔드포인트인지에 따라 달라집니다.

Vertex AI Model Garden에서 모델 사용

Vertex AI Model Garden에서 실행되는 ML 모델을 사용하여 온라인 예측을 호출하려면 ml_predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/publishers/google/models/MODEL_ID', '{ CONTENTS }');

다음을 바꿉니다.

  • PROJECT_ID: Google Cloud 프로젝트 ID

  • REGION_ID: 모델이 있는 Google Cloud 리전의 ID(예: gemini-pro의 경우 us-central1)

  • MODEL_ID: 사용할 ML 모델의 ID(예: gemini-pro)

  • CONTENTS: 예측 호출에 대한 입력(JSON 형식)

ML 모델이 AlloyDB 클러스터와 동일한 프로젝트 및 리전에 저장된 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('publishers/google/models/MODEL_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 생성형 AI 파운데이션 모델 참조를 확인하세요.

예시는 호출 예시를 참고하세요.

Vertex AI 모델 엔드포인트 사용

Vertex AI 모델 엔드포인트를 사용하여 온라인 예측을 호출하려면 ml_predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/endpoints/ENDPOINT_ID', '{ CONTENTS }');

다음을 바꿉니다.

  • PROJECT_ID: 모델이 있는 Google Cloud 프로젝트의 ID

  • REGION_ID: 모델이 있는 Google Cloud 리전의 ID(예: us-central1)

  • ENDPOINT_ID: 모델 엔드포인트의 ID

  • CONTENTS: 예측 호출에 대한 입력(JSON 형식)

엔드포인트가 AlloyDB 클러스터와 동일한 프로젝트 및 리전에 있는 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('endpoints/ENDPOINT_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 PredictResponse를 참조하세요.

호출 예시

다음 예시에서는 Model Garden에서 제공되는 gemini-pro를 사용하여 ml_predict_row()에 리터럴 인수로 제공된 짧은 프롬프트를 기반으로 텍스트를 생성합니다.

select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.0-pro:generateContent', '{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "What is AlloyDB?"
    }]
  }]
}');

응답은 JSON 객체입니다. 객체 형식에 대한 자세한 내용은 응답 본문을 참조하세요.

다음 예시에서는 다음 방법으로 이전 항목을 수정합니다.

  • 예시에서 현재 데이터베이스의 messages.message 열 콘텐츠를 입력으로 사용합니다.

  • 예시에서 json_build_object() 함수를 함수 파라미터의 형식 지정을 위한 보조 도구로 사용하는 방법을 보여줍니다.


select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.0-pro:generateContent', json_build_object('contents', json_build_object('text', message))) from messages;

이제 반환된 JSON 객체는 messages 테이블의 각 행마다 predictions 배열에 하나의 항목을 포함합니다.

응답이 JSON 객체이기 때문에 PostgreSQL 화살표 연산자를 사용해서 특정 필드를 가져올 수 있습니다.

select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.0-pro:generateContent', json_build_object('contents', json_build_object('text', message)))->'predictions'->0->'content' FROM messages;

ml_predict_row()의 인수 예시는 Vertex AI API를 사용한 빠른 시작을 참고하세요.