생성형 AI 개요

이 문서에서는 BigQuery가 지원하는 생성형 인공지능(AI) 함수를 설명합니다. 이러한 함수는 자연어 입력을 허용하고 사전 학습된 Vertex AI 모델과 내장 BigQuery 모델을 사용합니다.

개요

BigQuery는 다음과 같은 작업을 수행하는 데 도움이 되는 다양한 AI 함수를 제공합니다.

  • 창의적인 콘텐츠 생성
  • 텍스트 또는 이미지와 같은 비정형 데이터에 대한 질문을 분석하고 답변
  • 텍스트에 표현된 감정 감지
  • 콘텐츠에서 전달하는 주요 아이디어 또는 인상을 요약
  • 텍스트 또는 오디오 데이터의 콘텐츠를 다른 언어로 번역
  • 텍스트에서 구조화된 데이터 추출
  • 텍스트 또는 구조화되지 않은 데이터를 사용자 정의 카테고리로 분류
  • 유사한 텍스트, 이미지, 동영상 식별
  • 자연어 조건으로 데이터 필터링
  • 품질, 유사성 또는 기타 기준에 따라 순위를 매기기 위해 입력을 평가
  • 텍스트 또는 시각적 데이터에서 하나 이상의 주요 항목을 식별
  • 오디오 데이터의 구두 콘텐츠와 일치하는 텍스트를 생성
  • 시각적 데이터에 캡션을 추가하거나 Q&A 수행

이러한 작업을 완료하는 데 도움이 되는 AI 함수에는 두 가지 주요 카테고리가 있습니다.

  • 범용 AI 함수: 이러한 함수를 사용하면 사용할 모델, 프롬프트, 매개변수를 완전히 제어하고 투명하게 확인할 수 있습니다.

    • 추론 실행(예: 데이터에 관한 질문에 답하기)

      • AI.GENERATE는 가장 유연한 추론 함수로, 텍스트와 구조화되지 않은 데이터의 모든 조합을 분석할 수 있습니다.
      • 특정 유형의 출력이 필요한 경우 다음의 더 전문화된 추론 함수 중 하나를 선택하세요.

        • AI.GENERATE_BOOL
        • AI.GENERATE_DOUBLE
        • AI.GENERATE_INT
    • 구조화된 출력 생성(예: 구조화되지 않은 텍스트에서 이름과 주소 추출)

      • AI.GENERATE_TABLE
    • AI.GENERATE의 테이블 값 함수 버전을 사용하여 텍스트 생성

      • ML.GENERATE_TEXT
    • 시맨틱 검색 및 클러스터링을 위한 임베딩 생성

      • ML.GENERATE_EMBEDDING
  • 관리형 AI 함수: 이러한 함수는 간소화된 문법을 사용하며 비용과 품질에 최적화되어 있습니다. BigQuery에서 모델을 선택합니다.

    • 자연어 조건으로 데이터 필터링

      • AI.IF
    • 품질 또는 감정과 같은 입력 평가

      • AI.SCORE
    • 입력을 사용자 정의 카테고리로 분류

      • AI.CLASSIFY

범용 AI 함수

범용 AI 함수를 사용하면 사용할 모델, 프롬프트, 매개변수를 완전히 제어하고 투명하게 확인할 수 있습니다. 출력에는 상태, 전체 모델 응답 등 모델 호출에 관한 자세한 정보가 포함되며, 여기에는 안전 등급이나 인용에 관한 정보가 포함될 수 있습니다.

정형 데이터 생성

구조화된 데이터 생성은 텍스트 생성과 매우 유사하지만 SQL 스키마를 지정하여 모델의 응답 형식을 지정할 수 있습니다. 예를 들어 전화 통화 스크립트에서 고객의 이름, 전화번호, 주소, 요청, 가격 견적을 포함하는 표를 생성할 수 있습니다.

구조화된 데이터를 생성하려면 정식 버전 또는 프리뷰 Gemini 모델을 사용하여 원격 모델을 만드세요. 그러면 AI.GENERATE_TABLE 함수를 사용하여 해당 모델과 상호작용할 수 있습니다. 구조화된 데이터를 만들어 보려면 AI.GENERATE_TABLE 함수를 사용하여 구조화된 데이터 생성을 참조하세요.

AI.GENERATE_TABLE 함수로 Gemini 모델을 사용할 때 안전 속성을 지정하여 모델의 응답을 필터링할 수 있습니다.

지원되는 Gemini 모델의 경우 Vertex AI 프로비저닝된 처리량을 사용하여 요청에 일관된 높은 처리량을 제공할 수 있습니다.

행별로 특정 유형의 값 생성

Gemini 모델과 함께 스칼라 생성형 AI 함수를 사용하여 BigQuery 표준 테이블의 데이터를 분석할 수 있습니다. 데이터에는 ObjectRef 값이 포함된 열의 텍스트 데이터와 구조화되지 않은 데이터가 모두 포함됩니다. 테이블의 각 행에 대해 이러한 함수는 특정 유형을 포함하는 출력을 생성합니다. 예를 들어 가구 SKU에 mid-century modern 또는 farmhouse 같은 관련 설명이 있도록 가구 이미지를 분석하여 design_type 열의 텍스트를 생성할 수 있습니다.

다음과 같은 AI 함수를 사용할 수 있습니다.

지원되는 Gemini 모델과 함께 AI.GENERATE 함수를 사용하는 경우 Vertex AI 프로비저닝된 처리량을 사용하여 요청에 일관된 높은 처리량을 제공할 수 있습니다. 자세한 내용은 Vertex AI 프로비저닝된 처리량 사용을 참조하세요.

TVF로 텍스트 생성

BigQuery ML의 원격 모델을 사용하여 Vertex AI에 배포되거나 Vertex AI에서 호스팅되는 모델을 참조하는 테이블 값 함수 GENERATE_TEXT를 사용하여 생성형 AI 작업을 실행할 수 있습니다. 다음 유형의 원격 모델을 만들 수 있습니다.

원격 모델을 만든 후에는 ML.GENERATE_TEXT 함수를 사용하여 해당 모델과 상호작용할 수 있습니다.

  • Gemini 모델을 기반으로 하는 원격 모델의 경우 다음을 수행할 수 있습니다.

    • ML.GENERATE_TEXT 함수를 사용하여 쿼리에서 지정하거나 표준 테이블의 열에서 가져오는 프롬프트에서 텍스트를 생성합니다. 쿼리에서 프롬프트를 지정할 때 프롬프트에서 다음 유형의 테이블 열을 참조할 수 있습니다.

    • ML.GENERATE_TEXT 함수를 사용하여 함수 인수로 제공하는 프롬프트에서 객체 테이블의 텍스트, 이미지, 오디오, 동영상 또는 PDF 콘텐츠를 분석합니다.

  • 다른 모든 유형의 원격 모델의 경우 쿼리 또는 표준 테이블의 열에서 제공하는 프롬프트와 함께 ML.GENERATE_TEXT 함수를 사용할 수 있습니다.

다음 주제를 사용하여 BigQuery ML에서 텍스트 생성을 시도해 보세요.

입력에 표준 테이블을 사용하는 경우 ML.GENERATE_TEXT 함수로 Gemini 모델을 사용할 때 그라운딩안전 속성을 사용할 수 있습니다. Gemini 모델은 그라운딩을 통해 인터넷의 추가 정보를 사용하여 보다 구체적이고 사실적인 응답을 생성할 수 있습니다. Gemini 모델은 안전 속성을 통해 지정된 속성을 기반으로 반환하는 응답을 필터링할 수 있습니다.

일부 모델의 경우 필요에 따라 감독된 조정을 구성할 수 있습니다. 이를 통해 자체 데이터로 모델을 학습시켜 사용 사례에 더 적합하게 만들 수 있습니다. 모든 추론은 Vertex AI에서 발생합니다. 결과는 BigQuery에 저장됩니다.

지원되는 Gemini 모델의 경우 Vertex AI 프로비저닝된 처리량을 사용하여 요청에 일관된 높은 처리량을 제공할 수 있습니다. 자세한 내용은 Vertex AI 프로비저닝된 처리량 사용을 참조하세요.

임베딩 생성

임베딩은 텍스트 또는 오디오 파일의 일부와 같이 특정 항목을 나타내는 고차원의 숫자 벡터입니다. 임베딩을 생성하면 데이터를 더 쉽게 추론하고 비교할 수 있는 방식으로 데이터의 시맨틱을 포착할 수 있습니다.

임베딩 생성의 일반적인 사용 사례는 다음과 같습니다.

  • 검색 증강 생성(RAG)을 사용하여 신뢰할 수 있는 소스의 추가 데이터를 참조하여 사용자 쿼리에 대한 모델 응답을 보강합니다. RAG는 사실 정확성과 응답 일관성을 개선하고 모델의 학습 데이터보다 최신인 데이터에 액세스할 수 있도록 지원합니다.
  • 멀티모달 검색을 실행합니다. 예를 들어 텍스트 입력을 사용하여 이미지를 검색하는 경우
  • 추천, 대체, 레코드 중복 삭제를 위해 유사한 항목을 찾기 위한 시맨틱 검색을 실행합니다.
  • 클러스터링을 위해 k-평균 모델과 함께 사용할 임베딩을 만듭니다.

지원되는 모델

지원되는 모델은 다음과 같습니다.

비슷한 경량형 텍스트 임베딩의 경우 NNLM, SWIVEL, BERT와 같은 사전 학습된 TensorFlow 모델 사용을 시도해 보세요.

임베딩 생성 모델 사용

모델을 만든 후에는 ML.GENERATE_EMBEDDING 함수를 사용하여 모델과 상호작용할 수 있습니다. 지원되는 모든 유형의 모델에서 ML.GENERATE_EMBEDDING표준 테이블의 구조화된 데이터로 작동합니다. 멀티모달 임베딩 모델의 경우 ML.GENERATE_EMBEDDINGObjectRef 값이 포함된 표준 테이블 열 또는 객체 테이블의 시각적 콘텐츠로도 작동합니다.

원격 모델의 경우 모든 추론은 Vertex AI에서 발생합니다. 다른 모델 유형의 경우 모든 추론이 BigQuery에서 발생합니다. 결과는 BigQuery에 저장됩니다.

다음 주제를 사용하여 BigQuery ML에서 임베딩 생성을 시도해 보세요.

관리형 AI 함수

관리형 AI 함수는 분류, 정렬, 필터링과 같은 일상적인 작업을 자동화하도록 설계되었습니다. 이러한 함수는 Gemini를 사용하며 맞춤설정이 필요하지 않습니다. BigQuery는 프롬프트 엔지니어링을 사용하고 특정 작업에 사용할 적절한 모델과 매개변수를 선택하여 결과의 품질과 일관성을 최적화합니다. 각 함수는 BOOL, FLOAT64, STRING와 같은 스칼라 값을 반환하며 모델의 추가 상태 정보는 포함하지 않습니다. 다음과 같은 관리형 AI 함수를 사용할 수 있습니다.

  • AI.IF: 프롬프트에 따라 WHERE 또는 JOIN 절과 같은 텍스트 또는 멀티모달 데이터를 필터링합니다. 예를 들어 선물로 적합한 상품을 설명하는 제품 설명을 필터링할 수 있습니다.
  • AI.SCORE: 프롬프트에 따라 입력의 등급을 매겨 품질, 유사성 또는 기타 기준에 따라 행의 순위를 지정합니다. ORDER BY 절에서 이 함수를 사용하여 점수에 따라 상위 K개 항목을 추출할 수 있습니다. 예를 들어 제품에 대한 가장 긍정적이거나 부정적인 사용자 리뷰 상위 10개를 찾을 수 있습니다.
  • AI.CLASSIFY: 텍스트를 사용자 정의 카테고리로 분류합니다. GROUP BY 절에서 이 함수를 사용하여 정의한 카테고리에 따라 입력을 그룹화할 수 있습니다. 예를 들어 청구, 배송, 제품 품질 또는 기타 사항과 관련된 지원 티켓을 분류할 수 있습니다.

위치

텍스트 생성 및 임베딩 모델의 지원되는 위치는 사용하는 모델 유형과 버전에 따라 다릅니다. 자세한 내용은 위치를 참조하세요.

가격 책정

모델에 대해 쿼리를 실행하는 데 사용하는 컴퓨팅 리소스에 대한 요금이 청구됩니다. 원격 모델은 Vertex AI 모델을 호출하므로 원격 모델에 대한 쿼리에도 Vertex AI 요금이 청구됩니다.

자세한 내용은 BigQuery ML 가격 책정을 참조하세요.

다음 단계