BigQuery에서 제공되는 Vertex AI 스크립트 작성 모델
Gaurav Saxena
Group Product Manager
Bo Yang
Staff Software Engineer
*본 아티클의 원문은 2024년 1월 5일 Google Cloud 블로그(영문)에 게재되었습니다.
기업은 고객 통화부터 제품 데모, 영업 피치까지 매일 엄청난 양의 음성 데이터를 생성합니다. 이 데이터를 활용해 고객 만족도를 향상하고, 제품 개선을 최우선으로 하며, 비즈니스 프로세스를 간소화하여 비즈니스를 혁신할 수 있습니다. AI 모델이 지난 몇 달간 개선되기는 했지만 음성 데이터를 제어 및 확장 가능한 방식으로 AI 모델에 연결하는 것은 쉬운 일이 아니기에 고객이 유용한 정보를 대규모로 얻을 수 있는 역량이 제한될 수 있습니다.
오늘 Google Cloud에서는 BigQuery에 Vertex AI 스크립트 작성 모델의 프리뷰 버전이 출시되었다는 기쁜 소식을 전해 드립니다. 이 새로운 기능을 사용하면 간편하게 음성 파일의 스크립트를 작성하고 이를 다른 정형 데이터와 결합하여 분석과 AI 사용 사례를 구축할 수 있으며, 이 모든 것은 단순하고 강력하면서도 보안 및 거버넌스를 기본 제공하는 SQL를 통해 이루어집니다. 또한 Vertex AI의 다양한 기능으로 스크립트 작성 모델을 개발자의 데이터에 맞게 조정하여 BigQuery에서 사용할 수 있습니다.
이전에는 고객이 분석 개발을 위해 음성 데이터의 스크립트를 작성하려면 AI 파이프라인을 따로 빌드해야 했습니다. 이러한 파이프라인은 BigQuery에서 사일로화되므로, 고객은 스크립트로 작성된 데이터를 BigQuery로 보내 분석하려면 커스텀 인프라를 작성해야 했습니다. 이로 인해 가치 창출에 걸리는 시간이 늘어나고, 거버넌스에 문제가 발생하며, 팀은 하나를 위해 여러 시스템을 관리해야 했습니다.
제어 가능하고 통합된 데이터-AI 환경
Google Cloud의 음성 텍스트 변환 V2 API는 고객에게 스크립트를 쉽게 효율적으로 작성할 수 있는 다양한 기능을 제공합니다. 대표적으로 스크립트 작성을 위해 특정 도메인 모델을 선택할 수 있는 기능이 있습니다. 즉, 고객 서비스 통화, 의료 기록, 범용 음성 등 스크립트를 작성하려는 오디오의 유형에 최적화된 모델을 선택할 수 있습니다. 특정 모델을 선택하는 것 외에도 모델 적응 기능을 사용하여 모델을 자체 데이터에 맞게 유연하게 조정할 수도 있습니다. 이를 통해 구체적인 사용 사례에 맞게 스크립트 작성 정확도를 향상할 수 있습니다.
모델을 선택한 후 Cloud Storage에 저장된 음성 파일로 매핑되는 객체 테이블을 BigQuery에서 만들 수 있습니다. 객체 테이블은 세분화된 액세스 제어 권한을 제공하므로 사용자는 액세스 권한이 있는 음성 파일의 스크립트만 생성할 수 있습니다. 관리자는 객체 테이블의 액세스 정책을 행 수준으로 정의하고 기본 객체에 대한 액세스를 보호할 수 있습니다.
스크립트를 생성하려면 기존의 또는 조정된 스크립트 작성 모델을 BigQuery에 등록하고 SQL을 사용해 객체 테이블에서 호출하면 됩니다. 작성된 스크립트는 BigQuery 테이블의 텍스트 열로 반환됩니다. 이 프로세스 덕분에 기본 인프라에 대한 걱정 없이 대량의 오디오 데이터를 손쉽게 스크립트로 작성할 수 있습니다. 또한 객체 테이블이 세분화된 액세스 제어 권한을 제공하므로 고객 데이터를 안전하게 보호할 수 있습니다.
다음은 음성 텍스트 변환 V2 API와 BigQuery를 함께 사용하는 방법의 예시입니다.
이 쿼리는 객체 테이블에 있는 모든 음성 파일의 스크립트를 생성하고 작성된 스크립트라는 이름의 새 텍스트 열로 결과를 반환합니다.
감정 분석, 요약 등 다양한 분석 사용 사례
음성을 텍스트로 변환한 후에는 다음과 같은 세 가지 방법을 통해 결과 텍스트 데이터에 대한 분석을 구축할 수 있습니다.
- BigQueryML을 사용해 흔히 사용되는 자연어 사용 사례 수행: BigQueryML은 텍스트 모델의 학습 및 배포를 위한 광범위한 실행 지원을 제공합니다. 예를 들어 BigQuery ML을 사용해 지원 통화에서 고객의 감정을 식별하거나 제품에 대한 의견을 다양한 카테고리로 분류할 수 있습니다. Python 사용자라면 BigQuery Studio를 사용해 Pandas 기능을 실행하여 텍스트를 분석할 수도 있습니다.
- 텍스트로 변환된 메타데이터를 BigQuery 테이블에 저장된 다른 정형 데이터와 조인: 보다 강력한 사용 사례를 위해 정형 데이터와 비정형 데이터를 결합할 수 있습니다. 예를 들어 지원 통화에서 나타난 부정적인 감정을 기준으로 고객 평생 가치(CLTV)가 높은 고객을 식별하거나 고객 의견에서 요청이 가장 많이 접수된 제품 기능의 목록을 작성할 수 있습니다.
- BigQuery에서 PaLM API를 직접 호출하여 스크립트로 작성된 데이터를 요약, 분류하거나 Q&A 프롬프트 만들기: PaLM은 다양한 자연어 작업에 사용할 수 있는 강력한 AI 언어 모델입니다. 예를 들어 PaLM을 사용해 지원 통화의 요약을 생성하거나 고객의 의견을 다양한 카테고리로 분류할 수 있습니다.
검색 및 생성형 AI 사용 사례 구현
스크립트를 작성한 후에는 BigQuery의 검색 및 색인 생성 기능을 토대로 모래사장에서 바늘 찾기에 가까운 쿼리에 최적화된 색인을 빌드하여 강력한 검색 기능을 활용할 수 있습니다.
이러한 통합 덕분에 오디오 파일에 새로운 생성형 LLM 애플리케이션을 활용할 수도 있습니다. BigQuery의 강력한 기본 제공 ML 기능을 사용해 ML.GENERATE_TEXT, ML.GENERATE_TEXT_EMBEDDING, ML.UNDERSTAND_TEXT, ML.TRANSLATE 등 스크립트로 작성된 텍스트에서 분류, 감정 분석, 항목 추출, 추출식 질의 응답, 요약, 다른 스타일로 텍스트 재작성, 광고 문구 생성, 아이디어 구상, 임베딩, 번역 등 다양한 작업에 필요한 유용한 정보를 더 많이 확보할 수 있습니다.
다음 단계
위 기능은 현재 프리뷰 버전으로 제공됩니다. 이 문서 및 데모를 따라 시작하거나 Google 영업 담당자에게 문의해 보세요.