프롬프트와 임베딩에 대해 잘 알고 계시나요? 바쁜 경영진을 위한 생성형 AI 입문서를 소개합니다
Michael Endler
AI Editor, Google Cloud
프롬프트 설계의 프롬프트 조정에 대해 알고 계시나요? 생성형 AI 핵심 용어와 조직에 어떤 영향을 미치는지 알아보겠습니다.
새로운 기술이 혜성처럼 등장하면 앱과 사용 사례뿐만 아니라 전문 용어도 폭발적으로 생성됩니다.
생성형 AI는 엄청난 잠재력과 빠른 발전으로 인해 어휘 측면에서도 막대한 도전과제를 제기하고 있습니다. 새롭고 강력하고 복잡하며 전략적으로 긴급하게 접근해야 할 정도로 빠르게 발전하고 있지만 최신 기술을 동원해도 적절하게 대응하기 어려운 실정입니다.
하지만 걱정하지 마세요. Google에서 도와 드립니다. 아래에는 생성형 AI 관련 대화를 원활하게 나누고 조직에서 이 흥미로운 기술에 대한 의사 결정을 내리기 위해 이해해야 하는 주요 용어와 개념이 정의되어 있습니다.
생성형 AI: 모든 것을 변화시킬 수 있는 잠재력
생성형 AI는 코퍼스라고 하는 대규모 학습 데이터 세트에서 복잡한 관계를 찾아낸 다음 학습한 내용을 일반화하여 원본 삽화, 블로그 초안, 질문에 대한 답변 등 새로운 데이터를 만들 수 있는 AI입니다. 이러한 일반화를 통해 AI 모델은 명시적으로 학습되지 않은 태스크(예: 제로샷 및 퓨샷 학습)를 수행할 수 있으며 인간이 모델에서 사용하는 프롬프트를 입력하여 텍스트, 이미지 동영상에서 음악, 코드, 화합물 공식에 이르기까지 새로운 출력을 생성하도록 도와줍니다.
비즈니스에 미치는 영향:
생성형 AI는 새로운 기술이지만 이미 조직에서는 혁신적이고 널리 적용할 수 있는 다양한 사용 사례를 탐색하고 있습니다. 예를 들어 콘텐츠 생성 및 소프트웨어 개발 가속화, 맞춤화된 셀프 도움말 상호작용과 챗봇을 통한 고객 서비스 개선, 정보 탐색 및 분석의 새로운 방법 활용, 심지어 신약 개발 지원 사례도 있습니다.
이러한 예는 시작에 불과합니다. 기술이 계속 발전하고 개발자, 기업, 정부가 기술에 쉽게 액세스할 수 있게 됨에 따라 사용 사례가 나날이 증가하고 있습니다. Google 브레인에서 개발한 Transformer 아키텍처와 같은 생성형 AI의 기반이 되는 머신러닝 기술은 이전 AI 기술보다 큰 도약을 이뤘으며 장거리 의존성(예: 텍스트 끝에 있는 단어와 시작 부분에 있는 단어의 관련성 또는 단백질 구조의 변수의 관련성)을 파악하는 데 탁월합니다.
이 기능으로 고급 사용 사례와 AI 문제 해결을 위한 문이 활짝 열렸습니다. 생성 텍스트가 이전의 단순한 자동 수정 및 자동 완성 태스크를 뛰어 넘어, 문서를 수집하고 문서에 대한 질문에 답하거나 기존의 콘텐츠를 사용해 동일한 톤으로 새로운 콘텐츠를 만드는 등의 작업을 할 수 있는 것도 이 기능 덕분입니다.
이러한 최첨단 기술 덕분에 자연어 안내에 응답하고, 전례 없는 정밀도로 인간과 유사한 출력을 생성하며, 사람이 복잡한 문제를 해결하는 데 도움을 줄 수 있는 AI 기반 애플리케이션이 폭발적으로 증가하고 있습니다. 생성형 AI는 시간이 지남에 따라 모든 비즈니스에 영향을 미치고 사람이 기계, 정보, 다른 사람과 상호작용하는 방식을 근본적으로 변화시킬 수 있는 가능성을 가지고 있습니다.
모델: 커스텀 생성형 AI 애플리케이션의 시작점
- 대규모 모델(LM)은 생성형 AI를 강력하게 구동하는 엔진입니다. 대규모 언어 모델(LLM)은 텍스트에 초점을 맞춘 일반적 유형의 LM이지만 점차 텍스트 프롬프트에서 텍스트뿐 아니라 텍스트에서 이미지, 이미지에서 이미지 등을 생성할 수 있는 첨단 LM인 멀티모달이 증가하고 있습니다. LM에는 일반적으로 모델의 규모와 복잡성을 나타내는 수십억 또는 수천억 개의 파라미터가 포함됩니다. 대체로 모델 규모가 클수록 성능이 더 뛰어나지만 학습과 실행에 많은 비용이 듭니다. 그러나 더 작은 규모의 모델이 보다 효율적이고 강력해짐에 따라 이러한 트렌드가 변화하고 있습니다.
기반 모델은 API 및 개발자 플랫폼을 통해 다운스트림 태스크(예: 커스텀 생성형 AI 애플리케이션 빌드)에 활용할 수 있는 LM입니다. 일부 조직은 그들의 내부 기술 플랫폼을 위한 기반 모델을 개발하는 반면 다른 조직은 오픈소스 프로젝트와 클라우드 제공업체의 서드 파티 옵션을 활용합니다.
비즈니스에 미치는 영향:
많은 소프트웨어 제공업체가 기존 제품에 생성형 AI를 도입하여 생산성 워크플로에 기술을 보다 간편하고 쉽게 통합할 수 있게 되었습니다. 생성형 기능이 Google Workspace에 추가되고 있는 것이 그러한 예입니다. 또한 Bard와 같은 AI 공동작업 도구를 사용하면 새로운 방식으로 다양한 작업을 처리할 수 있습니다.
하지만 조직이 차세대 고객 경험을 위해서든 혁신적인 내부 사용을 위해서든 기술의 이점을 최대한 활용하려면 자체 커스텀 생성형 AI 앱이 필요할 수 있습니다. 그러려면 기반 모델에 액세스해야 합니다.
많은 조직에는 향후 몇 년 내에 팀과 운영 전반에 발전될 가능성이 있는 다양 한 AI 사용 사례를 수용하기 위해 여러 기반 모델이나 최소한 핵심 모델의 맞춤설정된 변형 버전이 다수 필요할 수 있습니다.
사내 모델을 빌드하는 데는 많은 시간과 비용이 들며 복잡할 수 있습니다. 특히 조직이 대규모 모델을 학습시키는 경우 컴퓨팅 비용만 수천만 달러가 들 수 있습니다. 이에 더해 관련 데이터 오버헤드를 처리하고 머신러닝 전문성도 갖춰야 합니다. 이러한 이유로 많은 기업과 정부가 Google의 PaLM 2와 같은 서드 파티 기반 모델을 활용하는 방법을 모색하고 있습니다.
사실 많은 조직에는 향후 몇 년 내에 팀과 운영 전반에서 발전될 가능성이 있는 다양한 AI 사용 사례를 수용하기 위해 여러 기반 모델이나 최소한 핵심 모델의 맞춤설정된 변형 버전이 다수 필요할 수 있습니다.
예를 들어 일부 정교한 사용 사례에 규모가 더 큰 모델, 보다 복잡한 프롬프트, 방대한 출력이 필요할 수 있습니다. 이러한 사용 사례에서는 한 단어 또는 구문과 같이 LM의 가장 작은 데이터 단위인 토큰을 더 많이 처리해야 할 수 있습니다. 또한 토큰은 환경설정 기간의 핵심 요소이며, 모델이 작업 정보를 망각하기 시작하기 전에 고려할 수 있는 프롬프트 정보의 양을 정의할 뿐만 아니라 어떤 모델을 선택하고 어떻게 맞춤설정하며 얼마나 많은 비용을 사용하는지 알려주는 변수 중 하나이기도 합니다.
예를 들어, 플레이어가 마이크에 대고 말하는 내용에 따라 캐릭터 대화가 실시간으로 생성되는 VR 게임을 만들고자 한다면 무엇보다도 고급 기반 모델에서 생성된 토큰이 많이 필요할 것입니다. 그러나 애플리케이션이 쇼핑객의 재고 검색, 구매 결정, 결제 처리를 지원하는 소매업 챗봇인 경우 명확하고 간결하며 토큰 효율적인 응답을 출력하는 비교적 가벼운 LM이 효과적이고 만족도 높은 경험을 제공하면서 비용을 최적화하는 좋은 방법이 될 수 있습니다.
기반 모델을 비즈니스에 적용
- 프롬프트 설계는 프롬프트 엔지니어링이라고도 하며 기반 모델에서 원하는 응답을 유발하는 프롬프트를 만드는 프로세스입니다. 이는 최종 사용자가 생성형 AI 앱에서 프롬프트를 만드는 방식을 의미할 수 있지만, 앱 제작자가 모델이 작동하도록 학습시키고 최종 사용자에게 선보이기에 앞서 기본 안내를 설정하는 방식을 의미하기도 합니다. 예를 들어 개발자와 프롬프트 엔지니어는 복잡한 프롬프트를 더 작은 태스크로 나누는 방법을 모델에 알려 올바른 추론 학습(예: 연쇄 사고 프롬프트)을 유지할 수 있으며, 응답의 정확성이나 창의성의 우선순위를 제어하는 temperature와 같은 변수를 구성할 수 있습니다.
- Parameter-efficient 튜닝은 출력에 영향을 주기 위해 예시들을 기반 모델에 제시하지만 재학습하지 않는 저렴한 맞춤설정 방법입니다.
- 파인 튜닝을 사용하면 조직에서 기반 모델에 새로운 데이터를 추가로 학습시켜 세밀하게 맞춤설정할 수 있습니다.parameter-efficient 튜닝에서와 같이 LM에 몇 가지 예를 제공하는 것이 아니라 수만 개의 새로운 데이터 포인트로 모델의 학습을 업데이트하여 모델 자체의 가중치를 변경합니다. 고도로 차별화된 생성형 AI 사용 사례나 법률 또는 의학 용어와 같이 전문적인 결과의 출력이 필요한 사용 사례를 추구하는 경우에 유용합니다.
- 인간 피드백 기반 강화 학습(RLHF)은 조직이 인간의 피드백에 따라 조정된 모델에 보상을 제공하여 기반 모델을 미세 조정할 수 있는 기법입니다.
- 임베딩은 데이터를 벡터로 표현합니다. 벡터는 주어진 데이터 조각의 차원을 설명하고 데이터 간의 관계를 표시하며 LM에서 처리할 수 있는 일련의 숫자입니다. 이미지는 각 픽셀의 색상을 나타내는 숫자가 포함된 벡터로 표현할 수 있습니다. 예를 들어 '고양이'라는 단어의 벡터에는 '포유류', '네발', '가축'과 같이 차원을 나타내는 숫자가 포함될 수 있습니다. LM은 벡터를 사용하여 데이터의 요소 간 관계를 이해할 수 있습니다. 예를 들어, '고양이'와 '호랑이'는 유전적으로 연관이 있다는 점에서 유사하지만 '고양이'만 가축으로 기르거나 일반적인 반려동물로 받아들인다는 점에서 차이가 있습니다. 이러한 관계를 통해 모델은 더 정확한 예측을 출력할 수 있으며 조직은 추천 엔진, 분류기, 다른 정교한 생성형 AI 앱을 빌드할 수 있습니다.
비즈니스에 미치는 영향:
커스텀 생성형 AI 앱을 만들려는 조직에서는 일반적으로 기반 모델의 동작을 맞춤설정해야 합니다. 이는 특수한 사용 사례에 맞게 새로운 기술을 가르치는 것을 의미하거나, 단순히 생성형 고객 서비스 챗봇이 브랜드에 맞는 정확한 응답을 제공하도록 보장하는 것을 의미합니다. 다양한 수준의 맞춤설정이 가능하며, 경우에 따라 숙련된 지식 노동자 또는 개발자가 수행할 수 있고 머신러닝 전문성이 필요할 수도 있습니다.
예를 들어, Google Cloud에서 최근에 발표한 Vertex AI의 생성형 AI 지원 업데이트를 보면 마케팅 콘텐츠 제작을 위한 모델을 프롬프트 미세 조정하려는 경우 브랜드 문서, 보도 자료, 소셜 미디어 게시물을 비롯한 기타 애셋을 업로드하기만 하면 시작할 수 있습니다. 마찬가지로 팀에서 기업 내부용 검색 앱을 빌드하려는 경우 임베딩, 벡터 데이터베이스, 기반 모델을 사용하여 수동으로 빌드할 수 있습니다. 하지만 대부분의 경우 조사할 데이터 소스를 선택하고 기반 모델을 시맨틱 검색 기능과 결합하는 프로세스를 간소화하는 Google Cloud의 생성형 앱 빌더와 같은 제품을 사용하여 더 빠르게 진행할 수도 있습니다.
또한 맞춤설정 요구사항을 통해 조직이 선택해야 하는 모델이나 공급업체를 파악할 수 있습니다. 기반 모델이 조정을 위한 엔터프라이즈급 플랫폼 기능, 기본 제공되는 보안 기능, 개인 정보 보호 기능으로 지원되는지 여부는 채택 편의성에 큰 영향을 미칠 수 있습니다.
탐색 시작
이러한 개념을 이해하셨다면 생성형 AI 플랫폼을 탐색하고 실험하며 비즈니스에 적합한 전략을 수립할 수 있는 준비가 된 것입니다. 시작하는 데 도움이 되도록 Google Cloud의 'The Prompt' 시리즈를 확인하여 조직이 생성형 AI 전략을 강화하면서 추구할 수 있는 최고의 사용 사례와 그 과정에서 피해야 할 몇 가지 오해와 실수를 살펴보세요.