Transform with Google Cloud

프롬프트 엔지니어링의 실제: 미래의 업무 방식에 대비하는 방법

2023년 10월 17일

https://storage.googleapis.com/gweb-cloudblog-publish/images/how-to-prompt-engineer-workers-execs.max-1500x1500.png

Priyanka Vergadia

Head of North America Cloud Developer Advocacy

생성형 AI는 작업 방식뿐 아니라 사고하는 방식도 다릅니다. 여기에서는 조직이 작업자들의 생성형 AI 활용에 어떤 도움을 줄 수 있는지 살펴봅니다.

Why Google Cloud?

Get unmatched cloud technology built on Google’s infrastructure.

Learn more

*본 아티클의 원문은 2023년 9월 27일 Google Cloud 블로그(영문)에 게재되었습니다.

많은 기업이 생성형 AI와 대규모 언어 모델(LLM)로 무엇을 할 수 있을지 모색 중인 지금, 여러 우수사례와 실제 쓰임에서 이미 그 잠재력이 발현되고 있습니다. 경영진은 이러한 기술을 최대한 활용할 수 있는 사업부가 어디인지 찾는 것뿐 아니라, 직원들이 이 기술의 가장 큰 이점을 어떻게, 어떤 방식으로 누리게끔 할 것인지에 대한 중요한 문제를 해결하기 위해 노력합니다.

예를 들어 MIT와 BCG, Upenn Wharton 등 여러 기관에서 발표한 최근 보고서에 따르면 생성형 AI를 도입했을 때 직원들의 성과 향상에 뚜렷한 효과가 나타난 것으로 드러났습니다. 성과가 가장 높은 직원들의 경우 생산성이 17% 향상되었으며, 성과가 저조했던 작업자들의 경우에는 생산성이 무려 43%나 증가했습니다.

LLM이 작업자 생산성에 미치는 영향에 대해 지금까지 밝혀진 것은 일부에 불과하며, 이 같은 혁신 기술이 모든 수준의 작업자는 물론 업계 전반에 변혁을 일으키는 데 중대한 역할을 할 것임이 분명해 보입니다. 작업자가 생성형 AI를 얼마나 이해하고 있는지, 이러한 기술을 워크플로에 어떤 식으로 활용하는지에 따라 다양한 양상으로 성과가 나타날 것입니다. 조직에서 생성형 AI 어시스턴트 또는 기업 생산성 소프트웨어에 내장된 기능을 사용한다 하더라도, 때로는 그 결과가 특별하기보다는 평범에 더 가까울 수도 있습니다.

따라서 프롬프트 엔지니어링, 즉 최적의 결과를 생성하도록 모델을 개선하고 안내하는 데 사용되는 이 기법은 비즈니스의 모든 측면에 생성형 AI 기술을 활용하려는 기업이 많아짐에 따라 앞으로 더 갈고닦아야 할 핵심적인 기술로 자리 잡고 있습니다.

그렇다면 이 과정이 LLM을 활용하여 효과적으로 작업하는 데 그토록 중요한 이유는 무엇일까요? 바로 사람들이 작성하는 프롬프트에 따라 생성형 AI의 답변 수준이 갈라지기 때문입니다. 어떤 표현과 개념을 사용하느냐에 따라 그 결과가 달라집니다. 이를 시작하는 데 도움이 되는 방법을 알아보겠습니다.

프롬프트의 효과

LLM을 최대한 활용한다는 것은 곧 이를 어떻게 사용해야 하는지를 이해하여 원하는 출력 결과를 얻어낸다는 뜻입니다.

검색어를 통해 검색 엔진에서 구체적인 결과를 얻는 방식과 마찬가지로 생성형 AI 프롬프트를 통해 모델이 반환하는 응답의 방향을 결정합니다. 어떤 단어와 표현을 선택하는지, 프롬프트의 구조는 어떤지, 맥락이 무엇인지를 바탕으로 출력되는 내용이 결정됩니다. 프롬프트가 정확하지 않거나, 체계적이지 않거나, 모호한 경우 생성되는 결과물의 품질도 떨어질 수 있습니다.

간단히 말해 LLM은 제시된 프롬프트 외 스스로가 모르는 영역이 무엇인지를 알지 못합니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Enterprise_tumbnail_2_1.max-2000x2000.png

예를 들어 Google의 PaLM(Pathways-based Language Model) 2는 수십억 페이지에 달하는 텍스트, 웹페이지, 학술 자료 등을 학습하여 자연어로 텍스트와 코드를 생성하는 모델을 만듭니다. 하지만 모델 자체가 이러한 정보를 의식적으로 이해하거나 인식하는 것은 아니며, 정보의 적용 방식을 아는 것도 아닙니다.

다음과 같은 프롬프트를 예로 들어 보겠습니다.

"끈 이론에 대한 설명을 작성해줘."

이 프롬프트는 모델이 답변을 하게 할 뿐, 모델의 행동을 조정할 수 있는 어떠한 장치도 포함되어 있지 않습니다. 달성하고자 하는 작업이 무엇인지 구체적으로 명시하지도 않고 원하는 결과에 대한 추가적인 안내를 포함하지도 않습니다. 이 프롬프트는 마치 동료가 나에게 작업 범위나 구체적인 결과물에 관한 어떠한 세부정보도 없이 프로젝트 하나를 완료해 달라고 요청하는 것과 크게 다르지 않습니다.

항상 그렇듯이, 프롬프트 엔지니어링에서는 맥락이 중요합니다. 우리는 제작자일 뿐만 아니라 감독이기도 합니다. 지시가 구체적일수록 '배우'에게 더 도움이 되는 것처럼요.

끈 이론에 대한 쿼리에 착수한 LLM은 이 작업이 끈 이론의 정의를 요약한 짧은 단락을 작성하기 위한 것인지, 기본 개념을 설명하는 동영상 스크립트를 위한 것인지, 아니면 전체 프레임워크를 설명하는 여러 과정으로 구성된 교육 커리큘럼을 완성하기 위한 것인지 알지 못합니다.

프롬프트 엔지니어링에서는 맥락이 중요합니다. 우리는 제작자일 뿐만 아니라 감독이기도 합니다. 지시가 구체적일수록 '배우'에게 더 도움이 되는 것처럼요.

인용 트윗

다음과 같은 프롬프트가 더욱 효과적입니다.

“물리를 처음 배우기 시작한 만 12~14세 학생에게 끈 이론의 기본 개념을 설명하는 300자 분량의 블로그 게시물을 작성해줘. 자연어를 사용해 이해하기 쉬운 문장으로 답변을 설계해줘.”

맥락, 대상, 어조, 스타일, 형식에 관한 세부정보를 제공하면 답변 생성 시 모델이 이를 참고하여 판단을 내리는 데 많은 도움이 됩니다. 어떤 경우에는 LLM이 콘텐츠를 생성할 때 우리가 무엇을 원하는지 정확하게 파악할 수 있도록 대표적인 예시를 제공하거나 고객과 시장, 업종에 관한 추가 정보를 포함해야 할 수도 있습니다.

프롬프트는 모델이 사용자의 구체적인 비즈니스 및 잠재고객 요구사항을 가장 잘 충족하기 위해 그 기능을 어떤 방식으로 발휘해야 하는지 참고할 수 있는 청사진과도 같습니다. 따라서 관련성 높고 정확한 고품질의 결과를 얻기 위해서는 모델의 기능을 최대한 활용할 수 있는 알맞은 프롬프트를 작성하는 것이 중요합니다.

프롬프트 응답 사이클

프롬프트 엔지니어링에는 첫 프롬프트 외에도 많은 것이 포함됩니다. 사용자의 답변 또한 중요한 역할을 차지하죠. 입력과 출력이 상호작용하는 공생 관계라고 보면 됩니다. 첫 프롬프트는 방향을 설정해 주며, 여기에서 생성된 결과에 피드백을 제공함으로써 후속 프롬프트를 더욱 미세하게 조정할 수 있습니다.

응답은 거울과도 같습니다. 사용자의 프롬프트와 학습 데이터의 강점과 약점을 그대로 반영하죠. '부정확한' 결과는 우리가 프롬프트의 어떤 부분을 개선해야 하는지 드러내 줍니다. 즉, 원하는 응답을 생성하기 위해 프롬프트를 더 명확하게 작성해야 할 부분이 어딘지, 어떤 정보가 더 필요한지에 대해 유용한 단서를 제공해 줍니다.

위의 끈 이론 프롬프트에 다음과 같은 추가적인 맥락을 더하면 출력이 어떻게 변하는지 평가해 볼 수 있습니다.

LLM이 응답을 생성할 때 시뮬레이션해야 하는 대상
부제목, 글머리기호 목록, 클릭 유도 문구 등의 형식 정보
인용, 예시 또는 일화 등을 추가하라는 지침
내용에서 제외했으면 하는 정보에 관한 구체적인 사항

입력값을 넣을 때마다 생성된 결과가 기대에 부응하는지 분석해 보고 입력을 수정할 수 있으며, 마음에 드는 결과가 나올 때까지 이 과정을 반복하면 됩니다. 이렇게 계속되는 상호작용의 순환을 통해 사용자는 여러 가지 접근 방식을 테스트해 볼 수 있으며, 구조와 표현의 구체적인 변화가 모델 응답의 품질과 정확도, 정밀도에 어떤 영향을 주는지 파악할 수 있게 됩니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Unicorns_tumbnail_1.max-2000x2000.png

프롬프트 엔지니어링은 과학일 뿐만 아니라 창조적인 예술이기도 합니다. 하지만 이를 성공적으로 활용하려면 대규모 언어 모델의 기술적인 한계를 이해하고 그 안에서 최대한 정확한 결과를 얻어낼 수 있어야 합니다. 모델마다 사용하는 아키텍처와 학습 방법론, 데이터 세트가 다르며, 어떤 모델에 효과가 있었다고 해서 다른 모델에도 효과가 있는 것은 아닙니다. 쿼리를 실험해 보면 각 모델이 어떻게 다른 결정을 내리는지 파악할 수 있을 뿐 아니라 원치 않는 편향과 할루시네이션을 줄이는 데 도움이 되도록 더 세부적으로 제어할 수 있게 됩니다.

작업자 생산성을 높일 수 있는 방식 찾기

생성형 AI는 아직 시작 단계에 있지만, 반복적인 작업에 드는 시간과 에너지를 줄이고 이를 더 의미 있고 가치 있는 작업에 할애하는 데 이미 큰 도움이 되고 있습니다.

마케터들은 맥락과 관련성이 높고 매력적인 콘텐츠 초안을 단 몇 분 만에 만들 수 있는 방법을 발견하고 있습니다. 또한 개발자들은 생성형 AI 어시스턴트를 통해 AI 기반 코드 생성, 코드 완성, 디버깅 등의 작업을 수행하며 생산성을 대폭 높이고 있습니다. 고객센터 상담사들 역시 생성형 AI 인터페이스와 AI 생성 요약의 도움으로 처리 시간을 줄여 업무가 더욱 간편해지고 고객에게 더 나은 서비스를 제공할 수 있게 되었습니다.

점점 더 많은 조직에서 생성형 AI 도입을 이어가고 있는 가운데, 작업자들이 필요한 지식과 기술을 갖추고 이러한 모델과 기술을 최대한 활용하도록 하는 것이 그 어느 때보다도 중요해졌습니다. 교육 프로그램에 투자하거나 생성형 AI 관련 Google Cloud Skills Boost와 같은 무료 리소스를 살펴보면 직원들이 편향되거나 잘못된 출력 등의 일반적인 문제를 피하면서 알맞은 입력값을 설계하고 미세 조정하는 방법을 배우는 데 도움을 얻을 수 있습니다.

직원들이 각자의 인사이트와 업종 전문성을 바탕으로 생성형 AI를 사용하고 여기에 조직 데이터를 통합한다면, 이전의 성과가 어떤 수준이었는지에 관계없이 직원들의 역량이 대폭 개선될 것입니다. 하지만 도구를 보유하기만 해서는 모든 직원 또는 부서에 동일한 효과를 기대할 수 없습니다.

그보다는 Google Cloud의 생성형 AI 학습 과정과 같은 무료 과정이나 교육에 투자하는 것에서 가장 큰 효과를 기대해 볼 수 있습니다. 고도로 숙련된 직원이 창출하는 가치는 프롬프터로서의 개인적인 생산성을 넘어 비즈니스 전체에 영향을 끼치며, 생성형 AI 시대의 성공과 성장을 견인합니다.

도입부 이미지는 Google Cloud 기반 Midjourney에서 '여러 성별과 인종의 엔지니어들이 생각과 아이디어로 둘러싸인 모습을 만화 형식으로 표현'이라는 프롬프트를 사용하여 제작했습니다. (하지만 말처럼 쉬운 작업이 아니었어요! 제대로 된 결과를 얻기 위해 오랜 시간 동안 수많은 시도 끝에 얻은 이미지랍니다.)