AI 에이전트의 핵심 개념

AI 에이전트는 수동적인 챗봇에서 추론하고, 기업 도구를 사용하며, 복잡한 워크플로를 실행할 수 있는 자율 시스템으로 진화했습니다.

AI 에이전트의 엄청난 잠재력을 활용하고 실험적인 사용 사례와 프로토타입에서 측정 가능한 ROI를 창출하는 강력한 엔터프라이즈급 시스템으로 전환하려면 구성요소를 이해하는 것이 도움이 됩니다. 여기에서는 다음을 포함한 AI 에이전트의 핵심 개념을 살펴봅니다.

모델: 에이전트가 사고하는 데 사용하는 추론 엔진
그라운딩: 사실 정확성과 지식 검색을 위한 메커니즘이 되는 기술 자료
도구: 에이전트가 수행할 수 있는 작업을 결정하는 작업 수행을 위해 정의된 기능
데이터 아키텍처: 에이전트가 메모리와 데이터를 저장하는 위치
조정: 에이전트가 다단계 작업에서 모든 부분을 계획하고 연결하는 방법
런타임: 에이전트가 상주하고 대규모로 실행되는 곳

모델

모델을 에이전트의 두뇌라고 생각하면 됩니다. 요청을 읽고 이해하며, 필요한 작업을 파악하고, 스마트한 대답을 생성합니다.

적절한 모델을 선택하려면 사용 사례에 맞는 기능, 속도, 비용의 균형을 맞춰야 합니다. 목표는 원시적인 힘을 극대화하는 것이 아니라 효율성을 위해 최적화하는 것입니다. 가장 흔한 실수는 사용 사례에 필요하지 않은 기능에 과도하게 투자하여 비효율적인 지출과 성능 저하를 초래하는 것입니다.

강력한 인지 아키텍처는 특정 하위 작업에 가장 간결한 모델을 동적으로 선택하는 여러 전문 에이전트를 사용합니다. 마치 전문가 팀이 대기하고 있는 것과 같습니다. 작업에 따라 서로 다른 전문가에게 지능적으로 작업이 라우팅됩니다. 예를 들어 복잡한 계획 및 추론과 같은 어려운 작업에는 강력한 모델이 사용되고, 사용자 의도 분류와 같은 더 간단하고 대량의 작업은 더 빠르고 비용 효율적인 모델로 라우팅됩니다. 이러한 동적 모델 라우팅은 성능과 비용을 모두 최적화하는 데 핵심적인 역할을 합니다.

선택할 수 있는 광범위한 모델 세트와 구성 가능한 추론 모드를 제공함으로써 개발자는 정교한 최적화를 위한 동적인 레버를 확보할 수 있습니다. 이 모든 것이 특정 비즈니스 및 기술 요구사항을 충족하기 위해 전체 멀티 에이전트 시스템의 비용과 성능을 조정하는 데 도움이 됩니다.

비용-지연 시간-품질 요구사항에 맞는 모델을 선택한 후에는 모델을 파인 튜닝할 수 있는 옵션이 제공될 수 있습니다. 이 기능은 특정 비즈니스 요구사항에 맞게 지식과 스타일을 전문화하는 작업으로, 사용자가 직접 선별한 고품질 예시 데이터 세트를 사용하여 수행됩니다. 모델이 파인 튜닝을 허용하고 지원하는지 알아보려면 모델의 문서와 라이선스 계약을 검토하세요.

심층 분석: 엔터프라이즈 에이전트 빌드

모델 선택을 실제로 적용해 볼 준비가 되셨나요? 강력한 인지 아키텍처 내에서 보안, 안정성, 효율성의 균형을 맞추는 방법을 알아보세요.

엔터프라이즈 멀티 에이전트 시스템 빌드를 위한 기술 가이드를 확인하세요.

고급 기능 사용 팁

중앙 집중식 플랫폼을 사용하여 파운데이션 모델을 탐색, 맞춤설정, 배포합니다. 세계 최고의 모델을 엄선하여 제공하고, 클릭 한 번으로 배포할 수 있으며, 처음부터 엔터프라이즈급 보안을 제공하는 모델을 찾아보세요.

그라운딩

에이전트의 신뢰성과 유용성은 검증 가능한 사실에 기반하여 정확하고 신뢰할 수 있는 답변을 제공하는 능력에 달려 있습니다. 바로 이 지점에서 그라운딩이 중요해집니다. 에이전트를 비즈니스 데이터에 깊이 있고 정확하게 그라운딩된 진정한 워크플로 자동화 도구로 전환합니다.

그라운딩에는 세 가지 고려사항이 있습니다.

1. RAG: 기본이 되는 첫 번째 단계

에이전트의 신뢰성은 검증 가능한 사실에 기반한 답변을 제공하는 능력과 관련이 있습니다. 검색 증강 생성(RAG)은 에이전트를 검증 가능한 실시간 데이터 소스에 연결하여 에이전트가 할루시네이션이 아닌 사실에 기반해 행동하도록 보장합니다.

이 간단한 검색 후 생성 프로세스는 텍스트, 이미지, 기타 유형의 데이터에 적용할 수 있습니다. 대규모 데이터 세트를 빛의 속도로 검색하여 신속하고 시의적절한 의사 결정을 내릴 수 있습니다.

RAG는 질문에 답하는 데 도움이 되지만 데이터 포인트 간의 관계를 더 깊이 이해해야 하는 복잡한 쿼리에는 부족합니다.

2. GraphRAG: 더 스마트한 그라운딩

GraphRAG는 지식 그래프의 데이터 포인트 간 명시적 관계를 이해하고 다른 데이터 소스와의 상호 연결을 더 잘 반영하는 컨텍스트 데이터를 검색하여 그라운딩을 보강합니다. 따라서 에이전트는 유사한 문구를 일치시키는 대신 개념 간의 관계를 이해합니다.

중요한 점은 지식 그래프를 통해 비즈니스 로직을 직접 제어할 수 있다는 것입니다. 표준 RAG는 모델에서 생성된 패턴에 의존하지만, 지식 그래프를 사용하면 항목 간의 구체적인 관계를 정의하고 관리하여 에이전트가 조직의 고유한 분류 체계와 규칙을 준수하도록 할 수 있습니다. 최대한의 안정성을 확보하기 위해 선도적인 조직은 표준 RAG의 광범위한 검색과 GraphRAG의 정밀도 및 제어 기능을 결합한 하이브리드 접근방식을 사용합니다.

사용 사례

서로 다른 소스의 데이터를 구조화된 방식으로 표시

금융 서비스 기업은 지식 그래프를 사용하여 분석가 보고서, 실적 발표, 위험 평가 등에 대한 통합된 뷰를 분석가에게 제공합니다. 이처럼 풍부하고 상호 연결된 데이터 웹은 분석가가 복잡한 공급망 종속성, 경쟁사 간에 겹치는 이사회 구성원, 복잡한 지정학적 위험에 대한 노출 등 이전에는 숨겨져 있던 인사이트를 발견하는 데 도움이 됩니다.

3. 에이전트형 RAG: 동적 추론 및 검색

그라운딩에 대한 가장 강력한 접근방식은 에이전트가 더 이상 수동적으로 정보를 받는 것이 아니라 검색 프로세스 자체에 적극적으로 참여하여 추론하는 에이전트형 RAG입니다. 에이전트형 RAG를 사용하면 에이전트가 복잡한 쿼리를 분석하고, 다단계 계획을 수립하고, 여러 도구 호출을 순차적으로 실행하여 최적의 정보를 찾을 수 있습니다. 이는 기존 검색을 대체하는 것이 아니라 기존 RAG 및 지식 그래프 인프라 위에 고급 추론을 계층화하여 멀티홉 쿼리를 해결하는 것입니다.

다양한 데이터 유형을 인지하고 추론할 수 있는 이 능력은 에이전트를 데이터 처리기에서 세상을 더 완전한 방식으로 이해하고 상호작용하는 문제 해결 도구로 탈바꿈시킵니다. 개발자는 에이전트가 능동적으로 추론에 참여하도록 지원함으로써 차세대 에이전트 기능을 정의하는 복잡한 다단계 쿼리와 장기적인 작업을 실행할 수 있는 시스템을 빌드할 수 있습니다.

고급 기능 사용 팁

검색 및 재정렬 접근방식 사용

'검색 및 재정렬' 접근방식을 사용하여 재현율(모든 관련 문서 찾기)과 정밀도(검색된 문서가 관련성이 있는지 확인) 간의 균형을 맞춥니다. 이 접근방식은 재현율 범위를 넓혀 필요 이상의 많은 문서를 검색합니다. 이 더 큰 세트는 LLM 또는 전문 재정렬 서비스로 전달되며, 이 서비스는 가장 관련성이 높은 문서를 식별하고 관련이 없거나 의미상 반대되는 문서를 폐기합니다.

참고

파인 튜닝은 그라운딩이 아닙니다. 파인 튜닝은 모델의 스타일을 조정하고 특정 작업에 대한 지식을 개선합니다. 그라운딩은 모델을 실시간으로 검증 가능한 데이터 소스에 연결하여 응답이 사실에 기반해 정확하도록 합니다.

도구

도구는 에이전트가 핵심 추론 모델의 기본 기능보다 더 많은 작업을 수행할 수 있도록 지원하는 정의된 기능입니다. 간단한 내부 계산을 수행하는 것부터 API 호출을 사용하여 외부 시스템과 상호작용하는 것까지, 도구는 에이전트의 추론과 행동 능력 사이의 간극을 메워줍니다. 그라운딩은 에이전트가 새로운 정보를 검색하는 주요 방법이므로 기술적으로 에이전트 툴킷에서 가장 기본적인 도구입니다.

도구에는 다음이 포함될 수 있습니다.

내부 함수 및 서비스: 비즈니스별 문제를 해결하기 위해 자체 팀에서 작성한 독점적인 로직 또는 특수 코드입니다.
외부 API: 에이전트가 실제 환경에서 작업을 실행할 수 있도록 서드 파티 서비스에 안전하게 연결합니다.
데이터 검색 및 그라운딩: 데이터베이스를 동적으로 쿼리(자연어에서 SQL로 변환 포함)하거나 벡터 저장소를 검색하거나 엔터프라이즈 기술 자료에 액세스하는 기능입니다. 간단한 검색이든 복잡한 데이터베이스 쿼리든 이러한 도구를 사용하면 에이전트의 작업이 검증 가능한 데이터를 기반으로 이루어집니다.
에이전트 협업: 더 정교한 시스템에서는 하나의 에이전트가 다른 전문 에이전트와 협업하여 문제를 해결할 수 있습니다. 에이전트는 특정 작업에 대한 '도구'로 사용될 수 있지만, 가장 강력한 엔터프라이즈 시스템은 에이전트를 다양한 도메인에서 안전하게 작업을 조정하는 협업자로 취급합니다.

데이터 아키텍처

에이전트는 작업에 따라 다양한 유형의 메모리를 사용합니다. 강력한 엔터프라이즈 데이터 아키텍처는 장기적인 지식 검색을 위한 영구 스토리지, 단기적인 대화 컨텍스트를 위한 짧은 지연 시간 액세스, 트랜잭션 감사를 위한 내구성 있는 원장이라는 세 가지 고유한 요구사항을 충족해야 합니다.

1. 장기 기술 자료(그라운딩 및 메모리)

장기 메모리는 에이전트의 인텔리전스, 그라운딩, 개인화의 기반이 되며, 실시간 대화의 빠르고 단기적인 컨텍스트와는 다릅니다. 이 아키텍처에는 다음 세 가지 핵심 구성요소가 있습니다.

사실 기반 검색 증강 생성(RAG)을 위한 구조화된 기술 자료
추출된 사용자 메모리를 저장하는 영구 스토리지. 에이전트는 모든 과거 상호작용을 저장하는 대신 사용자, 팀 또는 작업에 대한 중요한 사실을 생성하고 저장하여 지속적이고 맞춤화된 경험을 제공합니다.
대화 스크립트 및 워크플로 상태와 같은 원시 데이터를 위한 운영 데이터 레이크로, 더 복잡한 인지 프로세스 및 미래 분석을 지원합니다.

사용 사례

모든 관련 정보에 대한 액세스 권한 획득

법률 에이전트는 판례, 내부 정책 문서, 교육 매뉴얼을 즉시 검색하여 법률을 준수하는 계약서 초안을 작성합니다.

2. 작업 메모리(대화 컨텍스트 및 단기 상태)

이 계층은 진행 중인 작업이나 대화에 필요한 임시 정보(LLM 컨텍스트 윈도우)를 관리합니다. 반응성이 뛰어난 사용자 환경을 유지하려면 수행되는 반복적인 일련의 작업과 관찰에 대해 지연 시간이 매우 짧은 액세스를 제공해야 합니다.

사용 사례

유용한 대화

고객 지원 에이전트는 다단계 문제 해결 흐름의 상태를 유지하며, 사용자가 이전에 제공한 일련번호나 진단 단계를 기억하여 반복을 방지합니다.

3. 트랜잭션 메모리(상태 관리 및 작업 감사)

이 계층은 strong consistency와 무결성으로 작업과 상태 변경사항을 기록하는 역할을 합니다. 이는 보안 관점에서 필수적이며 모든 에이전트 기반 작업에 대해 거부할 수 없는 감사 추적을 제공하는 견고한 기록 시스템 역할을 합니다.

사용 사례

내구성 있는 원장 유지

공급망 에이전트는 복잡한 다자간 구매 주문의 성공적인 실행을 기록하여 금융 시스템 전반에서 거래를 영구적으로 추적하고 검증할 수 있도록 합니다.

조정

조정은 에이전트를 다단계 작업으로 안내하는 운영 핵심입니다. 단일 작업 이상이 필요한 프로세스의 경우 필요한 도구, 순서, 최종 목표를 달성하기 위해 출력을 결합하는 방법을 결정합니다.

에이전트의 실행 기능인 조정은 복잡한 비즈니스 프로세스를 자동화하는 정교한 시스템을 만드는 데 핵심적인 역할을 합니다. 이전에는 기술적으로 실현 불가능했던 문제를 해결할 수 있게 되어 궁극적으로 새로운 종류의 애플리케이션과 사용자 경험을 구현할 수 있습니다.

일반적이고 효과적인 조정 패턴은 ReAct(추론 + 행동)입니다. 이 프레임워크는 대규모 언어 모델의 추론 및 행동 기능이 시너지 효과를 내도록 결합하고 모델이 추론 trace(생각)와 작업별 행동을 번갈아 생성하는 동적 멀티턴 루프를 설정합니다.

ReAct를 사용하면 추론은 모델이 행동 계획을 추적하고 업데이트하는 데 도움이 되며, 행동은 외부 도구에서 정보를 수집하여 추론 프로세스에 정보를 제공합니다. 작동 방식은 다음과 같습니다.

추론: 에이전트는 목표와 현재 상태를 평가하여 최적의 다음 단계와 도구의 필요 여부에 대한 가설을 세웁니다.
행동: 에이전트가 적절한 도구를 선택하고 호출합니다.
관찰: 에이전트가 도구에서 출력을 수신합니다. 이 새로운 정보는 에이전트의 컨텍스트에 통합되어 주기의 다음 추론 단계로 공급됩니다.

사용 사례

부서 간 HR 자동화

신규 직원을 온보딩하기 위해 에이전트는 여러 시스템에서 순차적으로 작업을 시작합니다. 먼저 시스템에 직원 기록을 생성한 다음 IT 에이전트에 API 호출을 트리거하여 하드웨어와 네트워크 사용자 인증 정보를 프로비저닝하고 마지막으로 필요한 지역별 규정 준수 교육 모듈에 직원을 등록합니다.

선제적인 공급망 해결

배송 중단을 자동으로 감지하고 해결하기 위해 에이전트는 주요 단계를 따르도록 조정됩니다. 먼저 모니터링 알림이 도구를 트리거하여 대체 공급업체를 쿼리합니다. 그런 다음 시뮬레이션 도구를 실행하여 공급업체 전환과 배송 지연의 비용 편익을 계산합니다. 마지막으로 인간 참여형(Human-In-The-Loop)의 승인을 받으면 물류 에이전트에 새 구매주문서를 제출하는 작업을 실행합니다.

런타임

기능 에이전트 프로토타입을 프로덕션 환경에 대규모로 배포하려면 그라운딩, 도구, 메모리, 세션 등을 위한 일관된 서비스 시스템과 통합된 강력한 런타임 인프라가 필요합니다. 이를 통해 에이전트는 글로벌 엔터프라이즈 성장의 복잡한 요구사항을 처리할 수 있는 안전한 고성능 생태계 내에서 운영할 수 있습니다.

프로덕션급 런타임 환경에는 다음이 필요합니다.

확장성: 인프라는 0에서 수백만 개의 요청에 이르는 가변적인 부하를 처리하기 위해 자동으로 확장되어야 합니다. 여기에는 요청 기반 부하 분산과 리소스 기반 자동 확장이 모두 포함되어 있어 컴퓨팅 수요를 효율적으로 관리할 수 있습니다.

보안 및 제어: 플랫폼은 사용자 및 에이전트의 ID, 조직 정책, 도구 및 에이전트 레지스트리, 네트워크 액세스 제어, 보안 통신 채널(예: TLS)을 관리하여 에이전트와 에이전트가 액세스하는 데이터를 보호하는 안전한 실행 환경을 제공해야 합니다.

안정성 및 관측 가능성: 시스템에는 오류 처리 및 지속적인 모니터링을 위한 메커니즘이 포함되어야 합니다. 복잡한 디버깅을 위해서는 런타임이 에이전트의 추론 및 도구 호출을 단계별로 기록한 충실도 높은 실행 trace를 캡처해야 합니다. 이를 통해 의사 결정의 전체 과정을 파악할 수 있으므로 예상치 못한 오류가 발생할 경우 팀에서 '왜?'라는 질문에 명확하게 답할 수 있습니다. 높은 수준의 감독을 위해 시스템에는 작업 완료, 사용자 의견에 대한 측정항목이 포함되어야 합니다. 시뮬레이션 및 평가를 통한 자동화는 프로덕션 배포 전후에 신뢰를 제공합니다.

AI 에이전트를 빌드, 확장, 제어하는 방법을 알아보세요.

Google Cloud의 엔터프라이즈용 멀티 에이전트 시스템 가이드에서는 엔터프라이즈의 견고성을 유지하면서 효율적이고 확장 가능하며 안전한 AI 기반 솔루션을 빌드하는 방법을 보여줍니다.