AI 요약
인터컴은 고객 운영 효율화를 위한 AI 에이전트 '오퍼레이터(Operator)'의 내부 기술 구조와 엔지니어링 의사결정 과정을 상세히 공개했다. 이 기사는 단순한 LLM 프로토타입이 실제 프로덕션 환경에서 겪는 한계를 지적하며, 오퍼레이터가 수천 개의 고객 워크스페이스에서 안정적으로 작동하기 위해 구축된 인프라를 설명한다. 특히 모델이 스스로 데이터를 탐색하게 하는 방식 대신, 데이터 추출 및 구조화를 정밀하게 제어하는 '전용 툴링 레이어'를 도입한 점이 핵심이다. 이를 통해 사용자는 '지난주 성과'와 같은 질문에 대해 단순한 데이터 테이블이 아닌, 해당 워크스페이스의 맥락이 반영된 심층적인 분석 결과를 얻을 수 있다. 인터컴은 이 시스템을 통해 단순 AI 챗봇을 넘어 실제 비즈니스 문제를 해결하는 에이전트 시스템의 표준을 제시하고자 한다.
핵심 인사이트
- 오퍼레이터 시스템은 현재 **50개 이상의 개별 도구(Tools)**와 이를 복합적으로 활용하는 **10개의 핵심 스킬(Skills)**로 구성되어 있다.
- 인터컴은 단순 LLM 기반 프로토타입이 보여주는 성능은 전체 프로덕션 시스템 구축 난이도의 **단 10%**에 불과하다고 강조하며, 이를 'LLM 함정(it’s just an LLM trap)'이라고 정의했다.
- 수천 개의 고객 워크스페이스마다 서로 다른 데이터 모델과 사용 패턴을 가진 환경에서도 일관된 성능을 내기 위해 목적 기반 툴링(Purpose-built tooling) 방식을 채택했다.
주요 디테일
- 도구(Tool) vs 스킬(Skill): '도구'는 콘텐츠 검색이나 쿼리 실행 같은 단일 행동을 의미하며, '스킬'은 여러 도구를 체이닝하여 전체 도움말 센터 업데이트나 디버깅 같은 복잡한 과업을 수행하는 단위다.
- 맥락 기반 리포팅: 사용자가 인터컴의 AI 봇인 **'Fin'**의 성과를 물을 때, 시스템은 단순 쿼리 결과를 주는 것이 아니라 해당 워크스페이스에서 어떤 지표가 유의미한지 판단하여 해석된 데이터를 제공한다.
- 엔지니어링 투자: 인터컴은 데모 수준의 프로토타입과 매일 사용하는 프로덕션 시스템 사이의 간극을 메우기 위해 툴링, 추론(Reasoning), 인프라 계층에 심층적인 투자를 진행했다.
- 실행 가능성: 단순한 API 래퍼(Thin wrappers)를 사용하는 대신, 데이터를 어떻게 구조화하고 어떤 맥락을 포함할지 에이전트가 직접 결정하도록 설계되어 실행 가능한 결과물을 도출한다.
향후 전망
- 단순한 텍스트 생성을 넘어 기업의 복잡한 운영 업무를 대행하는 '에이전트 중심(Agent-centric)' 시스템으로의 전환이 가속화될 것이다.
- LLM 자체의 성능보다는 특정 도메인에 최적화된 도구 설계(Tool Engineering)와 추론 구조가 AI 서비스의 핵심 경쟁력이 될 것으로 보인다.
출처:intercom_blog
