CLI를 통한 MCP 비용 절감 방법

AI 에이전트에서 MCP(Model Context Protocol)는 모든 도구 명세를 세션 시작 시 JSON 스키마로 주입하여 토큰 비용을 낭비하지만, CLI 방식을 사용하면 토큰 사용량을 약 94% 절감할 수 있습니다. 2026년 2월 23일 Kan Yilmaz는 MCP 서버를 CLI로 변환하는 오픈소스 프로젝트 'CLIHub'를 공개하며 Anthropic의 Tool Search(85% 절감)보다 효율적인 대안을 제시했습니다.

AI 요약

현재 MCP 기반 AI 에이전트는 도구가 가용한 모든 정보를 세션 시작 시 JSON 스키마 형태로 대화에 포함시키며 과도한 '지침 매뉴얼 세금(Instruction manual tax)'을 지불하고 있습니다. 개발자 Kan Yilmaz는 2026년 2월 23일 발표한 게시글에서 MCP 대신 CLI(명령줄 인터페이스)를 활용하면 도구의 이름과 위치만 먼저 로드하는 '지연 로딩(Lazy Loading)' 방식을 통해 비용을 획기적으로 낮출 수 있다고 설명합니다. 6개 서버와 84개 도구를 갖춘 표준 설정에서 분석한 결과, CLI 방식은 MCP 대비 전체 토큰 사용량을 약 94% 절감하는 효과를 보였습니다. 이는 Anthropic의 전용 기능인 'Tool Search'가 제공하는 85% 절감 효과보다 우수할 뿐만 아니라, 특정 모델에 종속되지 않고 모든 LLM에서 작동한다는 강력한 범용성을 가집니다. 작성자는 이를 위해 MCP 서버를 단일 명령어로 CLI로 변환할 수 있는 오픈소스 컨버터와 디렉토리인 'CLIHub'를 구축하여 배포했습니다.

핵심 인사이트

  • CLI 방식은 도구 전체 스키마를 미리 로드하지 않고 필요할 때만 호출함으로써 MCP 대비 토큰 사용량을 약 94% 절감합니다.
  • Anthropic의 Tool Search는 토큰 사용량을 85% 줄여주지만, 특정 모델 전용이며 검색 시마다 3~5개의 도구 정보를 로드하여 CLI보다 비용이 많이 발생합니다.
  • 분석의 기준은 **6개의 MCP 서버와 서버당 14개의 도구(총 84개)**를 포함하는 일반적인 워크플로우를 가정했습니다.
  • 작성자는 MCP를 CLI로 자동 변환해주는 오픈소스 도구와 에이전트 전용 CLI 저장소인 **'CLIHub'**를 공개했습니다.

주요 디테일

  • MCP는 모든 도구, 매개변수, 옵션을 JSON 스키마로 즉시 덤프하지만, CLI는 이름과 위치만 담긴 가벼운 목록으로 시작합니다.
  • 에이전트가 도구 세부 정보가 필요할 때만 --help 명령어를 실행하며, 이때 약 14개 도구 기준 600개 토큰 분량의 참조 정보를 호출합니다.
  • Anthropic Tool Search의 경우 세션 시작 시 약 500개 토큰, 검색당 약 3,000개 토큰, 호출당 30개 토큰이 소비되는 것으로 분석되었습니다.
  • CLIHub는 기존 MCP의 동일한 도구 로직, OAuth 인증, API 구조를 그대로 유지하면서 호출 인터페이스만 효율적으로 변경합니다.
  • 이 기술은 Openclaw의 'available_skills' 블록 형식을 활용하여 CLI 환경에 최적화된 포맷을 제공합니다.

향후 전망

  • Anthropic과 같은 특정 벤더에 종속되지 않는 오픈소스 기반의 비용 최적화 솔루션이 AI 에이전트 개발 시장에서 중요해질 것입니다.
  • 대규모 도구 카탈로그를 보유한 기업들이 AI 운영 비용 절감을 위해 MCP를 CLI나 지연 로딩 인터페이스로 전환하려는 시도가 늘어날 것으로 예상됩니다.
Share

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...