[Show HN] Semble: grep 대비 토큰 사용량을 98% 절감한 AI 에이전트용 코드 검색 도구

MinishLab이 공개한 'Semble'은 AI 에이전트용 코드 검색 도구로, 기존 grep 방식 대비 토큰 사용량을 약 98% 절감하며 CPU 환경에서 250ms 이내의 초고속 인덱싱을 지원합니다. NDCG@10 기준 0.854의 높은 정확도를 기록하며, Claude Code와 Cursor 등 주요 AI 도구와 MCP 서버를 통해 연동 가능합니다.

AI 요약

MinishLab에서 개발한 Semble은 AI 에이전트가 거대한 코드베이스를 효율적으로 탐색하고 이해할 수 있도록 설계된 경량 코드 검색 라이브러리입니다. 기존의 'grep 후 파일 전체 읽기' 방식이 발생시키는 막대한 토큰 소모와 지연 시간 문제를 해결하기 위해, 자연어 쿼리에 최적화된 스니펫 추출 방식을 채택했습니다. 이 도구는 별도의 GPU나 외부 API 키 없이 오직 CPU만으로 구동되며, 기존 코드 전용 트랜스포머 모델보다 인덱싱은 200배, 쿼리는 10배 더 빠른 성능을 보여줍니다. 검색 품질 면에서도 트랜스포머 모델의 99% 수준에 도달하여 성능과 효율성이라는 두 마리 토끼를 잡았습니다. 현재 MCP(Model Context Protocol) 서버를 지원하여 Claude Code, Cursor, Codex 등 다양한 AI 에이전트 환경에 즉시 통합할 수 있다는 점이 큰 강점입니다.

핵심 인사이트

  • 토큰 효율성: 기존 grep 및 파일 읽기 방식 대비 AI 에이전트의 토큰 사용량을 약 98% 절감하여 운영 비용 최적화.
  • 탁월한 성능: 평균적인 코드 저장소 인덱싱에 약 250ms, 쿼리 처리에는 1.5ms가 소요되는 초고속 아키텍처 구현.
  • 검색 정확도: NDCG@10 지표에서 0.854를 기록하며 대규모 코드 전문 모델과 대등한 수준의 검색 품질 증명.
  • 완전 로컬 구동: 외부 서비스나 API 연결 없이 CPU에서 독립적으로 실행되어 코드 보안 및 프라이버시 강화.

주요 디테일

  • MCP 서버 연동: Claude Code(claude mcp add), Cursor, OpenCode 등 주요 에이전트 프레임워크와 드롭인(Drop-in) 방식으로 호환.
  • 설치 및 배포: pip install semble 또는 uv를 통해 간편하게 설치 가능하며 Python API와 CLI 환경 모두 지원.
  • 실시간 인덱싱: 로컬 파일의 변경 사항을 자동으로 감시(Watch)하고 인덱스를 최신 상태로 유지하는 기능 포함.
  • 절감 수치 시각화: semble savings 명령어를 통해 사용자가 실제로 절약한 토큰의 양을 직접 확인 가능.
  • 유연한 소스 지원: 로컬 파일 경로뿐만 아니라 원격 Git URL을 직접 입력받아 즉시 인덱싱 및 검색 수행 가능.

향후 전망

  • 비용 최적화 가속: AI 에이전트 활용 시 발생하는 토큰 비용이 기업의 주요 부담인 만큼, Semble과 같은 효율화 도구가 에이전트 스택의 필수 요소가 될 것으로 보임.
  • 로컬 AI 개발 환경 강화: 고성능 GPU 없이도 대규모 코드베이스를 다룰 수 있게 됨에 따라 개인 개발자 및 중소규모 팀의 AI 도입 문턱이 낮아질 전망.
출처:hackernews
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...