AI 요약
WebMCP API는 웹 개발자가 자신의 애플리케이션 로직을 AI 에이전트, 브라우저 에이전트 및 보조 기술이 직접 호출할 수 있는 '도구(tools)'로 정의할 수 있게 해주는 새로운 자바스크립트 인터페이스입니다. 기존의 Model Context Protocol(MCP)이 주로 백엔드에서 구현되었던 것과 달리, WebMCP는 브라우저의 클라이언트 측 스크립트에서 이를 구현하여 사용자와 에이전트가 동일한 인터페이스 내에서 협업할 수 있는 환경을 제공합니다. 개발자는 자연어 설명과 구조화된 스키마를 가진 자바스크립트 함수를 등록할 수 있으며, 이를 통해 AI는 웹 페이지의 기능을 능동적으로 수행할 수 있습니다. 이 제안은 Navigator 인터페이스를 확장하여 modelContext 속성을 추가하고, 도구의 등록, 관리 및 해제를 위한 명확한 메서드를 정의하고 있습니다. 결과적으로 OpenAI의 ChatGPT, Anthropic의 Claude, Google의 Gemini와 같은 주요 AI 플랫폼들이 웹 브라우저 내에서 더욱 긴밀하게 작동할 수 있는 기술적 토대를 마련하고자 합니다.
핵심 인사이트
- 인터페이스 확장: 표준
Navigator인터페이스에[SecureContext]및SameObject속성을 가진modelContext읽기 전용 속성이 추가됩니다. - 클라이언트 중심 MCP: 기존 백엔드 기반 MCP 서버 구조를 브라우저 내 클라이언트 측 스크립트로 가져와 보안과 사용자 제어권을 강화했습니다.
- 주요 플랫폼 지원: OpenAI ChatGPT, Anthropic Claude, Google Gemini 등 대형 언어 모델(LLM) 기반의 AI 플랫폼 에이전트와의 상호작용을 목표로 합니다.
- 도구 관리 메서드:
provideContext,clearContext,registerTool,unregisterTool등 4가지 주요 메서드를 통해 AI 도구의 생명주기를 관리합니다.
주요 디테일
- 자연어 기반 도구 정의: 각 도구는 AI가 이해할 수 있는 자연어 설명(natural language descriptions)과 구조화된 스키마(structured schemas)를 포함해야 합니다.
- 보안 요구사항: WebMCP 인터페이스는
SecureContext(HTTPS 등 보안 환경)에서만 노출되도록 설계되어 보안 및 개인정보 보호를 고려했습니다. - 오류 처리 메커니즘:
registerTool호출 시 중복된 이름의 도구가 있거나inputSchema가 유효하지 않을 경우 오류를 발생시키도록 규정되어 있습니다. - ModelContextOptions:
provideContext메서드 사용 시tools시퀀스를 포함하는 딕셔너리를 통해 여러 도구를 한 번에 일괄 등록할 수 있습니다. - 브라우저 에이전트 개념: 브라우저에 내장되거나 확장 프로그램(Extension), 플러그인 형태로 호스팅되는 브라우저 에이전트와의 연동을 지원합니다.
향후 전망
- 에이전트 워크플로우 대중화: 웹 앱 자체가 AI의 도구 상자가 됨에 따라 사용자의 목적을 이해하고 행동을 대행하는 '에이전틱(agentic)' 워크플로우가 가속화될 것입니다.
- 표준화 논의 가속: 해당 제안이 Web Machine Learning 커뮤니티 그룹을 중심으로 표준화될 경우, 웹 브라우저가 AI 에이전트의 핵심 운영체제 역할을 수행하게 될 전망입니다.
