AI 요약
웹 애플리케이션 'InspirationCat'은 업로드된 고양이 사진에서 AI를 통해 배경을 제거하고 다양한 템플릿과 합성해주는 서비스로, 출시 첫날에만 50만 건의 접속자가 몰리는 대성공을 거두었습니다. 일반적으로 AI 모델을 구동하기 위해서는 고가의 GPU 서버가 필요하지만, 이 서비스는 'ONNX Runtime Web' 기술을 사용해 AI 연산을 서버가 아닌 사용자 브라우저(WebAssembly/WebGPU)에서 직접 실행하도록 설계했습니다. 이를 통해 서버 부하를 원천적으로 차단했으며, 정적 사이트 호스팅 서비스인 'Cloudflare Pages'의 무료 플랜을 활용해 운영 비용을 제로화했습니다. 또한, 이미지를 서버에 저장하지 않는 구조를 택해 개인정보 보호와 스토리지 관리 문제를 동시에 해결하며 기술적 효율성을 극대화한 사례로 평가받고 있습니다.
핵심 인사이트
- 서버 비용 0원 달성: 50만 접속과 1TB 이상의 잠재적 트래픽에도 불구하고 Cloudflare Pages 무료 플랜을 통해 비용 발생 없음.
- 클라이언트 사이드 AI 실행: 약 40MB 크기의 AI 모델을 사용자 단말기로 다운로드하여 실행하는 'ONNX Runtime Web' 방식 도입.
- 타 서비스 대비 비용 절감: 동일 트래픽을 Vercel에서 처리했을 시 약 54,000엔, AWS Lambda+S3 환경에서는 월 약 17,000엔 이상의 비용이 발생했을 것으로 추산.
- 데이터 최적화: 템플릿 이미지를 PNG(5.6MB)에서 WebP(80KB)로 전환하여 총 전송 데이터를 2.8TB에서 40GB 수준으로 98% 이상 절감.
주요 디테일
- 기술 스택: React 등의 프레임워크를 배제하고 Vite, TypeScript, Canvas API만을 사용한 경량 구조로 구축하여 응답 속도 향상.
- 라이브러리 활용: 배경 제거를 위해
@imgly/background-removal라이브러리를 활용, 브라우저 내 로컬 프로세싱 구현. - 저사양 기기 대응: 스마트폰 메모리 부족 시 원본 이미지(1024px)를 768px 또는 512px로 자동 축소하여 안정적인 연산 환경 제공.
- 보안성 강화: 이미지와 EXIF(GPS 정보 등) 데이터를 서버로 전송하지 않아 사용자의 프라이버시를 근본적으로 보호.
- 기획의 시작: 트위터 유저 '무차마루(5)(@neko_muchamaru)'의 고양이 합성 콘텐츠에서 영감을 얻어 제작.
향후 전망
- 엣지 컴퓨팅의 대중화: 고가의 GPU 서버 없이도 웹 브라우저의 자원을 활용한 고성능 AI 서비스 구현 사례가 늘어날 것으로 예상.
- 소규모 개발자의 경쟁력 강화: 클라이언트 사이드 기술 최적화를 통해 자본력이 부족한 개인 개발자도 대규모 트래픽을 견디는 서비스 운영이 가능해질 전망.
