AI 요약
구글이 오프라인 환경에서도 강력한 성능을 발휘하는 AI 받아쓰기 앱인 'Google AI Edge Eloquent'를 iOS 플랫폼에 조용히 선보였습니다. 이 앱은 구글의 경량 AI 모델인 Gemma 기반의 자동 음성 인식(ASR) 기술을 활용하여, 인터넷 연결 없이도 기기 자체적으로 실시간 전사를 수행할 수 있는 것이 가장 큰 특징입니다. 기존 받아쓰기 도구들이 말실수나 추임새를 그대로 기록하는 것과 달리, Eloquent는 AI를 통해 사용자의 의도를 파악하고 "음", "아"와 같은 필러 단어를 자동으로 제거하여 정제된 텍스트를 출력합니다. 또한 사용자의 Gmail 데이터를 활용해 전문 용어나 고유 명사를 학습하며, 클라우드 모드 활성 시 제미나이(Gemini) 모델을 통한 고도화된 문장 교정 기능도 지원합니다. 현재 iOS에서 무료로 이용 가능하며, 향후 안드로이드 버전 출시와 함께 시스템 기본 키보드 통합 등 더 깊은 수준의 서비스 확장이 기대되고 있습니다.
핵심 인사이트
- 출시 정보: 2026년 4월 6일, 구글은 Wispr Flow 및 SuperWhisper와 경쟁하기 위해 오프라인 우선 AI 받아쓰기 앱 'Google AI Edge Eloquent'를 iOS용으로 무료 출시함.
- 기술 스택: 기기 내 로컬 처리를 위해 Gemma 기반 ASR 모델을 사용하며, 클라우드 모드에서는 제미나이(Gemini) 모델을 사용하여 텍스트 클린업 및 편집을 수행함.
- 사용자 맞춤화: Gmail 계정에서 특정 키워드, 이름, 전문 용어(Jargon)를 가져오거나 사용자가 직접 커스텀 단어를 추가하여 인식 정확도를 높일 수 있음.
- 편집 및 변환 기능: 전사된 텍스트를 '요점(Key points)', '정중하게(Formal)', '짧게(Short)', '길게(Long)' 등 4가지 스타일로 즉시 변환하는 옵션을 제공함.
주요 디테일
- 자동 필터링: 사용자가 말을 멈추면 "um", "ah"와 같은 불필요한 추임새와 중간 문장 수정 사항을 AI가 자동으로 삭제하고 매끄러운 산문 형태로 출력함.
- 통계 및 관리: 전사 세션 히스토리 저장 기능을 제공하며, 분당 단어 수(WPM)와 총 발화 단어 수 등 사용자의 말하기 통계 데이터를 표시함.
- 안드로이드 통합 예고: 앱 설명에 따르면 안드로이드 버전은 시스템 기본 키보드로 설정 가능하며, 화면 어디서나 접근 가능한 '플로팅 버튼' 기능을 지원할 예정임.
- 인터페이스: 실시간 전사 화면 하단에 변환 옵션 버튼들을 배치하여 직관적인 텍스트 편집 환경을 구축함.
- 로컬 우선 주의: 사용자가 클라우드 모드를 끄고 로컬 전용 프로세싱을 선택할 수 있도록 하여 데이터 프라이버시를 강조함.
향후 전망
- 생태계 확장: 이 실험적인 앱이 성공할 경우, 구글은 안드로이드 OS 전반에 걸쳐 더욱 향상된 기본 AI 전사 기능을 통합할 것으로 보임.
- AI 받아쓰기 시장 경쟁: 전용 하드웨어나 유료 구독 기반의 경쟁사들 사이에서 구글이 무료 모델을 앞세워 시장 점유율을 빠르게 확대할 가능성이 높음.
