AI 요약
더 버지(The Verge)의 주말 편집장 테렌스 오브라이언은 최근 애플 뮤직이 도입한 '플레이리스트 플레이그라운드(Playlist Playground)' 베타 기능을 직접 테스트한 결과, 음악적 맥락을 파악하는 능력이 매우 저조하다고 비판했습니다. 이 기능은 텍스트 프롬프트를 통해 플레이리스트를 생성하지만, 연주곡 요청에 보컬이 포함된 곡을 내놓거나 지리적 위치를 잘못 파악하는 등 기초적인 오류를 반복했습니다. 더욱 심각한 문제는 '아이들에게 적합한(kid-friendly)' 음악 요청에 성적으로 매우 노골적인 가사가 포함된 곡을 추천하는 등 안전성 검증에도 완전히 실패했다는 점입니다. 결과적으로 애플의 AI는 장르, 시간대, 콘텐츠의 적절성 등 모든 핵심 기준에서 유튜브 뮤직 등 경쟁 서비스에 비해 현저히 뒤처지는 성능을 보여주었습니다.
핵심 인사이트
- 지리 및 장르 파악 오류: '미국 남부(American South)' 블랙 메탈 요청에 사우스다코타(South Dakota) 출신 밴드인 'Woman is the Earth'의 곡을 포함하는 등 지리적 정의를 99.9% 확률로 틀리는 오류를 범함.
- 시대적 맥락 부재: '현대(modern)' 힙합 요청 시 1998년에 발매된 키드 카프리(Kid Capri)의 곡을 추천했으며, 생성된 16곡 중 6곡이 15년 이상 된 구곡이었음.
- 심각한 필터링 실패: 아동용 플레이리스트에 Chicken P의 'ABC'와 같이 성행위를 노골적으로 묘사하는 가사가 담긴 곡을 추천하여 플랫폼 신뢰도에 타격을 입힘.
주요 디테일
- 경쟁사 성능 비교: 유튜브 뮤직은 연주곡 프롬프트에 대해 5번째 트랙에서야 가사 곡이 나왔으나, 애플 뮤직은 첫 트랙부터 요청 사항(instrumental)을 위반한 곡을 배치함.
- 데이터 부족 문제: '미국 남부 앰비언트 블랙 메탈'이라는 구체적인 요청에 대해 애플 AI는 단 3곡의 결과물만 찾아내는 한계를 보임.
- 취향 매칭 실패: 사용자가 의도한 'Model/Actriz'나 'Special Interest' 같은 현대 댄스 펑크 밴드 대신, 'Cabaret Voltaire'나 'Einstürzende Neubauten' 같은 올드스쿨 인더스트리얼 음악으로 리스트를 채움.
- 기사 작성 배경: 18년 이상의 경력을 가진 베테랑 에디터 테렌스 오브라이언이 2026년 3월 26일 게시한 테스트 리포트를 바탕으로 함.
향후 전망
- 콘텐츠 세이프티 강화: 아동용 콘텐츠 추천 시 가사 전문을 분석하여 필터링하는 알고리즘의 전면적인 재검토와 수정이 최우선 과제가 될 것으로 보임.
- 메타데이터 정밀화: '현대'나 '지역'과 같은 추상적/상대적 개념을 LLM이 정확히 이해할 수 있도록 음악 메타데이터 학습의 정교화가 요구됨.
