애플의 AI 플레이리스트 생성 기능, 기대 이하의 음악 추천 성능으로 혹평

애플 뮤직의 새로운 AI 기반 '플레이리스트 플레이그라운드' 베타 서비스가 장르 미준수, 시대 착오적 추천, 그리고 부적절한 가사 필터링 실패로 인해 혹평을 받고 있습니다. 특히 '현대 힙합' 추천에 25년 전 곡을 포함하거나 어린이용 리스트에 선정적인 곡을 넣는 등 경쟁사 대비 성능이 현저히 낮은 것으로 분석되었습니다.

AI 요약

더 버지(The Verge)의 주말 편집장 테렌스 오브라이언은 최근 애플 뮤직이 도입한 '플레이리스트 플레이그라운드(Playlist Playground)' 베타 기능을 직접 테스트한 결과, 음악적 맥락을 파악하는 능력이 매우 저조하다고 비판했습니다. 이 기능은 텍스트 프롬프트를 통해 플레이리스트를 생성하지만, 연주곡 요청에 보컬이 포함된 곡을 내놓거나 지리적 위치를 잘못 파악하는 등 기초적인 오류를 반복했습니다. 더욱 심각한 문제는 '아이들에게 적합한(kid-friendly)' 음악 요청에 성적으로 매우 노골적인 가사가 포함된 곡을 추천하는 등 안전성 검증에도 완전히 실패했다는 점입니다. 결과적으로 애플의 AI는 장르, 시간대, 콘텐츠의 적절성 등 모든 핵심 기준에서 유튜브 뮤직 등 경쟁 서비스에 비해 현저히 뒤처지는 성능을 보여주었습니다.

핵심 인사이트

  • 지리 및 장르 파악 오류: '미국 남부(American South)' 블랙 메탈 요청에 사우스다코타(South Dakota) 출신 밴드인 'Woman is the Earth'의 곡을 포함하는 등 지리적 정의를 99.9% 확률로 틀리는 오류를 범함.
  • 시대적 맥락 부재: '현대(modern)' 힙합 요청 시 1998년에 발매된 키드 카프리(Kid Capri)의 곡을 추천했으며, 생성된 16곡 중 6곡이 15년 이상 된 구곡이었음.
  • 심각한 필터링 실패: 아동용 플레이리스트에 Chicken P의 'ABC'와 같이 성행위를 노골적으로 묘사하는 가사가 담긴 곡을 추천하여 플랫폼 신뢰도에 타격을 입힘.

주요 디테일

  • 경쟁사 성능 비교: 유튜브 뮤직은 연주곡 프롬프트에 대해 5번째 트랙에서야 가사 곡이 나왔으나, 애플 뮤직은 첫 트랙부터 요청 사항(instrumental)을 위반한 곡을 배치함.
  • 데이터 부족 문제: '미국 남부 앰비언트 블랙 메탈'이라는 구체적인 요청에 대해 애플 AI는 단 3곡의 결과물만 찾아내는 한계를 보임.
  • 취향 매칭 실패: 사용자가 의도한 'Model/Actriz'나 'Special Interest' 같은 현대 댄스 펑크 밴드 대신, 'Cabaret Voltaire'나 'Einstürzende Neubauten' 같은 올드스쿨 인더스트리얼 음악으로 리스트를 채움.
  • 기사 작성 배경: 18년 이상의 경력을 가진 베테랑 에디터 테렌스 오브라이언이 2026년 3월 26일 게시한 테스트 리포트를 바탕으로 함.

향후 전망

  • 콘텐츠 세이프티 강화: 아동용 콘텐츠 추천 시 가사 전문을 분석하여 필터링하는 알고리즘의 전면적인 재검토와 수정이 최우선 과제가 될 것으로 보임.
  • 메타데이터 정밀화: '현대'나 '지역'과 같은 추상적/상대적 개념을 LLM이 정확히 이해할 수 있도록 음악 메타데이터 학습의 정교화가 요구됨.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...