나이팅게일(Nightingale) – PC 내 모든 곡을 지원하는 오픈소스 노래방 앱

나이팅게일(Nightingale)은 UVR 모델과 WhisperX AI를 활용해 모든 음원 및 비디오 파일(.mp4, .mkv)을 노래방 곡으로 변환해주는 오픈소스 앱입니다. 가이드 보컬 볼륨 조절, 실시간 음정 점수 계산, 게임패드 조작 등 전문 기기 수준의 기능을 Windows, macOS, Linux 환경에서 단일 바이너리 형태로 제공합니다.

AI 요약

나이팅게일(Nightingale)은 사용자의 PC에 있는 어떤 음악 파일이라도 인공지능 기술을 통해 고품질 노래방 콘텐츠로 변환해주는 혁신적인 오픈소스 파티 게임입니다. 이 앱은 UVR(Ultimate Vocal Remover) Karaoke 모델 또는 Demucs를 사용하여 음원에서 보컬을 분리하고, WhisperX AI를 통해 가사를 단어 단위로 정밀하게 타이밍을 맞춰 화면에 표시합니다. 별도의 복잡한 설치 과정 없이 ffmpeg, Python, PyTorch 및 필요한 ML 모델들을 첫 실행 시 자동으로 구축(Bootstrapping)하는 사용자 친화적인 구조를 갖추고 있습니다. 실시간 음정 점수 측정과 멀티 플레이어 프로필 기능을 통해 단순한 재생기를 넘어 본격적인 게임 경험을 제공하며, 저사양 PC를 위한 CPU 모드와 고성능 그래픽 작업을 위한 CUDA 및 Metal 가속을 모두 지원하는 것이 특징입니다.

핵심 인사이트

  • 첨단 AI 모델 통합: 보컬 분리에는 UVR 및 Demucs 모델을, 음성 인식 및 가사 동기화에는 WhisperX를 활용하여 높은 정확도를 구현했습니다.
  • 광범위한 플랫폼 지원: Windows(x86_64)는 물론 macOS(Intel/ARM)와 Linux(x86_64/ARM aarch64)를 모두 지원하여 범용성을 확보했습니다.
  • 데이터베이스 연동: 자체 생성 기능 외에도 LRCLIB의 기존 가사 데이터를 우선적으로 조회하여 사용자 대기 시간을 최소화합니다.
  • 하드웨어 가속 최적화: NVIDIA GPU를 위한 CUDA와 Apple 실리콘을 위한 Metal 가속을 지원하여 실시간 셰이더 효과와 처리를 원활하게 수행합니다.

주요 디테일

  • 단일 바이너리 실행: 사용자가 직접 라이브러리를 설치할 필요 없이 실행 파일 하나로 모든 환경 구성이 완료되는 'Zero-install' 방식을 지향합니다.
  • 비디오 파일 지원: .mp4 및 .mkv 파일을 라이브러리에 드롭하면 음성을 분리하는 동시에 원본 영상을 배경으로 재생하는 스마트 기능을 제공합니다.
  • 실시간 피드백 시스템: 마이크 입력을 분석하여 실시간 음정 점수(Pitch scoring)와 별점 등급을 부여하며, 곡별 스코어보드를 통해 기록을 관리합니다.
  • 게임 중심 인터페이스: D-패드, 스틱, 페이스 버튼 등 게임패드 컨트롤러만으로 메뉴 이동부터 노래 선택, 재생 제어까지 모든 조작이 가능합니다.
  • 동적 시각 효과: GPU 셰이더를 활용한 오로라, 성운(Nebula), 플라즈마 효과 및 Pixabay의 비디오 루프를 배경으로 설정하여 시각적 몰입감을 높였습니다.

향후 전망

  • 홈 엔터테인먼트 시장의 변화: 고가의 노래방 기기나 구독형 서비스 대신 로컬 AI를 활용한 무료 오픈소스 솔루션이 가정 내 파티 게임의 대안으로 자리 잡을 것으로 보입니다.
  • 로컬 AI 앱의 대중화: 복잡한 AI 모델 설치 과정을 자동화한 나이팅게일의 방식은 향후 다른 AI 기반 소비자용 소프트웨어의 표준 모델이 될 가능성이 높습니다.
출처:hackernews
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...