AI 요약
3월 3주차 허깅페이스 트렌드는 '검열 해제', '추론 이식', '감정 표현' 세 가지 키워드로 요약됩니다. 거대 IT 기업의 프리미엄 AI 기능을 오픈소스로 옮겨오려는 시도가 활발해지면서, 알리바바의 Qwen3.5 시리즈가 그 중심에 섰습니다. 개발자 HauhauCS는 'abliteration' 기법을 통해 350억 파라미터 규모 모델의 안전 필터를 수술적으로 제거하여 거부율 0%를 달성했으며, Jackrong은 앤트로픽 클로드 오퍼스의 사고 과정을 지식 증류 기법으로 오픈소스 모델에 이식하는 성과를 거두었습니다. 이와 더불어 1,000만 시간 이상의 오디오를 학습하여 인간의 숨결과 감정까지 재현하는 Fish Audio의 차세대 TTS 모델이 공개되어 텍스트와 음성 모든 분야에서 오픈소스 AI의 경계가 확장되고 있습니다.
핵심 인사이트
- 거부율 0건 기록: HauhauCS가 공개한 Qwen3.5-35B-A3B-Uncensored 모델은 465개의 거부 테스트에서 단 0건의 거부를 기록하며 완전한 검열 해제를 달성했습니다.
- 최상위 추론 능력 이식: 클로드 오퍼스 4.6의 단계적 사고 패턴을 지식 증류(Distillation) 기법으로 Qwen3.5-27B 모델에 주입하여 논리 및 코딩 성능을 대폭 향상했습니다.
- 초대형 음성 학습 데이터: Fish Audio S2 Pro는 1,000만 시간 이상의 방대한 오디오 데이터를 학습하여 80개 이상의 언어에서 고품질 음성을 생성합니다.
주요 디테일
- 수술적 검열 해제(Abliteration): 모델 내부의 '거부 벡터'를 수학적으로 찾아내어 제거함으로써 지식 손실 없이 안전 필터만 정밀하게 걷어냈습니다.
- 효율적인 MoE 구조: Qwen3.5-35B 모델은 총 397억 개 파라미터 중 30억 개만 활성화하는 MoE(Mixture-of-Experts) 구조를 채택해 일반 소비자용 GPU에서도 구동이 가능합니다.
- 추론 과정의 학습: 기존의 정답 학습 방식에서 벗어나 '목표 파악-하위 과제 분류-제약 조건 점검'으로 이어지는 클로드의 사고 과정을 SFT와 LoRA로 학습시켰습니다.
- 감정 제어 TTS: Fish Audio S2 Pro는 [whisper], [laughing], [pitch up]과 같은 자연어 태그를 통해 속삭임이나 웃음 등 음성의 감정과 톤을 세밀하게 조절할 수 있습니다.
- 실시간 스트리밍: Dual-AR 구조를 채택하여 실시간 스트리밍 환경에서도 높은 음질을 유지하며 텍스트를 음성으로 변환합니다.
향후 전망
- 상용 API 의존도 감소: 클로드나 GPT 같은 유료 API를 사용하지 않고도 로컬 환경에서 고난도 추론과 자유로운 창작이 가능해짐에 따라 개발 비용이 크게 절감될 것입니다.
- 책임감 있는 AI 사용 대두: 안전 필터가 없는 모델의 확산으로 인해 사용자 측면에서의 도덕적 책임과 별도의 가드레일 설치가 더욱 중요해질 전망입니다.
