오픈AI가 처음으로 푼 오픈소스, 하필 '검열관'이었을까 [정원훈의...

이번 주 허깅페이스에서는 1.6조 파라미터와 100만 토큰 컨텍스트를 갖춘 중국의 'DeepSeek-V4-Pro'와 8가지 개인정보를 자동 마스킹하는 오픈AI의 첫 오픈소스 'Privacy Filter'가 공개되었습니다. 특히 딥시크 모델은 클로드 오퍼스 4.7 대비 1/4 수준의 저렴한 비용으로 최정상급 추론 성능을 기록하며 오픈소스 모델의 새로운 기준을 제시했습니다.

AI 요약

인공지능 시장은 중국 딥시크(DeepSeek)의 압도적인 성능과 오픈AI의 이례적인 오픈소스 공개로 큰 전환점을 맞이했습니다. 딥시크가 발표한 'DeepSeek-V4-Pro'는 1.6조 개의 파라미터 중 49B만 활성화하는 효율적인 MoE 구조를 기반으로 100만 토큰의 방대한 컨텍스트를 처리합니다. 한편, 오픈AI는 '닫힌 회사'라는 별명을 뒤로하고 개인정보(PII) 8종을 자동으로 식별해 가려주는 1.5B 규모의 경량 모델 'Privacy Filter'를 아파치 2.0 라이선스로 배포했습니다. 이 모델은 노트북 CPU에서도 동작할 만큼 가벼워 실무 환경의 데이터 보안을 획기적으로 개선할 수 있는 도구로 평가받습니다. 또한 오버월드의 '웨이포인트 1.5'는 RTX 3090 그래픽카드 한 장으로 AI가 생성한 가상 세계를 60FPS로 구현하며 인터랙티브 월드 모델의 가능성을 증명했습니다. 이러한 변화는 고성능 오픈소스 모델들이 폐쇄형 프런티어 모델의 경제성과 성능을 정면으로 위협하고 있음을 보여줍니다.

핵심 인사이트

  • DeepSeek-V4-Pro 출시: 총 1.6조(1.6T) 파라미터 중 49B만 활성화되는 MoE 구조로, 100만 토큰의 대규모 컨텍스트 윈도를 지원함.
  • 오픈AI의 첫 오픈소스: 이름, 주소, 계좌번호 등 8가지 개인정보를 마스킹하는 1.5B(50M 활성화) 규모의 'Privacy Filter' 모델을 공개.
  • 벤치마크 압도: DeepSeek-V4-Pro 맥스는 에이전트 실무 벤치(GDPval-AA)에서 1554점을 기록하며 Kimi K2.6 등 경쟁 모델을 제치고 1위 등극.
  • 실시간 AI 월드 모델: '웨이포인트 1.5'는 RTX 3090 환경에서 초당 60프레임(60FPS)으로 구동되는 인터랙티브 세계를 구현함.

주요 디테일

  • 하이브리드 어텐션 기술: CSA(압축 희소 어텐션)와 HCA(고압축 어텐션)를 결합하여 기존 V3.2 대비 연산량(FLOPs)을 27%, 메모리 점유율을 10% 수준으로 절감함.
  • 압도적인 가성비: DeepSeek-V4-Pro의 벤치마크 1회 통과 비용은 클로드 오퍼스 4.7(Claude Opus 4.7) 대비 약 4분의 1 수준에 불과함.
  • 보안 특화 기능: 오픈AI의 프라이버시 필터는 이름, 주소, 이메일, 전화번호, 날짜, 계좌번호, URL, API 키 등 8종의 민감 정보를 단 한 번의 추론으로 가려냄.
  • V4-플래시의 효율성: 284B 규모(13B 활성화)의 플래시 모델은 성능 격차를 1~3점 내외로 줄이면서 속도를 극대화해 실시간 서비스에 최적화됨.
  • 라이선스 개방: 딥시크 모델은 MIT 라이선스, 오픈AI 필터는 아파치 2.0 라이선스를 채택하여 상업적 이용 및 수정이 자유로움.

향후 전망

  • 오픈소스 모델이 100만 토큰 이상의 긴 문맥 처리와 에이전트 성능에서 폐쇄형 모델 수준에 도달함에 따라 기업들의 기술 도입 비용이 크게 하락할 전망.
  • 오픈AI의 이번 행보를 기점으로 로컬 환경에서 작동하는 경량 보안 모델과 특정 목적용(Task-specific) 오픈소스 배포가 활발해질 것으로 예상.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...