AI 요약
후지쯔가 기존 Transformer 대비 GPU당 최대 475배의 출력 토큰 수를 가진 새로운 AI 아키텍처 ‘PHOTON’을 개발했다. PHOTON은 입력을 의미 단위로 계층 처리하여 계산량을 대폭 줄이고, 여러 쿼리 결과를 통합하는 기술로 성능을 높인다. 1.2B 파라미터 모델에서 Transformer 대비 약 475배의 멀티쿼리 성능을 구현했으며, 단 9개 쿼리 통합만으로 Transformer와 동등한 성능을 달성했다.
핵심 포인트
- Transformer 대비 GPU당 최대 475배 출력 토큰 수 달성
- 의미 단위 계층적 처리로 계산 리소스 대폭 감소
- 1.2B 파라미터 모델에서 Transformer 대비 약 475배 멀티쿼리 성능
- 9개 쿼리 통합만으로 Transformer와 동등한 성능 검증
향후 전망
- 2026년 7월 2일 ACL 2026 오럴 세션에서 발표 예정
- 생성 AI의 GPU 리소스 및 전력 소비를 획기적으로 줄여 환경적·비즈니스적 지속 가능성 실현 기대
