Transformer 대비 GPU당 최대 475배 출력 토큰을 처리하는 새로운 아키텍처 개발

후지쯔가 개발한 PHOTON 아키텍처는 Transformer 대비 GPU당 최대 475배의 출력 토큰 수를 달성하며 대규모 언어 모델의 비용을 획기적으로 절감한다. 의미 단위 계층적 처리와 멀티쿼리 통합 기술을 통해 1.2B 파라미터 모델에서 약 475배의 멀티쿼리 성능을 보였으며, 9개 쿼리 통합만으로 Transformer 수준의 성능을 구현했다. 이 기술은 7월 ACL 2026에서 발표될 예정이다.

AI 요약

후지쯔가 기존 Transformer 대비 GPU당 최대 475배의 출력 토큰 수를 가진 새로운 AI 아키텍처 ‘PHOTON’을 개발했다. PHOTON은 입력을 의미 단위로 계층 처리하여 계산량을 대폭 줄이고, 여러 쿼리 결과를 통합하는 기술로 성능을 높인다. 1.2B 파라미터 모델에서 Transformer 대비 약 475배의 멀티쿼리 성능을 구현했으며, 단 9개 쿼리 통합만으로 Transformer와 동등한 성능을 달성했다.

핵심 포인트

  • Transformer 대비 GPU당 최대 475배 출력 토큰 수 달성
  • 의미 단위 계층적 처리로 계산 리소스 대폭 감소
  • 1.2B 파라미터 모델에서 Transformer 대비 약 475배 멀티쿼리 성능
  • 9개 쿼리 통합만으로 Transformer와 동등한 성능 검증

향후 전망

  • 2026년 7월 2일 ACL 2026 오럴 세션에서 발표 예정
  • 생성 AI의 GPU 리소스 및 전력 소비를 획기적으로 줄여 환경적·비즈니스적 지속 가능성 실현 기대
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...