Transformer 대비 GPU당 최대 475배 출력 토큰을 처리하는 새로운 아키텍처 개발

2026년 6월 25일

“후지쯔가 개발한 PHOTON 아키텍처는 Transformer 대비 GPU당 최대 475배의 출력 토큰 수를 달성하며 대규모 언어 모델의 비용을 획기적으로 절감한다. 의미 단위 계층적 처리와 멀티쿼리 통합 기술을 통해 1.2B 파라미터 모델에서 약 475배의 멀티쿼리 성능을 보였으며, 9개 쿼리 통합만으로 Transformer 수준의 성능을 구현했다. 이 기술은 7월 ACL 2026에서 발표될 예정이다.”

AI 요약

후지쯔가 기존 Transformer 대비 GPU당 최대 475배의 출력 토큰 수를 가진 새로운 AI 아키텍처 ‘PHOTON’을 개발했다. PHOTON은 입력을 의미 단위로 계층 처리하여 계산량을 대폭 줄이고, 여러 쿼리 결과를 통합하는 기술로 성능을 높인다. 1.2B 파라미터 모델에서 Transformer 대비 약 475배의 멀티쿼리 성능을 구현했으며, 단 9개 쿼리 통합만으로 Transformer와 동등한 성능을 달성했다.

핵심 포인트

Transformer 대비 GPU당 최대 475배 출력 토큰 수 달성
의미 단위 계층적 처리로 계산 리소스 대폭 감소
1.2B 파라미터 모델에서 Transformer 대비 약 475배 멀티쿼리 성능
9개 쿼리 통합만으로 Transformer와 동등한 성능 검증

향후 전망

2026년 7월 2일 ACL 2026 오럴 세션에서 발표 예정
생성 AI의 GPU 리소스 및 전력 소비를 획기적으로 줄여 환경적·비즈니스적 지속 가능성 실현 기대

원문:https://global.fujitsu/ja-jp/technology/research/article/topics/202606-photon-architecture

출처:Fujitsu Research

Transformer 대비 GPU당 최대 475배 출력 토큰을 처리하는 새로운 아키텍처 개발

AI 요약

핵심 포인트

향후 전망

이것도 읽어보세요

과학자들, 방해 요소 차단하는 고대 뇌세포 발견

우주가 우리 상상 이상의 낯선 의식을 숨기고 있을 가능성

초기 인류, 180만 년 전 동굴에 불을 가져오기 시작했다

남아프리카 표범이 정상 크기의 절반으로 줄어든 이유