AI 요약
벤치마크 소프트웨어 Geekbench 6의 개발사인 Primate Labs는 인텔이 최신 프로세서의 성능을 인위적으로 과장하기 위해 '바이너리 최적화 도구(Binary Optimization Tool)'를 사용하고 있다고 공식 발표했습니다. 이 도구는 명령어 시퀀스를 수정하여 성능을 향상시키는데, 보편적인 환경이 아닌 Geekbench 6를 포함한 극히 일부 애플리케이션에만 선별적으로 작동한다는 점이 문제로 지적되었습니다. 실제로 이 도구를 적용할 경우 전체 벤치마크 점수는 최대 8%, 특정 개별 워크로드 점수는 무려 40%까지 급증하는 것으로 나타났습니다. Primate Labs는 이러한 방식이 하드웨어의 실제 연산 성능을 정직하게 반영하지 못하며, 다른 기기와의 공정한 비교를 불가능하게 만든다고 비판했습니다. 현재 긱벤치 측은 해당 도구의 사용 여부를 감지할 방법이 없어, 관련 CPU들의 모든 결과에 유효성 의심 문구를 표시하기 시작했습니다. 이는 과거 스마트폰 제조사들과 인텔 제온 프로세서에서 발생했던 벤치마크 조작 논란의 재판으로 평가받고 있습니다.
핵심 인사이트
- 인텔의 '바이너리 최적화 도구'는 Geekbench 6의 특정 워크로드 점수를 최대 40%, 전체 종합 점수를 약 8% 인위적으로 상승시킴.
- 조작 의혹이 제기된 하드웨어는 차세대 코어 울트라 시리즈 3('팬서 레이크', Panther Lake) 및 코어 울트라 200 플러스('애로우 레이크 리프레시', Arrow Lake Refresh)임.
- Primate Labs는 해당 도구의 최적화 기술이 공개되지 않았으며, 극히 제한적인 애플리케이션 목록에서만 작동한다는 점을 공식 블로그를 통해 폭로함.
주요 디테일
- 2026년 3월 24일, 하우투긱(How-To Geek)의 보도에 따르면 긱벤치는 인텔의 새로운 도구가 명령어 시퀀스를 변조하여 동일 워크로드 측정 원칙을 훼손하고 있다고 분석함.
- 긱벤치 측은 현재 시스템상에서 이 최적화 도구의 활성화 여부를 실시간으로 감지할 기술적 수단이 없음을 인정함.
- 이에 대한 조치로, 해당 도구를 지원하는 모든 인텔 CPU의 벤치마크 결과 페이지에는 "결과가 유효하지 않을 수 있음(might be invalid)"이라는 경고 메시지가 일괄적으로 표시됨.
- 이번 사건은 과거 삼성, 소니, LG, 원플러스 등 스마트폰 제조사들이 벤치마크 앱 감지 시 기기 성능을 일시적으로 오버클러킹했던 사례와 유사한 맥락에서 비판받고 있음.
- 인텔은 과거에도 제온(Xeon) 프로세서의 점수를 높이기 위해 컴파일러 조작 방식(compiler hack)을 사용했던 전력이 있음.
향후 전망
- 인텔 최신 프로세서의 성능 지표에 대한 시장의 불신이 커질 것이며, 실제 사용자 환경에서의 실질 성능 검증 요구가 거세질 것으로 예상됨.
- 긱벤치 등 벤치마크 플랫폼은 제조사들의 소프트웨어 기반 우회 조작을 원천 차단하거나 탐지하기 위한 보안 기술 고도화를 추진할 것으로 보임.
