
-디바이스: 갤럭시S26 울트라 1TB (퀄콤 스냅드래곤8 엘리트 Gen5: Adreno 840 GPU)
-환경: Termux bionic 네이티브 XFCE4
-GPU 드라이버: mesa Turnip 26.1.0_devel 업스트림 (오픈소스 Adreno Vulkan 드라이버)
Termux 환경에서 작동하는 OpenCL & Vulkan 컴퓨팅 벤치마크를 만들어보았습니다.
FP32/FP16 연산 성능을 측정하는데...
대략적으로
FP32 = 3.96 TFLOPs
FP16 = 7.8 TFLOPs
정도 나옵니다.
해당 결과는 Vulkan 컴퓨팅 결과지만 OpenCL(vulkan + clvk)도 오차범위로 동일합니다.
FP16은 최대 7.9 TFLOPs 까정도 나올 수 있을거 같네요.
연산 성능 기준 PS4 Pro에 거의 근접합니다.
PS4 Pro가
FP32 = 4.2 TFLOPs
FP16 = 8.4 TFLOPs
입니다.
대략 6% 정도 차이네요.
내년 LPDDR6 램도 달리겠다...Adreno 850과 Xclipse 970에선
PS4 Pro 연산 성능과 래스터 성능 넘기길 바랍니다.