HBM4에 대해 알아 보신 분들은 아시겠지만...
난이도가...어마무시합니다.
기술 설명만 들으면...정말 이게 되나 싶을 정도...
근데 그게 되어 퀄테스트에 이어 양산 소식이 나오는 상황이 되었습니다.
그런데 HBM4의 난이도는 곧 생산량과도 연결이 되겠죠.
이 물량을 엔비디아가 선점한다는 얘기가 있습니다.
쉽게 생각하면 애플이 TSMC의 첫 타자가 되는 것처럼요.
여튼, HBM4의 난이도의 다른 이름은 성능입니다.
3와 달라지는 큰 부분은 쉽게 포현하자면 데이터 통로가 두배로 늘어나고,
베이스다이가 기존과 달리 똑똑하게 작용하면서,
성능 향상 폭이 역대급일 것으로 이야기 되고 있습니다.
(블랙웰 대비 개별 칩 2.5배, 결합 기준 3.3배)
좋은 이야기만 했는데요. 루빈 이후는 그럼 어떨 것이냐...에서,
개인적 추측이긴 합니다만... 루빈 울트라까지가
가장 높은 성능 향상폭의 절정이 되지 않나 싶습니다.
이후 발전이 없다는 것이 아니라
오히려 그 만큼 루빈에서의 폭이 크다는 의미로 보면 좋겠습니다.
그런데 여기서 끝이 아닙니다.
루빈 + CPX가 있죠.
이게 다른 의미로 대단한데,
자! AI의 처리 과정에서 먼저 사용자의 요청
(LLM이 아닌 경우라면...입력 데이터라고 해야겠죠.)
이 들어 오면... 그것을 해석하고 디코더로 넘기는 과정으로 구분하는데,
데이터를 해석하는 과정을 사용자의 입장에서 보면,
입력 컨텍스트의 처리라 볼 수 있습니다.
단문의 자료 또는 요청 문구도 있을 수 있고,
장문의 글, 자료. 메뉴얼, 수식 등에 사진이나 영상이 있을 수 있는데,
이런 데이터 사전 해석 역할 및 최적화에 무게를 두고 있는 전문 역을
CPX로 처리한다고 합니다.
즉, 디코더의 역할 부담을 줄여 주면서 더 많은 데이터를 효율적으로 처리하는 방식으로,
이렇게 되면 루빈 + CPX로 인해 효율이 말도 못하게 높아진다는 것입니다.
성능 외에도 전력 소모 및 도입 비용 등에서도 차이가 많아서,
루빈 + 루빈CPX 정도면...또 다시 한 발자국 또는 두 발자국 앞서 가게 될 것으로
전망되고 있습니다.
현 추세를 파악하는 데 도움이 되었어요.