3. 생태계적 관점: TSMC의 공급 제약과 구글 '터보퀀트'의 진실
시장은 늘 "메모리 공급 과잉이 오면 어쩌지?"라는 공포를 가지고 있습니다. 가빈 베이커는 두 가지 근거로 공급 과잉으로 인한 버블 붕괴 가능성이 낮다
고 설명합니다.
TSMC라는 천연 브레이크: 엔비디아 가속기에 HBM을 패키징(CoWoS 등)하려면 파운드리 1위인 TSMC의 웨이퍼 공급이 필수적입니다. 젠슨 황(엔비디아 CEO)은 공급을 몇 배씩 늘려달라고 요청하지만, 대만의 TSMC 경영진은 버블 붕괴가 대만 경제 전체에 치명적임을 알기 때문에 철저히 보수적이고 통제된 속도(Rate limiting)로만 증설하고 있습니다. 파운드리 단계에서 공급을 조절해 주니 후공정인 메모리 역시 강제로 공급 과잉이 막히는 '골디락스 존'이 유지됩니다.
터보퀀트(TurboQuant)의 착시: 구글이 메모리 사용량을 획기적으로 줄여주는 알고리즘(TurboQuant)을 발표했을 때 시장은 "메모리 수요가 다 죽을 것"이라며 패닉에 빠졌습니다. 그러나 가빈은 이를 "메모리 제조사들과 가격 협상을 벌이던 구글의 철저한 언론 플레이(LTA 단가 인하용)"였다고 폭로하며, 실제 현장 엔비디아나 빅테크의 AI 엔지니어 중 이 기술 때문에 메모리 수요가 줄어들 거라 믿은 사람은 단 한 명도 없었다고 못 박았습니다.
터보퀀트가 구글의 언론플레이 였다는 폭로가 있었군요. 그만큼 파장이 올만한 내용은 아니었는데 실제로 언플이 먹히는 걸 보면 아직 세상이 얇구나 하는 생각도 듭니다. 사실 메모리 절약으로 파장이 온다면 엔비디아에서 계속 밀고 있는 게이티드델타넷 시리즈가 훨씬 무서운데요. 터보퀀트는 겨우 몇분의 1이지만 게이티드델타넷은 메모리 폭증을 아예 막을 수도 있고 이미 잘 돌아가는 구현도 공개됐거든요. 꾸준히 엔비디아가 이 시리즈의 논문을 내는게 신기했는데 이 글을 보니 그것도 압박용일 가능성이 높네요.