해외 기사를 번역한 것이므로 오역이 있을 수 있습니다.
애플의 맥 클러스터 AI 우위가 이제 위협받고 있습니다

애플은 현재 맥 및 애플 스튜디오 클러스터에 대해 독보적인 비용 우위를 점하고 있습니다.
썬더볼트 5를 통해 다수의 맥 미니나 애플 스튜디오 기기를 클러스터링하여 연산 능력을 결집하는 기능은 참으로 강력한 도구입니다. 특히 메모리 자원의 가치가 금값만큼 귀한 시기에, 방대한 메모리를 확보할 수 있게 해주는 애플의 통합 메모리 구조 덕분에 그 가치가 더욱 빛납니다.
하지만 애플이 이러한 독특한 장점을 더 잘 활용할 수 있는 도구들을 도입하고 있음에도 불구하고, 메모리 중심의 장기 계약(LTA) 만료로 인해 전반적인 경쟁력이 깎여 나가고 있습니다. 이는 곧 출시될 M5 기반 맥 미니와 애플 스튜디오를 포함한 차기 제품들의 상당한 가격 상승을 예고하는 대목입니다.
만료되는 메모리 장기 계약으로 인해 위협받는 애플의 맥 미니 및 애플 스튜디오 클러스터 AI 우위
최근 알렉스 지스킨드(Alex Ziskind)는 덜 복잡한 머신러닝(ML) 및 AI 작업을 수행할 때 엔비디아 RTX 4090과 비교해 전용 애플 실리콘을 사용하는 것이 더 저렴하다는 점을 보여주었습니다.
이 장점의 핵심에는 CPU와 GPU가 동일한 메모리 캐시를 사용하는 애플 실리콘의 통합 메모리 구조가 있습니다. 예를 들어, M4 프로 맥 미니는 64GB의 램(통합 메모리)을 자랑하는 반면, RTX 4090의 램은 24GB에 불과합니다.
썬더볼트 5를 통해 여러 대의 맥 미니 기기를 연결하면 AI 관련 작업을 위한 통합 메모리 용량이 급격히 늘어납니다. 게다가 이러한 장점은 곧 출시될 M5 기반 맥 미니와 애플 스튜디오의 우수한 처리 성능과 결합될 때 더욱 매력적으로 변합니다.
한편, 애플은 이러한 통합 컴퓨팅의 장점을 부각시키기 위해 전력을 다하고 있는 것으로 보입니다. 예를 들어, macOS Tahoe 26.2는 애플의 맞춤형 머신러닝 플랫폼인 MLX에 썬더볼트 5를 지원하는 새로운 드라이버를 도입했습니다.
연결 속도가 최대 약 10Gb/s인 일반적인 이더넷 기반 컴퓨팅 클러스터와 달리, 썬더볼트 5는 최대 80Gb/s의 대역폭을 가집니다. 또한 애플은 썬더볼트 5에 RDMA(원격 직접 메모리 액세스)를 도입하여, 클러스터 내의 어떤 CPU 노드라도 다른 노드의 메모리를 읽을 수 있게 했습니다. 이때 읽히는 쪽 CPU 노드의 처리 전력을 크게 소모하지 않고도 가능합니다.
https://twitter.com/jukan05/status/1999717102924747092?s=20
이 개념을 설명하기 위해, 유튜버 제프 기어링(Jeff Geerling)은 최근 애플로부터 대여받은 4대의 애플 스튜디오로 클러스터를 구축했습니다. 이 클러스터는 약 1.5TB의 통합 메모리를 갖추었으며 비용은 약 40,000달러가 소요되었습니다.
비교를 위해 엔비디아 DGX 스파크(NVIDIA DGX Spark)를 클러스터링하여 동일한 양의 메모리를 확보하려면 12대의 유닛이 필요하며, 각 유닛의 가격은 약 4,000달러입니다. 이는 총 48,000달러의 비용이 들게 되며, 제프 기어링의 애플 스튜디오 4대 클러스터가 약 8,000달러의 비용 우위를 점하게 됩니다.
현재 애플이 보유한 이러한 비용 우위는 적어도 부분적으로는 메모리 업계의 거물들과 맺은 장기 계약(LTA) 덕분입니다. 그러나 최근 전용 포스팅에서 언급했듯이, 애플의 일부 장기 계약은 이르면 2026년 1월에 종료될 예정입니다. 그 결과 삼성과 SK하이닉스는 애플에 대한 공급 가격을 인상하기 위해 기회를 엿보고 있습니다.
슈퍼사이클임에도 메모리 업체들이 라인 증설에 굉장히 보수적인 것 같던데, 그동안 메모리 수요자들이 메모리 공급자들을 많이 가지고 놀았던 업보겠죠.
구지 장기계약으로 수요를 제한할 필요가 없겠죠.. 단기계약으로 부르는게 값인 시대인데요.