사실 이는 의문형이 아니라 이미 된 상태입니다.
그 범위가 어느 정도일지가 관건 일 뿐.
다시 말해 엔비디아의 시장 점유율에 유의미한 변화를 줄 것인지,
아니면 그 정도도 안되는 미미한 정도일 것이지만 다릅니다.
현재 도입 되어 있는 AMD의 칩의 양은
미미합니다. 절대 수로는 작다고 할 수 없지만,
상대적으로는 아주 미미합니다.
그런데 두어 달 전부터 MI450 에 대한 뉴스가 심심찮게 나오는 이유는,
여러가지 시기적으로 맞아 떨어지는 부분 때문입니다.
우선 Rocm 7의 발표에서 드러났듯 효율이 대거 좋아졌습니다.
하드웨어만 좋아지고 끝이 아니라 소프트웨어적인 지원이
급속한 발전을 이루고 있는 중입니다.
MI450이 나올 즈음하여 발 맞추려는 것으로 풀이해봅니다.
아직 전반적인 부분을 일일이 들여다 보면 부족한 점도 많으나,
일정 규모 이상의 도입을 하게 될 경우 최적화 작업을 통해
엔비디아 대비 강점을 가질 수 있을 것으로 기대 되는 측면이 있고,
그 예가 MI450 시리즈에 대거 탑재될 HBM의 양입니다.
즉, AMD의 승부수는 이렇게 정리해 볼 수 있습니다.
1. 엔비디아 대비 동 스펙에 50% 더 많은 HBM.
2. 소프트웨어 지원 강화.
3. 가성비.
4. NVL64를 비롯한 시리즈 대응.
으로 요약이 됩니다.
복잡하게 생각할 것은 없고,
수년 전의
소비자용 그래픽카드 시장과 비슷하게 생각하면 이해가 쉽습니다.
조건이 여럿 붙긴 하지만, 조건이 되는 규모가 되는 기업을 대상으로,
조금 더 싸게, 조금 더 혜자 구성을 해줄테니...
가성비로 접근하라는 얘기고,
그게 실제로 되어 가는 중이며,
대규모 계약을 맺고 앞으로 나올 MI450을 도입 계약이 된 곳들이 있는 것입니다.
심지어 카더라이긴 하나 엔비디아가 MI450에의 대응으로 루빈을 재설계 하기 위해,
생산 지연이 될 것이라는 말도 나왔습니다.
물론 엔비디아는 절대 아니라고 했고, 시장도 엔비디아의 말에 무게를 두지만,
이런 루머가 돌 정도로 암드 제품이 앞으로 대안으로서 일부분 자리하게 될 것으로 보이고 있습니다.
결론입니다.
엔비디아가 거의 다 가져가던 것에서,
이제 암드가 일부분 차지하게 되는 식으로 가게 될 것 같습니다.
물론 엔비디아의 장악력이 떨어진다거나 하는 수준으로 간다는 것은 아니고,
기존 시장 대비 해마다 얼마간 늘어나는 파이가 있을 것인데,
그 늘어나는 파이를 홀로 거의 다 가져가던 것에서
조금 나누어 지는 정도여서,
엔비디아의 매출 및 성장이 지속 되는 것에는 ... 당분간 변함은 없을 듯 합니다.
PyTorch 등 주요 프레임워크의 ROCm 백엔드가 빠르게 좋아지고 있긴 한데, 다중 노드 통신 등 부족한 부분이 여전히 많이 있습니다. 무엇보다 CUDA 쪽이 커뮤니티 예제, 문서, 최적화 레퍼런스의 양이나 성숙도가 압도적으로 우세해서 현업 입장에서 CUDA, 즉 엔비디아 기반 환경을 항상 선택하게 되네요. 앞으로도 오랜기간 그럴 것으로 보이고요.
결론만 얘기하면 현업 입장에서 봤을땐 엔비디아 왕국은 한동안 굳건해 보여요.
말씀하신 내용과 다르지 않습니다. 같은 내용입니다.
본문에 적은 내용은... 음.. 그러니까 규모가 작은 곳까지 닿을 것 같진 않고요.
MI450을 도입하기로 한 빅테크들에 한정 된 이야기 이긴 합니다.
본문 중에 조건이 맞는... 이라고 적어 놓은 이유입니다.
작은 기업들은 말씀하신대로 어쩔 수 없이 엔비디아를 선택할 수 밖에 없겠죠.
빅테크의 대부분이 도입 예정이어서...
서두에 그 범위가 어느 정도일지가 관건이라고 적은 것이고요.
즉, 이 글은 일반 기업들에 해당하는 이야기는 아닙니다.
이렇게 보시면 됩니다.
말씀하신 그 이유들로 AMD의 AI칩을 말할 때는 대개 일반 기업을 대상으로 하진 않고,
적어도 도입하고 있고 도입하려는 마소, xAI, 오픈AI, 삼성전자, 메타, 오라클... 이런 곳들에 한정 된 이야기라 보시면 되겠습니다.
이야기의 초점을 다시 정리하면,
이런 조건이 맞는 기업들이 얼마나 채용할까...그 이야기를 한 것입니다.
전 보다 더 많이 도입할 것은 요즘 분위기로 보면 확실해 보이고요.
쬐금 더 도입할까. 아니면 생각 보다 더 많이 도입할까...
이게 관건이라는 이야기였습니다.
그런데 문득.... AI 가 매우 발전하면
결국 그 생태계도 AI 가 빠르게 구축해주는 날이 오지 않을까 하는 생각이 들었습니다.
그게 어렵다면 AI 의 한계인거고 가능하다면 생태계 독점은 또 그렇게 깨지는게 아닐까...
ai 학습용이 아니라 ai모델의 추론용이라서 대규모 데이터센터 같은데서 ai모델 서비스용으로 사용되는거죠
마찬가지로 구글의 tpu나 다른 기업들(국내는 리벨리온 등)도 추론용 하드웨어를 자체제작하려고 하고있습니다.
추론용 하드웨어 시장이 잠식되면 궁극적으로 학습용도 가능하게 되겟죠
이를 위해서 cuda호환 레이어 같은 소프트웨어 개발도 계속 진행되고 있습니다.
조금 더 정확히 말하자면,
학습에 더 적합한 MI430도 있습니다.
시장이 주목하는 MI450이 저정밀에 집중하여 추론에 더 적합해서 그렇게 말씀하시는 것 같습니다.
참고로 요즘 중국의 AI기업들은 저정밀로 (제한적이긴 하지만)학습까지 합니다.
제가 보기에 이런 부분 역시 필요에 의해 조금은 더 확산 될 것 같습니다.