알트먼 “수개월 내 자체 추론 칩 샘플 수령…올해 말 대규모 실전 투입”
그는 이 칩이 "추론 전용(inference only)"이라고 밝혔다. 또 "반드시 가장 빠른 추론 칩일 필요는 없지만, 가장 저렴하고 와트당 효율이 가장 높은 전문화된 칩을 만드는 것이 현재 직면한 상황을 돌파하고 미래에 등장할 수많은 에이전트 수요를 감당하는 데 중요할 것"이라고 말했다.
그리고 범용적인 고성능 칩이 아니라, 특정 목적에 맞춰 설계됐다고 강조했다. "이것은 에너지 효율에 집중한 한정적인 용도"라며 "기능은 한정됐지만, 에너지 제약이 심한 세상에서 해낼 역할은 매우 중요할 것"이라고 설명했다.
칩 개발 상황에 대해서는 매우 낙관적인 전망을 내놓았다.
"올해 말까지는 첫 번째 칩들을 대규모로 배치(Deploy)할 수 있을 것"이라며 "몇달 안에 첫 샘플 칩들을 돌려받을 예정인데, 결과가 아주 좋을 것 같다"라고 설명했다. 이는 '테이프 아웃(Tape-out)' 이후의 샘플 수령이 임박했으며, 첫 결과물에 대한 기대가 크다는 말이다.
오픈AI가 자체 칩을 제작 중이라는 말은 2024년부터 나왔다. 브로드컴과 칩을 공동 설계하고, TSMC의 3나노미터 공정 기술로 생산하는 구조다. 이제까지는 2026년 내로 양산이 가능할 것으로 예측됐는데, 별문제없이 진행돼 온 것으로 볼 수 있다.
이처럼 오픈AI는 모델 개발 이상으로 인프라 구축에 집중하고 있다. 엔비디아의 GPU는 물론, AMD의 칩과 구글의 TPU, 아마존의 트레이니엄, 스타트업 세레브라스 제품 등 거의 모든 가용한 칩을 확보 중이다.
중략