https://v.daum.net/v/20260108084755218
서버·가속기 간 메모리 공유, 성능 혁신
표준 이더넷으로 AI·빅데이터 인프라 최적화
국내 연구진이 초대형 인공지능(AI) 학습 과정의 고질적 문제인 ‘메모리 부족’을 근본적으로 해결할 수 있는 핵심 기술 개발에 성공했다.
한국전자통신연구원(ETRI)은 초대형 AI 학습에서 가장 큰 문제로 꼽히는 GPU의 메모리 한계와 데이터 병목 현상을 해결하는 새로운 메모리 기술 ‘옴니익스텐드(OmniXtend)’를 개발했다고 밝혔다.
최근 초대형 AI 모델과 고성능 컴퓨팅(HPC) 수요가 급격히 증가하면서, 처리해야 할 데이터 규모도 폭발적으로 커지고 있다.
그러나 GPU 성능이 아무리 향상되더라도, 메모리 용량이 충분하지 않으면 연산 효율이 급격히 떨어지는 ‘메모리 장벽(memory wall)’ 문제는 여전히 해결 과제로 남아 있었다.
ETRI가 개발한 옴니익스텐드는 표준 네트워크 기술인 이더넷(Ethernet)을 활용해 여러 서버와 가속기(Device) 각각의 메모리를 하나의 대용량 메모리처럼 공유하는 기술이다.
즉 각 장비에 개별적으로 존재하던 메모리를 네트워크 전반으로 확장, AI 학습에 필요한 메모리를 원하는 만큼 유연하게 확보할 수 있는 구조를 구현했다.
중략
개발은 성공해도 양산이 안되면 그건 그냥 연구비 타고 끝 아닌가요.