유료 코딩 에이전트들은 정말 좋습니다. 하지만 쓰다보면 알게되는 사실이 비싸고 한도가 터지고 여건에 따라 회사에서 쓸 수 없고 무엇보다 내 멋대로 돌릴수가 없죠.
그래서 dgx spark 가 출시되자마자 구매해서 로컬에서 돌릴 수 있는 코딩 에이전트들을 이거저거 돌려본 결과,
일반적인 PC 그래픽카드의 VRAM범위를 가정한 30B 파라미터 미만 코딩 에이전트들은 벤치 점수와는 별개로 손이 많이 가고 복잡해질수록 난해해지더군요.
그래서 결국 안착해서 쓰던 에이전트가 VRAM 90GB 정도가 필요한 gpt oss 120B 이었습니다. 작년 하반기에 공개된 이 녀석은 굉장히 똑똑한 문과생이 코딩을 배워서 도와준다고 해야할까요? 결국 정말 복잡하거나 급할때는 유료 코딩 에이전트를 쓰게 되더군요.
이후 출시되는 120B 미만 에이전트들을 하나 둘 써봤지만 결국 gpt oss 120B 만한 녀석을 못 찾았습니다.
그러던 와중 엇그제 qwen3-coder-next 가 공개되었습니다.
80B 파라미터에 4비트 양자화를 거치면 대략적으로 80GB 정도의 VRAM 이면 1-2년된 유료 에이전트만큼 원활히 돌아갑니다.
공개되자마자 5090에 모델만 올려서 PC메모리와 함께 써보려는 사람들이 많은듯한데 이 경우 동작은 되지만 좀 많이 느립니다.
제가 코딩 에이전트로 언제나 해보는 테스트가 대략 5명이서 1년동안 작업한 프로젝트를 1시간 정도에 리팩토링하여 모듈별로 테스트 하는 것인데 로컬 환경에서 처음으로 성공했습니다. gpt oss 120b 도 이래저래 주고 받으면 가능하기는 하지만 몇 가지 알려준 프롬프트만으로 자동으로 끝까지 성공한건 이 녀석이 처음입니다.
80GB VRAM 이 무슨 개인이 갖출 요구사항이냐고 반문 할 법도 하지만,
맥스튜디오, AMD Strix, DGX Spark 등 100GB 정도의 VRAM을 가용 할 수 있는 가정용? 시스템들은 좀 있죠.
결과적으로 내가 퇴근했을때나 출근했을때 나 대신 노동을 해줄 내가 맘껏 부려먹을 수 있는 노예 녀석이 하나 탄생된 것 같네요.
때마침 클로드봇도 화재가 된 마당이니, 이쯤되면 진짜 집에서 코딩 공장 하나 돌리는거 가능할거 같은데? 싶은 상황입니다.
아래 차트에 비교대상군은 일반적인? 128GB VRAM 가용한 피씨에서는돌릴 수 있는 엄두조차 안 나는 모델들입니다.
벤치는 숫자놀음이고 아직 테스트를 많이 해봐야 할 것 같기는 한데 이틀동안은 정말 즐겁게 쓰고 있습니다.
이제서야 dgx spark 구매한 값어치를 할만한 에이전트를 하나 찾은 것 같네요.

퀀트 아니고서야 그 시스템 집에서 감당할 사람 몇이나 될까요.
아무한테서나 들을수 없는 경험담이기는 하네요.
위에 언급된 장비들은 대부분 600-300만원대 구매가능했던 제품들 입니다.
몇천만원이 아니죠
Dgx 는 서드파티로 현재도 700-500만원대에 구매가능하고요
Strix Halo 가 현재 다나와 기준으로 beelink 제품이 280만원
DGX 서드파티제품 520만원
맥스튜디오 128G 공홈기준으로 554만원 이니까요.
그 제한이 없는 개인이나 기업들은 결국에는 Cluade 로 돌아오게 되더라고요.
1~2년전 성능이면 엄청난 차이가 나는거라서요.
최근에 핫했던 1조파라미터의 KIMI K 2.5 를 무료로 제공하는 곳이 있어서 사용해봤는데 이것도
이것도 쓰다보면 Claude 생각이 간절했었어요.