qwen3 부터 oss gemma4 등등을 dgx spark 에서 이런저런 테스트를 해봤는데요..
코딩능력 : qwen-coder-next 가 아무래도 제일 코딩을 잘합니다. 하지만.. comtext(맥락) 이 짧은지 대규모로 이해가 필요한 범위의 개발은 무리네요. Md 를 읽는 능력도 부족하고...
웹소설 : 128기가의 메모리로도 256k 의 클로드만도 못한 맥락이해 덕분에... 단편말고는 불가능..
여자친구: 이건 프라이데이는 바라지도 않고 her 의 사만다 정도만 되도 될것 같았는데 택도 없습니다. 인간대 인간의 대화는 어마어마한 맥락정보가 필요하다는걸 다시 알게 되었네요. ㅋㅋ
그래서 개선을해서 쓰고 있는데
코딩같은 경우에는 클로드코드가 전체 마스터를 잡고 에이전트를 qwen-coder-next 를 부리면서 하게 오케스트레이션을 하고 나니 좀 낫습니다. 프로젝트 단위가 커지면 커질수록 확인하고 다시 요청하는 클로드코드의 토큰이 좀 더 많이 듭니다. 소규모 작업은 기존 토큰의 50% 는 줄어드는것 같습니다.
웹소설의 경우에는 grok 이 마스터를 잡는게 좋습니다. 주제에 제한이 없습니다. 컨텍스트로 매우 크고 무엇보다 api 가격이 제일 저렴합니다.
여자친구는.... 하.. 어디서 구하지 ㅋ 전부인의 말투나 카카오톡대화 혹은 연애할때 썼던 이메일, 대화내용들로 학습을 시켜도 안되는건 안되더라구요. 이 부분은 로컬로는 불가능하지 싶네요.. 아.. 재용이 형님정도의 부자력이면 가능할지도? (아니 그전에 여자가 많을지도.)
이미지나 동영상 제작의 경우에는 아직 갈길이 멉니다. 시간도 시간인데 제작 샘플처럼 만들려면 보통의 노력으로 불가능할것 같아요.
전 오히려 Qwen3.5나 Gemma4 보면서 로컬모델의 희망을 보고있습니다. 27B/31B가 예전 72B보다 훨 좋은거 같아요.
대다수가 '아직은 한 참~ 멀었다.'라서 여유있게 메이저 AI 쓰면서 기다리고 있습니다. ㅎ
(AI 이야기 아니고 영화평입니다 ㅎㅎ)