https://huggingface.co/nvidia/Nemotron-Cascade-2-30B-A3B

아! 두근구근 하네요.
gguf 버전이 기다려집니다.
아시는 분은 아시겠지만
Qwen3.5는 사실 딥시크 못지 않은 임펙트가 있었습니다.
왜냐면... 눈 높이가 높아진 사용자에게 오픈 소스 모델의 답변은 사실...
이 모델 이전에는 최소한의 만족도 주기 어려웠었는데, 중국 모델이 최초로 일반 PC에서 돌릴 수 있는,
나름 괜찮은 답변을 출력하면서
오픈 소스도 쓸 만하다... 라는 생각을 하게 만든 최초의 모델이었기 때문입니다.
그런데, 고작...네.. 고작 30B짜리가...Qwen3.5 보다 더 작은 모델이,
넘어가 버렸네요.
실 사용이 어떠할지 궁금하지 않을 수 없습니다.
... 라고 생각했었는데요.
함정이 있었습니다.
보여주고 싶은 것만 보여준 셈입니다.

자! 이제 진짜가 보입니다.
AIME 2025 나 라이브코드벤치와 같은 주요 벤치에서 앞서지만,
또 비슷한 무게의 다른 벤치에서는 밀립니다.
수학, 과학, 논리, 코딩 등에 특화 되어 있는 모델인 것 같습니다.
ㅎㅎ 그래도 거의 Qwen과 결이 다를 뿐 쌍벽이라 할 정도는 되니...
엔비디아의 학습 노하우가 상당하다는 생각을 해보게 됩니다.
얼마 전 GTC에서도 느꼈지만, 이제 하드웨어 제조사로 남지 않겠다는
강한 의지를 드러내는 것만 같은... 야망 어린 아주 준수한 모델이 나왔으니,
... 양자화 모델 풀리자 마자 써보고 후기 남기겠습니다.