https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF
역대급입니다.
방금 다운이 완료 되어 사용해 봤습니다.
물론 35B라는 작은 체급의 한계를 벗어났다고 할 순 없겠지만,
지금까지 나온 동급의 모든 모델 중 가장 탁월합니다.
이런 거라 보시면 됩니다.
Qwen3.6 이나 젬마4같은 모델의 성능을 끌어 올리기 위해
요즘 한창 유행하는 것이 fable의 데이터를 이용하는 식으로,
최대한 어떻게든 더 끌어 내려는 시도가 활발한데,
그 가운데 가장 뛰어난 성과를 낸 모델로 보입니다.
단순히 벤치가 좋은 것이 아니라
Qwen3.5 397B 보다 더 나은 답변을 줍니다.
35B 전후의 모델 중에서는.. SOTA 인 것 같습니다.
따져 볼 많은 영역을 다 따져 보면,
Qwen3.5 397B 보다 낫다고 하긴 어렵겠지만,
1/12 사이즈로 사실상의 동급 성능을 내다니...
신기할 정도네요.
로컬로 돌려 보실 분들에게 추천합니다.
현재까진 비슷한 사이즈의 다른 모델을 볼 필요는 없는 것 같습니다.
Model Overall Coding Math Tool Use Reasoning
Ornith-1.0-35B 41.07 62.26 47.29 58.14 38.92
Qwen3.6-27B (dense) 43.12 64.18 49.87 56.32 41.05
Qwen3.6-35B-A3B (MoE) 39.84 59.47 44.12 52.88 37.21
추천 고맙습니다