https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF
역대급입니다.
방금 다운이 완료 되어 사용해 봤습니다.
물론 35B라는 작은 체급의 한계를 벗어났다고 할 순 없겠지만,
지금까지 나온 동급의 모든 모델 중 가장 탁월합니다.
이런 거라 보시면 됩니다.
Qwen3.6 이나 젬마4같은 모델의 성능을 끌어 올리기 위해
요즘 한창 유행하는 것이 fable의 데이터를 이용하는 식으로,
최대한 어떻게든 더 끌어 내려는 시도가 활발한데,
그 가운데 가장 뛰어난 성과를 낸 모델로 보입니다.
단순히 벤치가 좋은 것이 아니라
Qwen3.5 397B 보다 더 나은 답변을 줍니다.
35B 전후의 모델 중에서는.. SOTA 인 것 같습니다.
따져 볼 많은 영역을 다 따져 보면,
Qwen3.5 397B 보다 낫다고 하긴 어렵겠지만,
1/12 사이즈로 사실상의 동급 성능을 내다니...
신기할 정도네요.
로컬로 돌려 보실 분들에게 추천합니다.
현재까진 비슷한 사이즈의 다른 모델을 볼 필요는 없는 것 같습니다.
전 여러 개 쓰는데,
간편하게 쓸 때는 Lmstudio 씁니다.
Model Overall Coding Math Tool Use Reasoning
Ornith-1.0-35B 41.07 62.26 47.29 58.14 38.92
Qwen3.6-27B (dense) 43.12 64.18 49.87 56.32 41.05
Qwen3.6-35B-A3B (MoE) 39.84 59.47 44.12 52.88 37.21
체감은 더 좋습니다.
추천 고맙습니다
동급 사이즈에선 가장 좋습니다.
tool calling 은 어떤가요?
작은 모델들은 요거에 약할때가 많던데
ornith-1.0-35b
Thought for 12.25 seconds
안녕하세요! 제 이름은 **Qwen(통이천문)**이에요. 알리바바 그룹의 통이 연구소(Tongyi Lab)에서 개발한 대규모 언어 모델입니다.
무엇을 도와드릴까요?
??
파인튜닝을 극대화한 모델이라 보시면 됩니다.
제목에 재추천.. 이라 쓴 것은,
그 전에 한 번 글을 쓴 것이 있고,
거기서 원본이 어떠한지 말해 두었습니다.
그리고 링크 따라 가보시면 다 나옵니다.
참고로, Qwen 기반이나 능력치가... 월등합니다.
그게 이 모델의 의미구요.
하나만 더 말씀드리면,
이 모델을 공개한 이유 중 짐작 가능한 부분이 있습니다.
바로 여러 공개 모델 이 Qwen과 젬마 기반으로,
젬마든 큐웬이든 자신들의 학습 관련 노하우를 자랑하기 위함이라 볼 수 있습니다.
달리 말하면 다른 모델도 이런 식으로 적용 가능하다는 뜻입니다.
우린 파인튜닝 전문... 이렇게 내세운 거라 보면 되겠습니다.
어떤 능력이 주로 올라갔느냐면,
추론과 에이전트 능력입니다.
이것만으로 다른 성능까지 다 같이 올라갔습니다.
추천하는 이유는 일반적은 데이터 조급 학습시킨 Qwopus 와 같은 모델과 달리
뼈대부터 깊숙히 달라진 모델이어서,
현존하는 모든 모델 중 유사한 사이즈 에서 가장 능력이 탁월하기 때문입니다.
Fable5로 데이터 학습시킨 그런 것들과도 차별화 되구요.