# Gemma4 12B
https://huggingface.co/yuxinlu1/gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2-GGUF
# Qwen3.6
https://huggingface.co/lordx64/Qwable-v1
https://huggingface.co/Jackrong/Qwopus3.6-27B-v2-MTP-GGUF
위는 유출 된 페이블5 데이터를 활용한 젬마4 12B로 16GB VRAM이 장착된 그래픽카드에서 활용하기 좋으며,
에이전트 기능이 강화 되어 있습니다.
아래는 Qwen3.6 모델을 클로드4.7을 활용해 개선한 모델로 보시면 되겠습니다.
이러한 모델은 주로 코딩 및 에이전트 기능 강화에 초점을 맞추지만,
추론 성능 향상은 다른 영역에까지 영향을 끼치게 됩니다.
관련 논문도 발표 된 바 어느 한쪽의 과도한 치우침은 좋지 않겠으나
적정 수준의 높은 수준의 데이터와 관련 기능 강화는
모든 영역의 지능을 같이 올려주게 됩니다.
MTP의 경우 양자화를 미리 감안해서 훈련한 모델로,
원본 대비 품질 저하 없이 속도가 향상되었습니다.
Qwen3.6 쪽 모델은 오프로딩을 해야 하지만, 쓸만한 퀄리티가 나올 것입니다.
위 모델에서 풀버전 사용하시면 됩니다.
Q8 로 쓰시거나 16으로요