제 글카는 AMD 9070 입니다.
지금 아마 약 1백만 조금 넘는 가격에 판매 중일 겁니다.
14B까지는 사실상 웹상에서 사용하는 속도에 거의 버금가는...
아주 빠른 출력이 가능합니다.
그런데 이번 3.5 27B는 아무리 양자화 되었다지만 기본 크기가 있고,
씽킹이 자주 발동되는지라... 재 보진 않았습니다만 최소 3분 이상.. (5분 쯤?, 씽킹모드)의 시간을 들여 다음과 같은 답변을 받았습니다.

(하략)
제가 기존에 시나리오 전용으로 파인튜닝 된 모델을 써 본 것 대비
월등한 성능을 내고 있습니다.
Qwen3.5 9B짜리는 불과 몇 달 전의 80B와 동등한 성능을 내고 있지만,
글을 쓰는 용도로는 아주 작은 모델은 피하는 것이 좋습니다.
최소가 27B라는 것이고요.
유료 구독 중인 제미나이에 비해 이 작문, 플롯 제작 성능이 떨어지지 않네요.
27B 언저리의 모델을 여태 써본 경험을 말씀드려 보자면,
단 한 번도 만족스러웠던 적이 없었습니다.
이번에 처음으로 괜찮다는 인상을 받습니다.
제 글카 브램이 16GB 입니다.
가능하실 것 같은데요.
GGUF 양자화 버전으로요.
제가 받은 양자화 모델은 13GB입니다.
감사합니다.
인생의 가장 큰 후회중 하나입니다
분명 뽕을 빼고도 남았을텐데 말입니다.