32GB VRAM: FP8 양자화된 70B~100B급 모델도 충분히 로드할 수 있는 용량입니다. 이는 RTX 4090(24GB)보다 큰 장점입니다. qwen3.6-27b-q8_0.gguf 도 이런 헛소리가 가끔 튀어나오네요. 맞는 소리 쭉 하다가 가끔씩 이러니 믿고 쓸게 아니라 일일이 검증해야 하겠군요.
스펙에 맞는 질문을 해야한다는....;;
추가로 연속된 쿼리가 아니라 매번 새롭게 보내는 식으로요.
그것도 AI가 잘할 것 같아요