CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·방탄소년당 ·일본산당 ·개발한당 ·소시당 ·자전거당 ·이륜차당 ·AI당 ·패스오브엑자일당 ·안드로메당 ·바다건너당 ·나스당 ·클다방 ·곰돌이당 ·가상화폐당 ·키보드당 ·리눅서당 ·사과시계당 ·소셜게임한당 ·물고기당 ·전기자전거당 ·골프당 ·노젓는당 ·걸그룹당 ·콘솔한당 ·노키앙 ·윈폰이당 ·축구당 ·여행을떠난당 ·디아블로당 ·찰칵찍당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·IoT당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

아무거나질문

컴퓨터 Mac studio - 로컬llm이 느려요 14

2026-05-01 10:03:23 125.♡.205.88
꼬마라크

언녕하세요


현재 맥스튜디오 m4 max 128모델에

ollama, (qwen3-coder-next, gemma4:26b 등)을 올려두고

인터넷 100mbps


집pc 에서 

클로드코드로 하다가

구독쓰다가 한도 차서

저 맥스튜디오를 로컬llm서버로 구동중입니다


그런데 너무 느려요

이런저런 테스트를 해봐야겠습니다만...

ollama-> vllm, lm studio 등으로 교체,

클로드를 맥튜디어의 로컬/로컬랜으로 옮겨본다거나...


다른 설정을 해줘야 할게 있을까요???


감사합니다

꼬마라크 님의 게시글 댓글
SIGNATURE
Just remember in the winter far beneath the bitter snows, 
Lies the seed, that with the sun's love, in the spring becomes the Rose. 
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [14]
솜브레로
IP 211.♡.170.168
05-01 2026-05-01 10:05:26 / 수정일: 2026-05-01 10:47:11
·
일단 vllm 으로 옮겨 보시는게 먼저 같습니다.
동일 하드웨어에서 양자화 기준도 모두 동일한 다른 분들 케이스보다 심각하게 느리신가요?
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 10:09:29
·
@솜브레로님

음 클로드로 작업하던 컨텍스트가 22메가 정도 더라구요(claude --resume 으로 확인한 세션에서 나오는 용량)

이래서 그런지...
어제밤에 시킨 코드 수정이 아직까지 돌아가요 14시간째...
오라질
IP 58.♡.112.223
05-01 2026-05-01 10:09:01
·
lmstudio가 올라마보다는 빠를거 같습니다. 옵션들 많이 만져보심 될듯한데 문제는 뭐에 쓰냐에따라 여전히 느릴듯하네요
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 10:11:28
·
@오라질님

올라마 기본으로 설치해서... ㅠ
옵션들을 찾아봐야겠네요
천문공
IP 122.♡.56.205
05-01 2026-05-01 10:09:26
·
vllm이 낫겠지만 지금 글의 뉘앙스로 보니... 거기서 거기일 것 같네요.
lmstudio는 더 느릴 겁니다. 올라마가 낫죠.

M5 로 가라는 계시인 듯 하네요.ㅎㅎ
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 10:12:15
·
@천문공님

으엇 ㅋㅋㅋ 명분이다!
가디
IP 118.♡.21.105
05-01 2026-05-01 10:25:37
·
벤치마크를 좀 찾아보하면 좋을거 같아요.
일단 M5로 단순히 가는건 크게 차이 없나봐요.

---
로컬 LLM 돌릴 때 기준:
항목 체감 차이
llama.cpp 약 15~25%
MLX / Metal 약 20~30%
diffusion 20%+
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 10:27:57
·
@가디님

감사합니다
지금 단순히 올라마로 하는중이라
현상황 token생성량 한번 체크해보고 진행해봐야겠어요
Mr.UN
IP 14.♡.43.15
05-01 2026-05-01 11:47:42 / 수정일: 2026-05-01 11:47:54
·
말씀하신 모델이면 오래된 PC에 24GB 그래픽카드 꽂아 Q4로 올려 쓰시는게 가장 속편합니다. 3090 에서도 Qwen3 coder 무설정시 75~80tok/s, 튜닝 후 200 tok/s 이상 나왔었습니다.
품질이 생각보다 마음에 안 들어서 지금은 로컬은 RAG, Reranker 정도만 돌리고 있습니다만.....
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 11:51:03
·
@Mr.UN님

아 튜닝이 꼭필요한가보군요 찾아보겠습니다.
요런 말씀 한마디가 많은 힌트가 됩니다 감사합니다
Mr.UN
IP 14.♡.43.15
05-01 2026-05-01 13:36:31 / 수정일: 2026-05-01 13:37:16
·
@꼬마라크님 중요한 건 그냥 채팅모드만 연결해서 쓰시는 경우가 많은데, 기본적인 메모리 관리 기능을 추가하고 mcp와 하네스를 만들어서 풀세팅 하지 않으면 맥락을 이해 못 하는 바보가 됩니다. 특히나 Qwen 시리즈는 다국어 밸런스가 안 좋아서 하네스 구성 없이 쓰시면 사용자 지시를 자신의 발언으로 착각하고 이어 붙여 작문을 한다거나, 갑자기 꽃달고 뛰어다니는 모습을 보실 수 있습니다.
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 13:45:55 / 수정일: 2026-05-01 13:46:21
·
@Mr.UN님

기본 올라마로 코딩하려는게 문제인거 같아요
튜닝을 해보겠습니다!!
blucat
IP 125.♡.148.251
05-01 2026-05-01 12:45:11
·
로컬LLM 느립니다 ㅎㅎ 상용 LLM들 수준의 속도와 성능은 힘들어요.
어쩔수 없습니다 ㅠㅠ 그리고 supergemma4 써보세요. 결과값이 정제 되어있지 않지만 기존 잼마보다 나오는 속도는 빠릅니다.
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
꼬마라크
IP 125.♡.205.88
05-01 2026-05-01 13:45:18
·
@blucat님

조언 감사드립니다!!
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.