CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·방탄소년당 ·일본산당 ·MaClien ·자전거당 ·안드로메당 ·개발한당 ·이륜차당 ·소셜게임한당 ·AI당 ·소시당 ·나스당 ·가상화폐당 ·육아당 ·젬워한당 ·위스키당 ·오른당 ·노젓는당 ·골프당 ·디아블로당 ·PC튜닝한당 ·스팀한당 ·패스오브엑자일당 ·야구당 ·클다방 ·걸그룹당 ·IoT당 ·키보드당 ·달린당 ·찰칵찍당 ·리눅서당 ·바다건너당 ·맛있겠당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·사과시계당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·물고기당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

gemma4 26b a4b 모델들을 이것저것 테스트 해보고 있습니다 15

5
2026-04-10 23:08:05 59.♡.58.69
메이잉

우선 사양은 라이젠 7800x3d, 32기가램, rtx5070ti 16기가인데


lm스튜디오로 사용하고  구글 공식 Gemma 4 26B A4B q4_k_m 사용시 gpu오프로딩 20레이어, kv양자화 q4주고 컨텍스트윈도우크기 16384일때   35/s토큰 정도 나와줍니다  사용하면서 컨텍스트 찰수록 30정도로떨어지구요 

레이어 한개라도 더 올리거나 컨텍스트가 커져서 gpu공유메모리가 0.1이라도 넘어가는순간 토큰생성수가 1/10이하로 뚝떨어집니다  엄청난 병목이 생기죠


근데 unsloth 튜닝한 Gemma 4 26B A4B  iq4_nl 사용시 gpu오프로딩 30레이어 통채로 올리고 gpu공유메모리 1.5GB를 넘겨도 토큰수가 110을 넘어갑니다    그래서 공식버전같이  공유메모리 안넘기게 레이어 조절해서 올리니 오히려 토큰수가 50초반대로 절반이 깍여버리네요


iq4_nl이 중요도를 기반으로 선택적으로 더 양자화 해서 가볍게 만든거라는데  진짜 가볍긴 하네요  공식버전과 지능차이도 못느낍니다

토큰수 100이 넘어가니까 화면에 뿌려지는게 엄청나게빠르네요

메이잉 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [15]
삭제 되었습니다.
아띠팡
IP 58.♡.132.183
04-10 2026-04-10 23:15:18
·
햄복합니다..
메이잉
IP 59.♡.58.69
04-11 2026-04-11 01:02:01
·
@아띠팡님 저도 행복합니다 ㅋㅋ
게지히트
IP 125.♡.92.209
04-10 2026-04-10 23:21:45
·
좋은 정보 감사합니다!
메이잉
IP 59.♡.58.69
04-11 2026-04-11 01:00:43
·
@게지히트님 잘쓰세요 성능만 받춰주면 진짜 좋아요
오히려종아
IP 14.♡.208.210
04-10 2026-04-10 23:57:20
·
실 사용 성능은 어느정도 되나요...다른 모델 비교해서요
메이잉
IP 59.♡.58.69
04-11 2026-04-11 01:00:22
·
@오히려종아님 전 같은 젬마4랑만 비교해서요.. 아예 다른 모델하고의 성능은 벤치 찾아보셔애 할듯하네요
에일리언
IP 92.♡.186.150
04-10 2026-04-10 23:57:49
·
https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF ... like 정말 많군요.
AMD 9070xt 도전해봅니다...
에일리언
IP 92.♡.186.150
04-11 2026-04-11 00:16:18
·
LM Studio설치및 위의 모델을 올려봤습니다.
엄청원활하게 도네요. 그래픽카드와 32기가의 메인 메모리는 거의 꽉차네요??
그래도 답변 속도가 ollama에 그냥 26b 18기가 모델 돌릴 때와는 비교가 안되게 빨라서 실용적인 것 같습니다.
메이잉
IP 59.♡.58.69
04-11 2026-04-11 00:59:51
·
@에일리언님 전 30레이어 통채로 올리면 본문과같이 공유메모리쪽으로 1.5기가 넘어가고 메인램은 20기가 초반 정도 먹어요
근데도 속도가 미친듯이 나오니까 좋네요
천문공
IP 122.♡.56.205
04-11 2026-04-11 00:26:46
·
LMstudio에 레이어 올리는 걸 선택하는 기능이 있나요..;;
전 빠른 속도 필요 없는 걸로 오프로딩 해서 비슷한 크기로 사용하는데요.
메이잉
IP 59.♡.58.69
04-11 2026-04-11 00:58:06
·
@천문공님 lm스튜디오 왼쪽 메뉴에서 모델 선택하는 메뉴에서 모델 세팅 아이콘 눌러서 기본적으로 설정할수있구요
채팅 하는 메뉴에서 모델 로드할때 모델 선택후 밑에 쇼 어드밴스드 세팅 토클 켜면 이것저것 세팅 할수잇습니다
아가로스
IP 121.♡.64.75
04-11 2026-04-11 00:29:38
·
저랑 사양이 비슷하시군요…
Gemma 4 26B A4B iq4_nl 을 찾으라는거죠?
저도 돌려봐야겠네요 고맙습니다
메이잉
IP 59.♡.58.69
04-11 2026-04-11 00:58:43
·
@아가로스님 이거 한번 맛보니 다른 모델은 쓰기 싫어져요 추론모드 없이 답변 나올땐 진짜 질문 쓰고 엔터치자마자 바로 답이 나옵니다
Acidburn
IP 211.♡.39.212
04-11 2026-04-11 08:28:31
·
tool call 무한루프 문제는 없으신가요? qwen3.5에서는 멀쩡한데 Gemma 4만 올리면 tool 사용이 안되서 말입니다..;;
느아아아
IP 118.♡.2.26
04-11 2026-04-11 21:05:13
·
와 저는 5060ti 16GB에 64GB 램 환경으로 아직 올라마로 모델별로 대화만 좀 해보고 있는데 확실히 이 사양에서도 MoE 26B는 꽤 쓸만하더라구요
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.