잡담) GEMMA 4는 27b 인가 18기가 짜리가.. 9b인가 작은애는 영... : 클리앙

고객지원

© CLIEN.NET

모두의공원

잡담) GEMMA 4는 27b 인가 18기가 짜리가.. 9b인가 작은애는 영... 16

2026-04-09 15:45:02 수정일 : 2026-04-09 15:46:51 92.♡.186.150

에일리언

심심해서 이게 정말 되나 ollama로 돌려보는데

집 글카가 16G 컴터 ram 32기가 거든요.

27b 인가 18기가 짜리는 글카에 살짝 넘쳐서. 삐져나온거 메인 메모리로 올라가니 느려지네요. 이게 왔다갔다가 문제인가봐요.

걍 18기가를 컴터 메모리에 다 올린거보다 느렸습니다.

9b는 한글로 넌 누구니 하고 물어보면 다른나라말하고 해서 쓰기에 안좋았어요.

글카에 쏙 들어가서 움직임만 빨랐어요.

근데 빨라도 요상한 말만하니 무쓸모네요.

그래서... 남는 글카를 하나 더 꽂아서

총 24기가 메모리를 써서 돌려볼려 생각중입니다.

주 메모리에 올라갔을 때 보다 빠르고 병목 생각해도 32기가 맥미니 보다 빠를거로 예상합니다...

사람들이 이래서 맥미니에 램 왕창꽂아 많이 샀나봐요.

얼마전까진 애플은 AI 대응에 늦다 뭐라했는데 통합메모리로 대충 돌리기에 장점이 있네요.

글카 두장 우겨넣은 따로국밥 메모리 상황이 나은지...

맥미니 .M4 32기가가 좋은지 확인해 봐야겠네요.

젬민이는 전자가 빠를거래요.레알인지 봐야죠

에일리언 님의

SIGNATURE

일본★ 동경 거주자 입니다. 
먹고 살거리만 있었으면 바로 귀국했겠지만, 일본에 애착도 많습니다.
일본 및 국제 뉴스에 관심이 많아요. 해외에서 보는 한국 모습등도요.
가능한 사실관계를 중시하나, 직관도 즐깁니다. (듣다 보면 왠지 지구가 평평한 것도 같고...?)
교회는 잘 안가지만 사랑에 기대하며,  FSM및, MtoP교단도 좋아합니다.

기타...
2021.5-7 4개월 동안 참 별꼴을 다 봤네... 법사위 사태를 보니... 민주당이 욕해서 바뀔지 의문.
2021.9 민주당엔 한줌의 개혁 세력과 나머지 수박들의 모임이 되어 버렸다. 새로운 시작을 이재명에게 기대하나 야당과 박빙이라 차기 정권을 예측하기 어려운 위기 인 듯.
- 최강욱 대표를 포함한 열린당의 역할 확대를 기대.
2022.11 다음 정권이 부디 나라 이름 바뀐 상태로 시작되지 않기만을 바라는 중.

서명 더 보기 서명 가리기

댓글 • [16]

When2Fly

·

4b 나 2b 도 쓸만하던데요? 한국어도 잘하고 모바일용 local llm 으로도 꽤 만족도 높았고요.

에일리언

·

@When2Fly님
레알입니꽈...?
9b들려보고 헛소리만 해서 얜 27b 이하는 바본가봐 그래서 그 근처에도 안가서 안돌려봤습니다.
4b한종류.. 똑똑한애 소개받고 싶습니다. 몇종류 없나요...?

When2Fly

·

@에일리언님
헛소리 한다는 기준이 무엇인지가 중요하겠죠.
4b, 2b 면 활성매개가 4억, 2억인데 여기에서 모든 최신내용이 다 들어가 있다 생각하고 질문하면 당연히 헛소리만 하겠죠. 해당 모델과 RAG 등을 이용해서 어느정도 답변을 내느냐 또는 수학적, 산술적 문제에서 어느정도 답변을 내느냐로 봐야죠.
모바일에 내장해서 local llm 으로 , 그리고 데이터는 RAG 를 기반으로 전달해주면 꽤 만족할 만한 대답을 준다는 의미 입니다.

에일리언

·

@When2Fly님
안녕? 하고 한글로 자기소개 부탁했더니 다른나라말로... 전혀상관없는 다른 분야 말을 막 쏟아 내더라구요. 물어보지도 않은 얘길요.

When2Fly

·

@에일리언님
이상하내요, 한국어, 영어, 일본어 등 잘 대답해주던데요. 뭔가 모델로드가 정상적이지 않았던거 같은데요?

에일리언

·

@When2Fly님
그런가요?
27b인가 18G 모델은 느려도 똑똑하게 대답해서, 작으면 머리가 나빠지는 줄 알았어요... '-'a

When2Fly

·

@에일리언님
오히려 이번 4b, 2b 는 text, image, audio 가 다 되는 멀티모달이에요.

에일리언

·

@When2Fly님
레알 트루입니까... 언능 돌려봐야겠네요

쏘리누

·

젬마 31b는 너무 느렸는데 26b는 생각보다 빠르고 괜찮더라구요
그전엔 조금 느려도 qwen3.5:27b 를 썼는데 지금은 젬마 26b가 대답이 빨라서 더 자주 쓰게 되는것 같아요 성능테스트는 좀더 해보긴 해야 할것 같습니다.
m5 24g메모리 맥북입니다.

에일리언

·

@쏘리누님
얼렁 배송와서 저기 자빠져있는 맥미니 m4 32를 깨워야겠군요

호포트

·

맥북 m3 프로맥스 64입니다.
31b 너무 쾌적합니다.

앞으로 몇년만 더 업데이트하면 특정분야는 클라우드 안써도 될거같네요.....ㅎㅎ;;

에일리언

·

@호포트님
오올... 긱벤치 멀티로 M4 가 66%쯤 성능이라니까 기재 되네요...

독고구패

·

글카 따로국밥으로 쓰시면 지금보다 상황이 더 나빠지실 가능성이 높습니다.
PCI-E LANE 대역폭이 양쪽으로 절반으로 나눠질테니까요.
혹시 워크스테이션이더라도..PCI-E LANE은 메모리 대역폭에 비하면 너무나도 얕아서..도저히..

에일리언

·

@독고구패님
그러면 뭐 포기하고 M4 맥미니만 굴려야겠죠 ㅜ.ㅜ
안그래도 세컨 슬롯은 pcie가 반쪽이라...
말로는 용량을 얻고 연산코어가 풍부해지고 병목결과로는 -30%속도저하선인데 그래도 M4 맥보다 빠를거래서 해보려는건데... 메인메모리에 올린거보다 느리고 그러면 화딱지 날거같지말이빈다

독고구패

·

@에일리언님 LLM의 주요 병목은 연산쪽이 아니라 순수하게 메모리대역폭 그 자체이기 때문에 메모리대역폭<>PCI-E레인에 걸치게 되면 순수하게 PCI-E LANE에서 모든 병목이 생겨서 어마어마하게 화가 나실 겁니다.
저도 잘은 모르지만 LLM의 어텐션 메커니즘이 매 레이어 연산시마다 메모리 전체를 액세스 해야하는 극악조건인 것 같더군요..
그렇게 생각하면 TB/s수준인 현행 HBM 성능도 부족하다는 말이 나올만도 하네 싶기도 하구요. (물론 프론티어급 모델 얘깁니다만..)

에일리언

·

@독고구패님
선더볼트로 RDMA로 이 기종간 연결 Exo Cluster까지 알아보고 있었는데...
정말 이미 글카간에 느리면 ㅎㅎ...
VRAM 16+8기가 일때 글카간 병목이 어느정도 문제가 되나... 조만간 해볼것이니 뭐 알게되겠죠.
이거 안되면 RDMA도 의지가 파사삭할듯요

이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고

개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책

© • CLIEN.NET

보안 강화를 위한 이메일 인증

안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
개인정보에서도 이메일 인증을 할 수 있습니다.

지금 이메일 인증하기

등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.