젬마4, 재 추천 이유 : 클리앙

고객지원

© CLIEN.NET

모두의공원

젬마4, 재 추천 이유 27

2026-04-05 20:12:08 수정일 : 2026-04-05 20:13:44 122.♡.56.205

천문공

예전에도 한 번 올렸었는데요.

실감을 잘 못하는 것 같아 재 추천합니다.

로컬의 성능에 회의적인 시각을 가졌다면... 다음을 보시죠.

스크린샷 2026-04-05 195648.png

10배 큰 공개 모델과 비슷하거나 윗급입니다.

스크린샷 2026-04-05 200058.png

젬마4-31B는 제미나이 2.5프로 보다 위고, 지피티 4.5 프리뷰 보다 위에 있습니다.

심지어 Qwen3.5-397b 보다도 위에 있습니다.

젬마4의 윗급을 보면 더 실감납니다.

바로 위에 클로드 소넷 4.5 ... 씽킹이 있습니다. 씽킹이 들어가야 사실상의 동급입니다.

작은 파라메터 안에서의 성능 향상은 이제 거의 팔부 능선은 넘은 것 같습니다.

기존의 아키텍쳐에서 달라진 것은 거의 없는 대신

학습 데이터 등에 신경 쓴 결과가 이러합니다.

제가 제미나이 2.5 프로 나올 무렵에 했던 주장이 있습니다.

바로 소버린 AI가 이 정도 성능이 되어야 나름 의미가 있다는 내용이었습니다.

바꿔 말하면 이 이하로는 사실 공짜로 쓰라고 해도 잘 안 써진다는 말입니다.

잠깐은 써도 업무에 활용하려면...

이제 드디어 오픈 소스 진영의 모델이 과거 프런티어 수준이면서

사용자의 체감을 좋게 하는 일정 선을 넘어갔습니다.

특히 한국어 및 여러 언어를 잘 쓰는 점이 체감 성능 평가에서 좋은 점수를 받은 듯 합니다.

천문공 님의

댓글 • [27]

박하사탕님

·

맥미니 M4에 26b 올렸는데, 꽤 빠르게 빠릿빠릿 잘 돌아가네요.. 발달 속도가 ㅎㄷㄷ .. 엄청나네요..

하루세끼

·

체감으로는 벤치마크 훨씬 이상입니다. 현재 open llm 압도적 원탑인 것 같아요. 이런 모델이 무료라니.

Uncensored

·

동의합니다.
31b 직접 써 보니 '쓸만하다'의 선을 최초로 넘은 개인 PC용 로컬 모델입니다.
특히, 저처럼 검열을 싫어하는 분들에게는 최고의 선택(heretic ara 양자화 추천)입니다.

저는 탭을 수십개씩 막 켜놓고 동시에 돌리는 중인데 RAM 50G, VRAM 23G 정도 사용하네요.

스페이스X

·

제대로? 쓰려면 어느정도 사양의 서버나 피시가 필요할까요?

아라굴드

·

@스페이스X님
찾아보니, 쾌적하게 쓰려면 사양 좋은 그래픽카드 붙어있는 피씨가 유리하겠네요.
램도 그렇고, 다다익선이 적용되는 사례라, 최저사양은 답변을 기다리는 시간이 좀 오래 걸리겠죠.

AParty!

·

e4b도 gpt 4o였나? 그것보다 낫더라고요 ㄷㄷㄷ

Juzis

·

영어로 해야 저 점수가 나오려나요🥲

Youtube

·

M4 맥미니 16gb 모델로는 무리겠죠? 32gb 정도면 돌릴만 하려나요.

삶사랑그리고마무리

·

저두 젬마4맥북프로M4 24기가로 26b를 돌려봤는데 제가 첨 로컬을 써봐서 그런지 답변이 좀 느린거 같던데 정상인거죠? 😅

아라굴드

·

@삶사랑그리고마무리님
유튜브에 올라온 후기를 보니, M4맥북으로 돌리는 분들 있던데, 풀가동하느라 하판이 뜨뜻해진다는데요. 아무래도, 일반적인 피씨작업에 비해서 연산을 많이 하니, 노트북같은 경우는 지속적으로 발열이 발생할 거 같단 생각이 드네요. 로컬모델에 거, 생각 깊게 하는 모드로 질문하면 답변에 따라 일이십초 혹은 그 이상 걸리기도 하던데요.

D.라인하르트

·

@삶사랑그리고마무리님 위키독스 블로그를 보니
24기가 기준이면 양자화해서 8B 모델로 내려가야 하는 것 같습니다.
그래도 Gemma가 바로 맥기준으로 돌아가게 만든 것 자체가 대단한 것 같습니다.

https://wikidocs.net/blog/@jaehong/10624/

Mr.UN

·

많이 안 알려져 있습니다만 IBM Granite 4 모델들이 꽤 완성도가 좋아서 테스트 중이었는데 무려 제미나이2.5 pro를 넘어서 버리는군요...모바일에 올려서 테스트 좀 해봐야 하겠습니다. 제미나이3 시리즈 처럼 마구 지어내지 않고 모르는 건 모른다고 답변하는 성향이라는 평가가 있어서 기대가 됩니다.

바이데이

·

31b가 로컬로 돌렸을때 대다수의 ai를 씹어먹는 모델이가보군요.
현실은 맥미니가 24gb 램이라....ㅜㅜ

넷애딕

·

26b 는 4090 에서 Token per sec 속도가 125 전후로 나오네요.. 이정도면 실사용 가능한수준이네요

D.라인하르트

·

맥미니 24G 기준으로 gemma4:26b 설치해서 사용했습니다.
(메모리는 24기가 거의 근접에서 사용되고, 팬이 아주 크게 돌아갑니다. )
아래와 같이 동작을 잘하긴 하네요.

바이데이

·

@D.라인하르트님
다른 추가 애플리케이션은 돌릴수도 없겠네요;;

천문공

·

@님
양자화 모델로 돌리시면 됩니다.

D.라인하르트

·

성능표를 보면 26b 이상은 사용해야 효능감이 어느정도 있을 것 같습니다.

아띠팡

·

제 맥미니 64gb 가 이제야 일을 하겠네요

천문공

·

@아띠팡님
31B가 벤치 점수 차이 보다 실 체감에서 더 좋기 때문에 31B로 보세요.
26B가 속도는 더 빠르지만 체감 성능은 좀 차이가 있습니다.

아띠팡

·

@천문공님 앗 감사합니다.

주나파

·

이번에 꽤 잘 나왔군요. 회사에서 gtp oss 120b, 20b 쓰던거 바꿔봐야겠네요

독고구패

·

오...Elo 1400도 꽤 넘는군요?
로컬 지식면에서 좀 부족한 게 있어도 그런 건 요새 RAG 붙여서 해결하니까 문제는 아닐 거고..
이제야 로컬 LLM으로도 일정 수준의 threshold를 넘은 제품이 나왔다고 생각해도 괜찮으려나요 ㄷㄷ

패스리온

·

서드파티 사용하려면 (오픈클로, 에르메스등등) 이제 구글, 클로드는 API 사용량따라 청구 됩니다. 자가 지식발전 모듈을 돌리기 위해서는 어마어마한 토큰이 사용될것으로 예상됩니다. 기본적으로는 개인들도 로컬 LLM이되고 미지영역인경우 유료LLM사용하는식으로 발전될것같습니다. 이런의미에서 젬마나 중국LLM이 점점 발전되서 개인 LLM모델도 많이 발전 하고 있고 더 성능이 좋아질것같아요

ma50n

·

외국 커뮤니티에서는 실체감으로 qwen 3.5에 한참 못미친다는 댓글 보고 안쓰고 있었는데..실제감으로도 좋아졌다면 기대가 되네요

천문공

·

@ma50n님
정확히 하자면,
깊은 추론 및 코딩 쪽에서 Qwen 대비 밑입니다.
그 외의 사무 용도에서, 한국어에서, 종합적으로 더 좋습니다.

딥 추론이 필요한 경우 Qwen이 낫습니다.

Tiramisu

·

젬마가 구글이 만들었던건가요 결국 vram 큰게 깡패인거같은데 돈이 ㅠ

이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고

개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책

© • CLIEN.NET

보안 강화를 위한 이메일 인증

안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
개인정보에서도 이메일 인증을 할 수 있습니다.

지금 이메일 인증하기

등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.