CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·방탄소년당 ·일본산당 ·자전거당 ·안드로메당 ·개발한당 ·이륜차당 ·골프당 ·걸그룹당 ·바다건너당 ·클다방 ·소셜게임한당 ·소시당 ·AI당 ·나스당 ·육아당 ·키보드당 ·어학당 ·퐁당퐁당 ·물고기당 ·노젓는당 ·냐옹이당 ·와인마신당 ·오른당 ·사과시계당 ·위스키당 ·IoT당 ·방송한당 ·PC튜닝한당 ·축구당 ·스팀한당 ·AI그림당 ·날아간당 ·3D메이킹 ·X세대당 ·ADHD당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·디아블로당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·가죽당 ·레고당 ·리눅서당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·파도탄당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·가상화폐당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

새로운소식

구글, Gemma 4 12B를 소개합니다: 인코더가 필요 없는 통합 멀티모달 모델 4

2026-06-04 15:24:07 49.♡.67.46
_딘_

Gemma 4 12B를 소개합니다: 인코더가 필요 없는 통합 멀티모달 모델 (크롬 브라우저 번역)

Gemma 4 12B는 고성능 멀티모달 인텔리전스를 노트북에 직접 제공하도록 설계되었으며, 모바일 우선 효율성과 고급 추론 기능을 결합합니다.



오늘, 저희는 노트북에 에이전트형 멀티모달 인텔리전스를 직접 구현하도록 설계된 최신 모델인 Gemma 4 12B를 소개합니다. 엣지 컴퓨팅에 최적화된 E4B와 더욱 발전된 MoE(Mixture of Experts) 26B 사이의 간극을 메우는 Gemma 4 12B는 더 작은 메모리 용량 안에 강력한 기능을 담았습니다. 또한, 네이티브 오디오 입력을 지원하는 최초의 미드사이즈 모델이기도 합니다.


개발자 커뮤니티 덕분에 Gemma 4 모델 다운로드 수가 1억 5천만 건을 돌파했습니다. 여러분은 신체 보조 용 웨어러블 로봇 팔 부터 기업 수준의 AI 보안 솔루션 까지 다양한 제품을 개발해 오셨습니다 . 이번 최신 기능을 활용하여 여러분이 어떤 멋진 제품을 만들어낼지 기대됩니다.


Gemma 4 12B를 특별하게 만드는 요소들을 간략하게 살펴보겠습니다.

  • 혁신적인 통합 아키텍처: 멀티모달 인코더가 필요 없습니다. 영상 및 오디오 입력이 LLM 백본으로 직접 전달됩니다.
  • 고급 추론: 벤치마크 성능이 260억 달러 규모 모델에 근접하여 강력한 다단계 추론 및 에이전트 기반 워크플로우를 구현합니다.
  • 노트북에 적합: 16GB의 VRAM 또는 통합 메모리만으로도 로컬에서 실행할 수 있을 만큼 작은 용량입니다.
  • 개방적이고 접근성이 뛰어남: Apache 2.0 라이선스 하에 배포되며 개발자 생태계 전반에 걸쳐 지원됩니다.
  • 드래프팅 준비 완료: Gemma 4 12B는 지연 시간을 줄이기 위해 멀티 토큰 예측(MTP) 드래프팅 기능을 갖추고 있습니다.

이러한 기능들을 종합하면 속도나 추론 능력을 희생하지 않고도 일상적인 하드웨어에 고급 멀티모달 기능을 제공할 수 있습니다. 이제 Gemma 4 12B가 어떻게 이를 구현하는지 자세히 살펴보겠습니다.


최첨단 에이전트를 로컬에서 실행하세요

Gemma 4 12B는 표준 벤치마크에서 더 큰 26B MoE 모델에 버금가는 성능을 제공하지만, 전체 메모리 사용량은 절반 이하입니다. 16GB RAM을 탑재한 일반 노트북에서도 로컬로 실행할 수 있을 만큼 작아, 강력한 멀티모달 및 에이전트 기반 환경을 노트북에서 바로 구현할 수 있습니다.

젬마 4 12B 벤치마크


독보적으로 효율적인 통합 아키텍처를 경험해 보세요.

Gemma 4 12B의 가장 큰 특징은 시각 및 오디오 입력을 처리하는 간소화된 접근 방식입니다. 기존의 멀티모달 모델은 일반적으로 이미지와 오디오를 변환하기 위해 별도의 인코더를 사용한 후, 변환된 표현을 언어 모델에 전달합니다. 이러한 분리된 인코더는 지연 시간을 증가시키고 메모리 사용량을 늘리기 때문에, Gemma 4 12B는 오디오와 시각 입력을 직접 통합하는 인코더 없는 아키텍처로 학습되었습니다.

Gemma 4 12B가 멀티모달 입력을 기본적으로 처리하는 방법은 다음과 같습니다.

  • 비전: Gemma 4의 비전 인코더를 단일 행렬 곱셈, 위치 임베딩 및 정규화로 구성된 경량 임베딩 모듈로 교체했습니다. 이를 통해 LLM 백본이 시각 처리를 담당할 수 있게 되었습니다.
  • 오디오: 오디오 처리를 더욱 간소화했습니다. 오디오 인코더를 완전히 제거하고 원시 오디오 신호를 텍스트 토큰과 동일한 차원 공간으로 투영했습니다.

자세한 내용을 알고 싶은 개발자분들은 저희의 Gemma 4 12B 개발자 가이드를 참조해 주세요 .



네이티브 오디오 처리 기능을 직접 확인해 보세요. Gemma 4 12B가 Google AI Edge Eloquent 앱을 사용하여 음성 입력을 완전히 오프라인에서 텍스트로 변환, 서식 지정 및 번역하는 과정을 살펴보세요.


오늘 바로 시작하세요

  • 직접 시도해 보세요 : LM Studio , Ollama , Google AI Edge Gallery 앱 , Google AI Edge Eloquent 앱 및 LiteRT-LM CLI 에서 몇 번의 클릭만으로 실험해 볼 수 있습니다.
  • 가중치 다운로드 : 사전 학습되고 명령어에 맞춰 조정된 체크포인트를 Hugging Face 와 Kaggle 에서 직접 다운로드하세요 .
  • 통합 및 학습: 개발자 문서 와 빠른 시작 노트북을 검토하세요 .
  • 선호하는 개발 도구를 사용하세요 . Hugging Face Transformers , llama.cpp , MLX , SGLang , vLLM을 사용하여 로컬 추론 파이프라인을 구현 하거나 Unsloth를 사용하여 효율적으로 미세 조정할 수 있습니다 .
  • Gemma 스킬로 에이전트 개발의 가능성을 열어보세요: 최신 Gemma 기능을 활용하여 에이전트 개발을 지원하기 위해 공식 스킬 저장소를 출시합니다 . 이 저장소는 에이전트가 Gemma 모델을 사용하여 개발할 수 있도록 특별히 설계된 스킬 라이브러리입니다.
  • 원하는 방식으로 배포하세요: Google Cloud를 사용하여 프로덕션 환경에 엔드포인트를 배포합니다. Gemini Enterprise Agent Platform Model Garden , Cloud Run 및 GKE를 통해 원하는 방식으로 배포할 수 있습니다 .


출처 : https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
_딘_ 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [4]
동농군
IP 117.♡.6.111
06-04 2026-06-04 16:21:47
·
이런걸 홈서버에 설치해서 써보고싶지만... 그러려면 진짜 비싼 그래픽카드를 써야겠죠?
오히려종아
IP 61.♡.55.124
06-04 2026-06-04 18:23:35
·
@동농군님 맥미니 m5 pro 급에 메모리만 32gb면 충분히 돌립니다. 그래봐야 비싼gpu보다 쌀거에요 아마도
동농군
IP 175.♡.94.79
06-04 2026-06-04 18:24:41
·
@오히려종아님 와.. 맥미니가 그정도군요... 홈서버 쓰는건 i5-8500이라... 😅
Mr.UN
IP 14.♡.43.15
06-04 2026-06-04 16:36:35 / 수정일: 2026-06-04 16:37:43
·
Gemma 4 12B Q4 로 약 7GB 가 필요하니 16GB RAM이나 12GB 이상의 그래픽카드가 있어야 돌릴 수 있겠네요. 26B 가 부담스러운 개인들이 중급 그래픽카드 기반으로 돌려볼만한 모델 같습니다.
설치만 해서 돌리면 실망하시겠지만 기본 하네스 구성만 하면 가족들이 가볍게 써볼만한 수준은 될 겁니다.

일반RAM 기반으로는 많이 답답하실 것이므로 16GB 노트북 이용자께서는 더 작은 모델로 시도하시는 것이 좋을 것 같습니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.