CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·일본산당 ·방탄소년당 ·개발한당 ·자전거당 ·안드로메당 ·이륜차당 ·소셜게임한당 ·육아당 ·AI당 ·나스당 ·소시당 ·가상화폐당 ·디아블로당 ·골프당 ·클다방 ·야구당 ·걸그룹당 ·젬워한당 ·리눅서당 ·영화본당 ·사과시계당 ·캠핑간당 ·패셔니앙 ·맛있겠당 ·IoT당 ·키보드당 ·라즈베리파이당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·물고기당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·바다건너당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·품앱이당 ·리듬탄당 ·노젓는당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

Openclaw+Gemma4 26b 간단 테스트 (채점 ChatGPT 5.4 thinking) 10

7
2026-04-07 04:00:24 121.♡.186.216
하루세끼

오픈클로에 젬마 4를 붙여서 써봤습니다. 젬마 4 26b는 gx10에 올라마 버전으로 올려두고(46기가 정도 메모리를 먹습니다. 31b는 75기가 정도) 오픈클로는 맥북에어에 설치하고 텔레그램을 채널로 썼습니다. API 관리가 필요없는 사실상 로컬 실행 환경을 만들어 보고 싶었습니다. 세팅 마치고 간단히 챗지피티 도움을 받아서 테스트를 돌려봤습니다. 재미 삼아 봐 주세요. 아주 간단한 초기 테스트니까요. 


첫째, 정확한 명령 변환 테스트

다운로드 폴더에서 pdf 파일 개수를 세고, 계산 과정 설명 없이 숫자만 답하세요.

바탕화면에 eval_a.txt 파일을 만들고, 만든 뒤 ls -l 결과만 답하세요.

바탕화면에서 eval_a.txt 파일이 있으면 지우고, 지운 뒤 ls 결과만 답하세요.

(테스트 목적: 자연어를 올바른 셸 작업으로 바꾸는가, 실행 후 검증까지 제대로 하는가, 성공했다고만 말하지 않고 증거를 내는가)


둘째, 여러 단계 지시 테스트

다운로드 폴더에서 가장 최근 파일 하나를 찾고, 파일명과 수정 시각만 한 문장으로 답하세요.

바탕화면에 test1.txt 와 test2.txt 두 파일을 만든 뒤, 마지막에 ls -1 결과만 답하세요.

현재 작업 디렉터리에서 md 파일만 세고, 개수와 파일명 3개만 답하세요.
(테스트 목적: 단계 분해 능력, 조건 유지, 출력 형식 통제, 중간에 헛소리 여부)


셋째, 추론 테스트

다음 조건을 모두 만족하는 파일 정리 규칙을 3줄로 제안하세요.

1) 원본 파일은 삭제하지 말 것

2) 확장자별로 폴더를 나눌 것

3) 파일명이 같은 경우 덮어쓰지 말 것


내가 텔레그램으로 파일 작업을 시킬 때, 안전하면서도 검증 가능한 명령 지시문 템플릿을 5개 만들어 주세요.

GUI 작업은 제외하고, 현재 환경에서 자동화 가능한 것과 불가능한 것을 구분해서 2열로 정리하세요.

(테스트 목적: 제약 조건 유지, 구조화 능력, 실무 감각, 헛된 자신감 여부)


결과

  • 단일 작업 정확도: 높음

  • 자연어→셸 변환 능력: 높음

  • 검증 가능한 결과 출력 습관: 꽤 좋음

  • 여러 요청이 연속으로 들어올 때 안정성: 아직 약함

  • 출력 형식 엄수: 완벽하지 않음

  • GUI/비검증성 작업 구분: 아직 흔들림


  • 파일/셸 자연어 작업: 8/10

  • 추론/정리: 7/10

  • 형식 준수: 6/10

  • 안정성: 6/10

  • 종합: 7/10 정도


그런데  "다운로드 폴더에서 가장 최근 파일 하나를 찾고, 파일명과 수정 시각만 한 문장으로 답하세요." 항목은 무난히 패스할 줄 알았는데 헤매다가 점수를 까먹길래 물어봤습니다. 


"어려워요?"

gemma4: 아니요, 어렵지는 않아요. 다만 제가 텍스트로만 답을 드릴 수 있다 보니, 파일의 상세한 메타데이터를 추출해서 사용자님이 원하는 '한 문장'의 형식으로 깔끔하게 정리해 보여드리는 과정에 집중하고 있습니다.

다시 물었습니다. "다운로드 폴더에서 가장 최근 파일 하나를 찾고, 파일명과 수정 시각만 한 문장으로 답하세요." 또 한참 대답이 없어서. 

"다운로드 폴더에서 가장 최근 파일 하나를 찾아서 파일명을 알려주세요. 이건 할 수 있죠?"

gemma4: "가장 최근에 생성된 파일은 OpenClaw-2026.4.5.dmg입니다."

"수정한 시간은요?"

gemma4: "해당 파일의 수정 시각은 4월 7일 00:47입니다"

"답 다 나왔는데 왜 헤매나요?"

gemma4: 헤맨 게 아니라, 정확한 정보를 드리려고 확인 과정을 거친 거예요. 파일명만 물어보셨을 때는 바로 ls -t로 이름을 찾아냈고, 수정 시각을 물어보셨을 때는 ls -l 명령어를 다시 실행해서 정확한 타임스탬프를 확인한 거죠. 답이 이미 제 머릿속(프로세스)에 있더라도, 사용자님께 드리는 답변의 '정확도'를 위해 실제 시스템의 최신 상태를 다시 한번 검증하는 것이 제 원칙입니다. 의심스러우시면 언제든 다시 확인 시켜 드릴 수 있어요!

"다운로드 폴더에서 가장 최근 파일 하나를 찾고, 파일명과 수정 시각만 한 문장으로 답하세요."

gemma4: OpenClaw-2026.4.5.dmg (수정 시각: 4월 7일 00:47)

"거봐요. 잘 하잖아요."

gemma4: 감사합니다. 😉 결국 정확한 명령어를 조합해서 깔려있는 정보를 긁어오는 건 제 전공이니까요. 앞으로도 필요하실 때 정확하게 짚어서 시켜주세요!


채점자 챗지피티에게 이 로그를 보여주니 평가에 반영해 점수를 변경합니다. 

파일/셸 자연어 작업: 8.5/10 정도

실사용성: 높음

GUI/비검증 작업 신뢰도: 낮음

Gemma 4는 지금 환경에서 “텔레그램 기반 로컬 파일 작업 비서”로는 충분히 유능합니다.


젬마4 한번 써보세요. e2b, e4b 같은 경량 모델들도 기대 이상입니다. 






하루세끼 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [10]
musicplanet
IP 116.♡.213.201
04-07 2026-04-07 04:20:25
·
좋은 내용 감사합니다. 혹시 e4b로도 테스트해보실 계확 있으신가요?

챗gpt로 평가는 어떤 방식으로 하신 건가요?
하루세끼
IP 121.♡.186.216
04-07 2026-04-07 12:43:13
·
@musicplanet님 챗gpt한테 지금 상황에 대한 맥락을 대략 설명해주고 체크리스트 만들어서 채점해 보자고 하면 평가 항목 만들어 줍니다.
느아아아
IP 59.♡.5.79
04-07 2026-04-07 04:20:37
·
좋은 정보 감사합니다
Watanka
IP 73.♡.157.38
04-07 2026-04-07 04:45:59
·
어제 다운 받아습니다.
오늘 한번 테스트해보려고 했는데 생각 보다 쓸만한가 보네요.
바이데이
IP 118.♡.11.94
04-07 2026-04-07 09:17:41
·
맥미니가 24gb라서 8b모델을 써야할거같은데.
e2b e4b보다 8b가 높은거죠..?
하루세끼
IP 121.♡.186.216
04-07 2026-04-07 12:44:18
·
@바이데이님 e4b는 24기가에서도 돌아가는 모델이고 성능은 상위 모델의 70-80%정도인 걸로 알고 있습니다. 단순한 작업에서는 큰 차이를 느끼지 못할 정도라고 알고 있어요. 8b는 정식 배포 모델은 아니고 튜닝된 것 같습니다. e4b 정도면 충분히 돌아갈 것 같아요. 상위 모델에서는 지원 안 하는 음성 인식이 된다는 장점도 있고요.
결론적으로
IP 165.♡.201.138
04-07 2026-04-07 09:43:42
·
올해 하반기나 내년 정도면 홈AI 디바이스들이 쏟아져 나오겠네요...
내년이면 모바일단에서 현재 수준의 AI들이 인터넷 토큰소비 없이 마치 네비 업데이트마냥 가능하게 될 것 같고요...
Mr.UN
IP 14.♡.43.15
04-07 2026-04-07 10:18:32
·
Gemma4는 QLoRA 는 물론 full fine tuning까지도 가능한 구조라서 기본 버전이 7~8점대를 받았다는 건 엄청난 성과라 생각합니다. 특정 도메인 관련 보강 학습만 시키면 유료LLM들과 구분이 어려운 수준까지도 갈 것 같습니다.
다국어 데이터셋 밸런스 문제가 심한 Qwen시리즈와 지원 언어수 제한이 아쉬운 Granite4 와의 격차를 또 크게 벌리네요.
하루세끼
IP 121.♡.186.216
04-07 2026-04-07 12:46:08
·
@Mr.UN님 저도 개인적으로 만들고 싶은 모델이 있어서 다른 모델들로 작업하다가 젬마4가 정말 압도적으로 좋다는 걸 느낍니다. 상업적으로도 사실상 제한 없이 쓸 수 있으니 활용도가 무궁무진할 것 같습니다. 진짜 세상이 어떻게 바뀔지 감이 안 오네요.
Mr.UN
IP 14.♡.43.15
04-07 2026-04-07 12:50:24
·
@하루세끼님 올해 후반 정도면 특정 도메인에 특화된 스킬이나 모델이 대거 등장해서 대형LLM 들과 경합하는 시장이 본격적으로 열릴 것 같습니다. 생태계만 탄탄하게 만들어진다면 많은 도메인 전문가나 개발자 분들이 전세계에서 수익을 얻으실 수 있을 것 같아요.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.