CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·방탄소년당 ·일본산당 ·개발한당 ·자전거당 ·안드로메당 ·이륜차당 ·육아당 ·소셜게임한당 ·소시당 ·가상화폐당 ·AI당 ·골프당 ·디아블로당 ·클다방 ·나스당 ·리눅서당 ·걸그룹당 ·야구당 ·영화본당 ·젬워한당 ·사과시계당 ·노젓는당 ·캠핑간당 ·패셔니앙 ·맛있겠당 ·IoT당 ·키보드당 ·라즈베리파이당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·물고기당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·바다건너당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

사용기

전자기기 오픈클로(OpenClaw) 외부 AI와 로컬 LLM은 얼마나 차이가 날까? 29

5
2026-02-12 18:02:48 수정일 : 2026-02-12 18:05:06 61.♡.39.5
SHERLOCK

※ 개인적인 견해이고 비전문가이므로 당연히 내용이 틀릴 수 있습니다.


며칠동안 오픈클로를 써보고 낸 결론은 일단 이 한 줄입니다.


 - 내 문맥대로 스크립트를 AI한테 시켜서 짜주는 기능


흐름으로 좀 표현해보자면


사용자가 지시 → 오픈클로가 AI한테 전달 → AI가 해석 후 오픈클로한테 다시 전달 → AI한테 전달 받은 내용을 바탕으로 오픈클로는 이러이러한 식으로 스크립트를 짜야할거같아 라고 AI한테 지시 → AI가 스크립트 작성 후 사용자 지시 내용을 수행 → 결과값을 AI가 오픈클로한테 보냄 → 오픈클로가 사용자한테 보고


즉, AI는 크게 두 가지 목적으로 쓰인다는 느낌입니다.


1. 사용자의 지시를 오픈클로가 이해하는데 도와줌

2. 사용자의 지시를 이해한 오픈클로가 다시 AI한테 지시한 내용을 AI가 스크립트로 짜줌


다시 말하자면 AI는 말을 잘해야하고 스크립트를 잘 짜야 한다.. 정도로 저는 느끼고 있습니다.


그런데 사람이라도 말빨이 천차만별이고 개발자라도 코딩 능력이 천차만별이잖아요. AI도 동일하게 적용되는 느낌입니다.



1. 사용하는 외부 AI 모델들

우선 저는 깃허브 코파일럿으로 $10짜리를 결제했고 이중에서 그록, GPT 4.1, GPT 4o. GPT 5 미니 등은 무제한으로 사용, 제미나이 3 프로 프리뷰는 사용량 차감이 되는 요금제도 위 모델들을 돌려봤고요


일단 제가 쓰는 용도에서 가장 말 잘 듣는 건 제미나이 3 프로 프리뷰입니다.


내일 오전 11시 30분에 점심약속을 맥 캘린더에 넣어줘. 캘린더는 개인 캘린더로 넣어주면 되.


라고 텔레로 일 하나 던져주면,


 - 제미나이 3 프로 프리뷰: 개인 캘린더로 내일 오전 11시 30분 점심약속 이라고 반영

 - GPT-4o / GPT 4.1 / 그록: 내일 00:00에 점심약속 이라고 반영


의 차이점이 있더군요.


시간이 잘못되서 자꾸 시간 수정 요청을 해도 세개는 못 알아먹던데 그나마 그록은 전체 일정 보여달라니 자기가 시간을 잘못 넣었음을 인지하고 뒤늦게 수정하긴 했지만 어쨌든…


그리고 GPT-5-미니는 접근권한이 없다면서 배쨌던걸로 기억합니다.


아무튼, 제가 일정 넣으라고 말하면 맥 캘린더 실행시키고 일정 넣는 걸 스크립트 짜준다고 생각하면 되고 AI 모델들마다 스크립트 짜는 방식도, 내부 최적화 같은 것들도 각기 제각각인것 같습니다. 즉, GPT-5-미니는 스크립트 짜는 방법을 거의 모르는 느낌입니다.



2. 그런데 좀 재미있는 부분

제미나이가 여기서 또 강점이 있는데 뭔가 스크립트가 잘 안짜지면 제가 수동으로 작업하라거나 내 생각은 이럴 거 같아서 이렇게 해봤는데 잘 안 되네. 더 좋은 방법 알고 있어? 혹은 다른 방법으로 시도해볼게 등. 지 나름대로 최적화를 시도하려고 할 때가 있더군요.



3. 로컬 LLM은 외부 AI 대비 어느 수준일까?

그렇다면 로컬 LLM들은 어떤 수준일까요? 일단 LLM을 돌리는 최소사양도 못 미치지만 취미로 돌려보기엔 최대치에 가까운 맥미니 M4 기본형에 램만 32GB로 올려서 샀습니다.


언어 모델은 GPT-OSS:20b, qwen3 계열의 30b 들을 돌려봤는데요..


안녕? 이란 말에 대답을 듣기까지 빠르면 1분, 느리면 몇 분의 시간이 소요됩니다…..


그리고 파일작업 할 수 있어? 라고 물어보면 이유는 모르겠는데 몇 분 있다가 커넥션 타임 아웃이 뜨던가 짜다만 스크립트 던져주고 끝나기도 합니다.


그 밖에 안녕?은 한글로 답했다가 너는 무슨 모델이야? 라고 물어보면 영어로 답하기도 하고 (이건 grok도 그런 경향이..) 휴지통 비워달라고 하면 메시지를 성공적으로 보냈다는 등(…) 온라인 AI가 성인 수준이라면 로컬 LLM은 유치원 수준도 안 되는 저지능이어서 로컬 LLM으로 오픈클로를 돌려보겠다 뭐 이런 생각은 포기하시는 게 좋을듯 합니다.


즉, 32GB 맥미니 M4에서 로컬 LLM을 통해 오픈클로를 돌릴려면 문맥 다듬기 같은 것들만 가능하다… 근데 이런거 할려면 그냥 챗GPT나 구글 제미나이같은데서 하는 게 훨씬 더 빠르다 가 되겠고요,


스크립트를 통해 맥 내부에서 작업하기엔 로컬 LLM들이 스크립트도 모르고, 스크립트를 어떻게 짜야할지도 몰라서 그냥 바보라 생각하면 됩니다. (온라인 AI 중에선 GPT-5-미니가 좀 유사합니다. 4o나 4.1에선 무리없이 하는 걸 5-미니는 권한 없다고 배째는 경우가 많음)



번외 1: 맥 기준에서 점프데스크탑은 필수

외부 AI용 오픈클로는 집에 M1 맥미니에 돌리고 있는데 특히 첫 실행 동안은 오픈클로가 작업할려면 맥OS에서 사용자한테 권한 사용 여부를 물어볼 때가 많아서 한동안은 점프데스크탑 열고 권한 물어볼 때마다 일일이 사용자가 허가를 해줘야 합니다.)



번외 2: 그록은 가급적 지양

갑자기 폭주하면서 에러메시리를 수백개 이상 보낼 때가 있습니다. 해결방법은 터미널에서 게이트웨이 리스타트.. 위에도 잠깐 언급했는데 일정 넣으라고 했지만 제가 말한 시간으로 일정을 넣지 않은건 그록이나 gpt나 마찬가진데 그 날 일정 전체 보여달라고 할 때 그록은 지가 넣은 일정의 시간이 잘못됨을 깨닫고 그록은 일정 시간을 수정한 후 그 날의 전체 일정을 보여주더군요.


근데 하루에 3~4번씩 폭주하며 텔레로 메시지 수백개를 십수초만에 쏟아내는 경험을 하고 나면 일단 그록은 좀…



번외 3: 텔레그램 상에서 언어 모델 변경도 가능

잘 안 될 때도 있는데 제미나이 3 프로 프리뷰 <-> gpt 4.1을 텔레그램 상에서 바꿔달라고 하면서 왔다갔다 하며 씁니다.



번외 4: 제미나이를 기준으로 했을 때, 제미나이는 사람으로 치면?

개인적인 느낌으론 일반 성인하고 대화하는 느낌입니다. 아래는 (아마도) 제미나이의 답변입니다.


——————

정리하면, 새벽 4시 30분에 반복할 작업은 아래와 같아:


1. /Volumes/1TB SSD Y/DS120j Recording/R/ 폴더 내 전날짜 폴더(YYYY-MM-DD 형식) 진입

2. sm 확장자(*.sm) 파일 모두 삭제

3. ts 확장자(*.ts) 파일 중

→ 이름이 유사한(중복) 파일이 있으면 가장 큰 용량의 파일만 남기고 나머지는 삭제

4. 남은 ts 파일 전부 /Volumes/1TB SSD Y/SynologyDrive/ 폴더로 이동

5. (필요시 완료 알림)

이렇게 맞지?

작업 예약 걸기 전에 아래 사항만 짧게 확인해줘:


• "유사한 이름(중복)"의 기준: 예시 파일명 2~3개만 알려주면 더 정확하게 필터 가능!

• 완료 알림(텔레그램 등)도 받을지?

바로 예약 적용할 준비 되어 있어!

확인 후 진행할게!

—————————


제가 자동화 조건을 좀 추상적으로 말하니 예를 들어 구체적으로 알려주면 좋겠다라는 내용은 감탄이 나오더군요.


그리고 아마도 텔레그램 창이 하나의 세션으로 활성화되어 있고 이 세션이 종료되지 않는 한 내가 어떤 작업을 하는지 기억을 하는데 이것도 단기 기억이 있고 장기 기억이 있고 제가 뭐 기억하라고 시키진 않았지만 주인놈이 나한테 이런 작업 같은거 많이 시킨다 이런 것들은 지 나름대로 캐치해서 알더군요.



번외 5: 제가 오픈클로를 쓰는 용도

일단 텔레로 주고받는다는 게 편하고.. 제일 많이 쓰는 작업은 파일작업인데, 맥북, 맥미니, 윈도우 PC 등등 장소마다 다른 컴터들을 쓰고 있고 NAS로 시놀로지 드라이브 동기화 걸어놓고 모두 동기화 시키는데 며칠 지나면 자동으로 비동기화 NAS 폴더로 보내는 식의 자동화를 일단 제일 많이 쓰고,


조금씩 조금씩 일을 더 시켜가며, 오픈클로를 학습시키고 저도 이놈이 어떻게 돌아가는지를 이해할수록 이 녀석을 더 잘 쓸 것 같습니다 ㄷㄷㄷ 테스트삼아 헤 본 건 일정 추가, 미리알림 추가, 메모 추가 등등입니다. 웹의 경우 크롬 익스텐션 쓰면 간단한 접근은 가능한데 이것도 언어 모델마다 크롬 접근 방법이 제각각이더군요.

SHERLOCK님의 게시글 댓글
SIGNATURE
지킬 것이 많아도 모험해보지 않겠는가?
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [29]
젤리즈
IP 222.♡.133.233
02-12 2026-02-12 20:17:53
·
로컬에서 20b는 좀.. 10b 위아래
그 밑에 모델로 가는게 낫지 않을까 합니다.
SHERLOCK
IP 61.♡.39.5
02-12 2026-02-12 21:27:16
·
@젤리즈님 20b가 저정돈데 12b 이하는 스크립트 짜야하는 구조나 문맥 이해가 전혀 안 되는 수준이더군요 ㄷㄷㄷ
DearMai
IP 175.♡.30.145
02-12 2026-02-12 20:43:41 / 수정일: 2026-02-12 20:45:10
·
gpt-oss-20b, qwen3 30b 속도는 메모리 대여폭 문제일수도 있을것같습니다.
openclaw 는 안써봐서모르지만 lm studio 내에선 맥미니 M4Pro 64GB 로 사용하는데 꽤나 빠르게 응답합니다.
둘다 타이핑 까지 다 끝나는데 체감 약 3초? 수준입니다.
DearMai
IP 175.♡.30.145
02-12 2026-02-12 20:46:12
·
중간에 모델 바꿨는데 qwen 이 자기가 chatgpt 라고 헛소릴하네요 ㅡ,.ㅡ;;; 문맥이 이어져서 그런걸로 알고 ...
SHERLOCK
IP 61.♡.39.5
02-12 2026-02-12 21:27:54
·
@DearMai님 올라마에 올려서 했을 땐 그럭저럭 괜찮습니다. 그런데 본문에도 적었듯이 이걸 오픈클로에 올리면 그 과정이 복잡해져서 그러는건지 상당히 느려지더군요
한스도이치
IP 119.♡.178.101
02-13 2026-02-13 06:47:07
·
glm5 출시했는데 싸고 좋습니다
openclaw 에이전트 여럿 추가해서 쓰는데도 max플랜 사용량이 널널합니다
SHERLOCK
IP 61.♡.39.5
02-13 2026-02-13 13:29:41
·
@한스도이치님 저는 일단 깃허브 코파일럿의 GPT 4.1로 정착하겠습니다 ㅋㅋㅋ
elbum
IP 193.♡.245.151
02-14 2026-02-14 20:07:46
·
@한스도이치님 프로바이더 어디로 쓰시나요? openrouter ?
웅이C
IP 222.♡.67.218
02-13 2026-02-13 08:50:19
·
어제 큰맘 먹고 맥미니 M4 Pro 64GB 질렀습니다.
받을 때 까지 뭘 시킬지 고민을 좀 해봐야겠네요
SHERLOCK
IP 61.♡.39.5
02-13 2026-02-13 13:29:58
·
@웅이C님 프로는 또 램 스피드가 다르니... 제가 말한 결과와는 다를 수도 있습니다 ㄷㄷ
삭제 되었습니다.
Mr.UN
IP 14.♡.43.15
02-13 2026-02-13 12:31:06 / 수정일: 2026-02-13 12:49:32
·
Qwen3은 컨텍스트 사이즈를 포함해서 대화를 시도하면 llm이 리부팅되어 모델크기에 따라 답변에 약 60~190초 정도 시간이 소요됩니다.
따라서 기동 후 맨 처음 아이들링 메시지를 보낼 때 한 번 만 CTX값을 넣어서 송신하고 이후에는 base_ctx=None으로 호출해야 합니다만, 별로 안내가 되지 않아서 많은 분들이 동적 제어로 리셋을 반복하면서 그 원인 분석에 며칠 씩 고생하는 경우가 많습니다.

또 Qwen3 은 다국어 데이터셋 비율이 좋지 않아서 영어와 중국어 외의 언어로 이용하는 것은 무리가 있습니다.
게다가 특정 문장이나 명령어를 주면 그것을 자신의 발언으로 혼동하여 이어서 동작하는 등의 불안정한 동작이나, 답변 무한 루프 등도 심해서 별도의 추가학습을 시키지 않는 한, 오픈클로와 같은 범용 용도로 중요한 미션을 주기에는 부적합한 모델입니다.

단순 퍼포먼스만으로 보면 우수한데, Qwen3 30B는 3090 에 기본 세팅만 해도 70tok/s, 최적화가 잘 되면 동일 하드웨에에서 200tok/s까지도 나옵니다. 맥 MAX에서 돌려도 30~40tok/s 정도가 나와서 일반적 사용에는 무리가 없습니다.
SHERLOCK
IP 61.♡.39.5
02-13 2026-02-13 13:30:45
·
@푸하핫님 오픈클로에 물리면 올라마보다도 입출력 과정이 많고 복잡해져서 그런가 너무 느려지더군요 ㅠ
Mr.UN
IP 14.♡.43.15
02-13 2026-02-13 14:31:36
·
@SHERLOCK님 입출력 과정이 많고 복잡해서라기 보다는 오픈클로가 요구하는 업무 관련한 지식이 부족해서 판단을 못 내리는게 아닐까 생각됩니다. 기본 채팅 모델에 스킬만 던져주고 모르는 걸 해결하라고 하는것 자체가 하면 안 되는 시도이기도 하고요.
SHERLOCK
IP 61.♡.39.5
02-13 2026-02-13 15:20:31
·
@푸하핫님 말씀하시는 게 아주 틀린 말은 아닐텐데요.. 제 경험을 좀 쓰자면..

저: 파일관리 할 수 있어?
오: 파일관리 못해요. 텍스트 요약 이런 건 가능해요.

근데 저 두 문장 주고받는데도 분 단위가 걸려서 뭔가 오픈클로가 이해하는 방향을 말한다는 게 불가능하더군요.


지금 GPT 4.1 물려 쓰는 경우

나: 특정 폴더에서 맥용 사진앱에 임포트 시킨 후 자동보정 걸고 JPG로 다시 추출할 수 있어?
오: 자동보정 거는 건 수동으로 하셔야 할 거 같은데요
나: CMD + A, CMD + E 쓰면 될 거 같은데?
오: 되겠네요. 스크립트와 오토메이트 조합해서 짜볼께요.

이런 형태로 대화의 흐름이 최대 수초 정도의 딜레이를 두고 이어집니다
Mr.UN
IP 14.♡.43.15
02-13 2026-02-13 18:20:37
·
@SHERLOCK님 네 말씀하시는 지점이 바로 아직 AGI에 도달하지 못 했다고 평가되는 부분입니다. 이미 다 알고 있는 지식인데도 그걸 유기적으로 엮어서 결론을 내리는 능력이 부족하거나 보안상의 이유로 중단시키고 있어서 사용자의 개입이 절대적으로 필요하지요.
5.2 이상에서는 해당부의 트리거를 풀어주냐 마냐의 정책에 의해 더 알아서 돌아갈 수 있는 사실상의 AGI 단계를 정책으로 막아뒀다고 보여지고요...
클로드는 쏘넷, 오퍼스 모두 토큰을 미친듯 먹기 때문에 오픈클로에 api로 열어주면 한 달 수백만원도 가뿐하게 나오고, 제미나이3 pro 프리뷰도 GPT5.2에 비하면 3~8배 가량의 토큰을 소모하고 환각이 심하므로 주의가 필요합니다.
GPT5 이상을 쓰면 비용과 환각 측면에서 안심할 수 있지만, 업무 목적이 아닌 취미라면 역시나 좀 부담은 되실 겁니다.
무한비행
IP 39.♡.230.102
02-13 2026-02-13 12:52:05
·
제가 생각하는 OpenClaw를 개인용 비서로 만들게끔 하는 것의 핵심은 AGENTS.md를 비롯한 agent 지침들이지, 메신저 연동, 스킬, 로컬 리소스 엑세스 등 기능들은 곁다리인것 같습니다. 해당 파일들만 잘 가져다 쓰면 앞으로는 굳이OpenClaw여야만 할 필요도 없고요
SHERLOCK
IP 61.♡.39.5
02-13 2026-02-13 13:35:50
·
@무한비행님 저는 며칠 써보니 가장 중요한게,

메신저 연동
로컬 리소스 억세스

두 가지라 생각되네요. 단순 LLM만 이용할려면 AI 앱을 써도 되는데 일단 텔레그램을 통해 사람 시키듯이 시키고 피드백을 받는 과정 자체가 너무 마음에 드는데 갤럭시에서 전원 버튼 길게 누르는 제미나이와 비교하면

일정 추가 (여기까진 갤럭시 / 오픈클로 모두 잘 해줍니다)

그런데 추가된 일정을 수정하려면 갤럭시는 뭐가 안되고 뭐가 안되고 해서 실질적으로 유저가 일정앱 열고 수정해줘야 하는데 오픈클로는 텔레로 장소 추가해줘 메모 넣어줘 이런 걸 다 메신저로 시키고 반영해주는 차이점이 있죠.


그리고 이런 과정으로 만들어내는 결과값이 스크립트 + 파이썬 + 오토메이트를 적절히 섞어서 에이전트가 맥을 제어하는 것들이라 우선 제가 쓰는 범위에서는 파일관리나 맥의 기본 앱들을 제어하는 기능들 위주로 쓰고 있습니다 ㄷㄷ
Mr.UN
IP 14.♡.43.15
02-13 2026-02-13 18:32:13
·
@무한비행님 표현만 다를 뿐 사실 큰 차이는 없습니다. Agents.md는 첫 실행시와 compact 처리 직후에 반복적으로 제공되어서 에이전트에게 자주 리마인드를 해주는 코어 문서이고, 스킬이나 mcp는 해당 기능이 필요한 시점에 참고하면서 미션을 수행하기 위한 일회성 컨닝페이퍼라는 차이만 존재합니다.
그것보다 더 상위의 문서가 시스템에서 수시로 내려주는 시스템메시지로 기본 동작과 보안 등에 대한 지시+ 보안 이슈 감지시 추가 주의문 같은 것들이라 사용자가 건드릴 수 없는 부분입니다.
오르다
IP 223.♡.214.49
02-13 2026-02-13 16:51:14
·
16기가에서 32로 올리신걸로 봤던거 같은데요.
16기가 주문하고 대기중인 상태인데 두 모델 비교하면 어떤지 궁금합니다.
32에서 로컬 돌리는 의미(?)가 실제로 있을까요
Mr.UN
IP 14.♡.43.15
02-13 2026-02-13 18:26:55 / 수정일: 2026-02-13 18:27:28
·
@오르다님 m3, m4 64GB 등에서 돌려본 결과, RTX3090의 1/3 정도 속도가 한계입니다. 내부 버스가 930GB/s : 270GB/s 로 차이가 커서 어쩔 수 없는 결과입니다. 다만 이번 m5에서는 큰 개선이 있을 거라고 해서 기다리고 있습니다.
단순히 16GB와 32GB에서의 차이라면 16GB에서는 30B정도 사이즈를 못 돌리고, 32GB에서는 Qwen3 30B 4bit 양자화 모델을 돌릴 수 있다는 차이가 있습니다.
오르다
IP 121.♡.48.183
02-13 2026-02-13 23:11:21
·
@푸하핫님 써주는 글들 감사하게 잘 보고 있는데요. 주로 코파일럿을 통한 api를 자주 쓰시는 것 같고 로컬LLM은 초반에 테스트할 때 이후로 안쓰시는 것 같아서요.
32G에서 의미있는 로컬 LLM의 속도나 품질이 나오는지가 궁금해서 여쭤봤어요. 그렇다면 외부 api 의존도가 확실히 줄테니까요.
Mr.UN
IP 14.♡.43.15
02-14 2026-02-14 20:56:32
·
@오르다님 Qwen3 30B coder를 상당히 심각하게 써봤고 지금도 시스템에 5개의 온디바이스LLM을 돌리고 있습니다만, 냉정히 말씀드려서 속도는 문제 없습니다만 품질은 안 됩니다.
발표되는 모든 온디바이스 LLM 들은 기본이 채팅모델이라 언어 데이터셋이 대부분이기 때문에 (원하는 동작을 위한) 품질은 추가 학습이 수반되어야 합니다.
꼬소
IP 183.♡.12.92
02-14 2026-02-14 17:24:44
·
경험기 잘 봤습니다.
동일한 고민 동일한 경험 하신 듯합니다.

저도 openclaw 때문에 M4 기본형 32GiB 모델을 구입하였는데, ollama와 openclaw의 반응이 너무 차이나서 괴리감을 상당히 느끼고 있습니다.
아직 배송 받은지 2주가 지나지 않아, 성능적 실망감에 반품해야 되나 고민 중 이 글을 보게 되었네요..

다른 분들의 댓글에서 HW 성능 차이점과 아직 모델의 한계로 인해 응답이 느린 것으로 이해되지만, 그 차이가 너무 큰게 문제입니다.
아마도 이 부분이 개선되려면 상당한(?) 시간이 필요하지 않을까 생각합니다.
그래서 더더욱 VM(KVM기반) openclaw + 구독형 LLM(제미나이프로)이 더 나은 선택이란 생각이 들기도 하구요.
하지만 앞으로 몇년간 메모리 가격이 내릴 기미가 없을 것 같아 그냥 놔 둘까 싶기도 합니다. 하지만 너무 배부른 고민인 것 같네요 .
Real_G
IP 1.♡.214.149
02-15 2026-02-15 08:26:20
·
로컬 LLM 시도해본 사람들 후기들이 모두 Local 로는 못쓰겠다는 의견들이어서.
그냥 맥미니 깡통에 API key 쓰라고 하더라고요.
BernardKim
IP 222.♡.153.150
02-16 2026-02-16 22:25:39
·
@Real_G님 API를 사용할꺼면 비싼 맥미니보단 N100같은 저렴한 PC를 사용해도 되겠죠?
SHERLOCK
IP 211.♡.249.94
02-16 2026-02-16 10:46:53
·
일단 16기건 32기가건 M4 기준에선 로컬 LLM 올려서 오픈클로 쓰겠다는 건 포기하세요.

저도 그냥 램 많은(...) 맥미니로 쓰고 있습니다 ㅋㅋㅋㅋㅋㅋ

간단한 문답정도는 가능할수도 있겠는데..

아, 그리고 저는 카카오 대란으로 구입한 챗GPT 프로의 Oauth 연동으로 GPT 5.3 코덱스로 돌리고 있습니다.

아무튼 오픈클로를 이제 막 신입사원이라 생각하고 알려주면 될 거 같습니다.

처음엔 못하는데 다른 방법을 찾아볼까요? 하고 물어봅니다. 한 번 해보라고 하면 이런 저런 방법을 찾아내서 과거엔 못하던 거를 할 수 있게 되고 이런식으로 계속 쓰다보면 오픈클로가 할 수 있는 일들이 점점 많아집니다.

이걸 로컬 LLM은 현 시점에선 32GB 램 기준에선 100% 무리라고 생각합니다.
보고또또보고
IP 125.♡.41.31
02-16 2026-02-16 19:03:57
·
저는 안드로이드폰에 openclaw를 설치하고 써봤는데 telegram으로 그냥 테스트삼아 간단한 질문을 하니 LLM Error 블라브라 에러만 뿜내요. gemini 던 gpt 던 모델 상관없이요. 놀고 있는 리눅스 깔린 노트북이 있는데 여기다가 제대로 openclaw를 설치해서 테스트해볼까 합니다.
SHERLOCK
IP 211.♡.249.94
02-16 2026-02-16 21:16:22
·
@보고또또보고님 오픈클로를 제대로 활용하려면 맥이나 윈도우가 답인건 맞다는 생각인게요..

지금 제 오픈클로는 지가 브라우저 열어서 장바구니 다 쟁여두고 맥용 캘린더 같은 것들 스크립트로 일정 관리해주고 그러거든요. 브라우저 열고 실행하는것도 때때로 오픈클로가 막힐 때가 있는데 이럴 땐 제가 스크린샷으로 오픈클로가 막힌 부분 알려주면서 해결해주고 이러면서 지내고 있습니다 ㄷㄷㄷ
나의님프로
IP 125.♡.155.214
02-16 2026-02-16 23:01:34
·
일부 공감할 수 있는 부분이 있습니다.

하지만 다른 경험으로 인해 다를 수도 있겠다는 생각이 들어서 ...

전, v100 16gb과 rtx3070(8GB)를 win11에 연결해서 동작시키고 있습니다. gpt-oss:20b에 32K 컨텍스트로 다시 만들긴 했지만 (ollama배포내용임) 차이는 없을 겁니다.

여기서 vm으로 windows에서 설치했는데 어떨 때는 답변이 되는 것 같은데 잘 안되더군요. 그래서 이게 안되나 하는생각에 그냥 모델이 작은 모델이래도 추론만 잘하면 하루가 걸려도 된다는 생각에 어제밤부터 오래된 CPU사용하는 나스에 3B/4B모델 중 tools를 지원하는 모델을 올려서 테스트를 해봤는데 fetch failed로 답이 안와서 포기하다 기왕 만든 거, PC의 ollama와 연동해서 해봐야겠다고 생각해서 삽질을 좀 했는데.

이게 동일한 모델인데도 답이 너무 빠르게 잘 나오는 겁니다. 물론 기본적으로는 날씨 , 또는 web_fetch만 하는데. 안녕이란 질문에, 20s정도는 걸리긴 하네요..
그럼에도 불구하고, 출력결과는 제법 말은 통하는 것 같긴 합니다. 결국 답을 잘 못가지고 오는건 API가 없어서 검색을 못하고 방법만 알려줘서, headless browser를 docker에서 써볼려고 고민 중인데.

PC를 켜놓아야 하는 현실과 (16G+8G에 20B정도는 올릴 수 있더군요 다 GPU로) 소음(v100의 팬소리가..ㅠ.ㅠ 아직 최적화는 안되어 있어서) .. 간단한 비서정도로 브라우저만 공유하면 가능하지 않을까 라는 생각이 좀 듭니다. 검색을 브라우저로만 잘되면 일단 결과물을 분석하는게 할 수 있는데 이게 막혀서 아직 확신은 못하겠습니다. 좀 똘똘해지지 않을까 싶기도 하고.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.