IT는 좋아하지만 프로그래밍이 직업이 아닌 사람들의 오픈클로 사용기입니다.
테스트 기기 (맥)
- 미니 M1 (8/512)
- 에어 M3 (16/1024)
- 미니 M4 (16/256)
1. 설치가 로또다
우선 미니 M4에서 설치를 해봤는데 최종적으로는 설치를 못했습니다. 원론적인 설치법은
- 노드 설치 → 홈브류 설치 → 오픈클로 설치 → 온보드로 셋업
의 과정인데 오픈클로 설치 과정에서 SUDO로 실행시켜야 설치가 되고 미니 M4의 경우는 텔레그램 토큰값을 넣어줘서 봇을 돌림에도 응답이 없고 (동일 과정을 미니 M1, 에어 M3는 문제 없이 했음) 미니 M1은 정확하게 기억은 안 나는데 M4하고 또 다른 오류로 구동이 안되서 M1은 초기화 한 번 해주고 정상적으로 설치했습니다.
2. 왜 맥인가?
써보니까 두 가지 맥락에서 규정지을 수 있을듯 합니다. 챗GPT나 제미나이처럼 외부 AI를 연동시키는 방법, 로컬 LLM을 돌리는 방법인데요,
- 외부 AI를 연동할 경우 맥의 필요성
저전력 + 저발열 + 무소음. 사실 이걸로 종결이지 않나 합니다. 외부 AI를 연동시킬려면 기기 성능보다도 있는듯 없는듯이 더 중요한 점이고 이 관점에서라면 굳이 M4 기본형을 살 필요 없이 M1이나 M2 중고 최대한 싼 거 사서 돌리는 게 무조건 더 이득이지 않나 합니다.
- 로컬 LLM을 쓸 때 맥의 필요성
저전력 + 저발열 + 무소음에 통합 램때문인듯 하더군요. x64 + GPU 조합은 엔간하면 16GB VRAM이 발목을 잡게 되는데 맥은 CPU + GPU의 통합 램으로 인해 24 GB ~ 64GB(M4 / M4프로 미니)를 온전하게 AI를 구동하는데 쓸 수 있으니까요.
즉, 속도는 엔비디아 GPU + VRAM이 당연히 좋지만 이를 구동하려면 전력 + 발열 + 소음 때문에 가정용으로 24시간 상시 구동에 맞는가? 에 대한 질문. 그리고 저 두 조합보다는 느리지만 어쨌건 AI가 쓸 수 있는 RAM 용량 자체는 x64 더 쉽다는 점 때문에 로컬 LLM을 위해서라도 x64들보다 맥을 더 추천하는 거 같습니다. M4 통합 램 대역폭이 120GB/s인데 이게 GPU VRAM보다는 많이 느리지만 x64용 DDR5 보다는 두 배이상 빠르니까요.
그렇다면 이쯤에서 드는 의문. 뭘로 보나 미니 M4 기본형은 제일 어정쩡하고 애매한 물건인데 이게 왜 품귀일까? 하는 점입니다. 외부 AI 끌어쓸려면 M1만 되도 치고 넘치고 로컬 LLM 돌릴려면 기본형 16기가는 많이 부족하니까요. (즉, 30 정도면 중고로 구할 수 있는 M1이 제일 괜찮아 보이는데..)
3. 무엇을 할 수 있나?
제미나이 물려서 제가 시도해 본 몇 가지 작업들입니다.
- 네이버페이로 지난 달에 샀던 물품 좀 알려줘
- 다운로드 폴더의 파일들 지워줘
- 바탕화면에 있는, 2025년 10월에 만들어진 스크린샷 파일들을 지워줘
오픈클로는 (조건이 맞았을 경우) 위 작업들을 모두 완벽하게 처리하더군요. 처리 흐름이 대략 이렇게 되는 거 같습니다.
사용자가 일을 시킴 → 오픈클로가 제미나이한테 시킴 → 작업 권한은 오픈클로가 넘겨줌 → 제미나이 결과값을 오픈클로가 받음 → 오픈클로가 사용자한테 결과 보고
AI 에이전트라는 말 답게 질답만 하는 LLM에게 컴터 내부 작업들을 마구마구 시키는 놈이 오픈클로인거죠.
로컬 LLM의 경우 일단 미니 M4에 오픈클로가 제대로 안 깔려서 미니 M3에 깔아봤는데요 몇 가지 제약이 있습니다.
- 딥시크나 gemma 같은 LLM들은 아직 오픈클로에서 지원하지 않음
- 램에 따라 구동 가능한 로컬 LLM 모델들이 다름
일단 딥시크, 제마같은 것들은 오픈클로에서 쓸 수가 없어서 저는 qwen3으로 로컬 LLM을 돌리고..
에어 M3가 16기가 램이지만 16기가 다 쓰는 LLM이 돌아가면 컴터를 못 쓸 정도로 느려져서 우선 8GB에서 구동 가능한 qwen3:8b로 테스트해봤는데요..
그냥 qwen3:8b 요놈은 바보라고 칩시다. 제미나이가 파일 삭제 명령을 주면 1~2분만에 깔끔하게 다 지우고 결과갑 텔레로 쏴주는데 qwen3:8b는 같은 명령을 주면 파일 삭제 방법을 알려주는데만 몇 분이 걸리더군요.
4. 비용
오픈클로는 무료지만 외부 AI를 끌어 쓰면 당연히 토큰값은 내야죠. 저같은 경우..
구글 AI 스튜디오에서 API 키값 받아 오픈클로에 연동 → 자꾸 돈내라는 메시지만 나오고 사용 불가 → 구글 원 프리미엄 가입 → 이게 첫 달 무료 때문인지 구글 AI 스튜디오는 여전히 무료 계정이라 나오면서 사용 불가 → 무료 사용 기간 없이 월 2.9만원인 구글 AI 프로 결제 → 유료 API 사용 가능
의 과정으로 API키를 연동시켜 제미나이와 붙여봤고요.
기본적인 텍스트 입출력은 비용이 쎄지 않은 거 같은데 사이트 들어가서 뭐 봐라. 파일작업 해라 이런 거는 토큰을 많이 쓰는 거 같더군요. 몇 가지 해보니 구글 AI 프로의 2.9만원과는 별개로 토큰 사용요금 만원 정도가 발생합니다.
5. 묘한점
지금 에어 M3와 미니 M1에 모두 오픈클로 깔아서 텔레그램 연동 후 돌리고 있는데요..
- 에어의 오픈클로는 파일작업 같은 게 다 되는데,
- 미니의 오픈클로는 권한을 이유로 동일 작업이 안 됩니다.
오픈클로에 물어보니 권한문제라고 하는데 좀 더 알아봐야 겠습니다.
6. 다시 돌아오는 결론: 외부 AI vs 로컬 LLM
일단 맥미니 M4 32/256 하나 주문해놨습니다. 향후 과제는
- 램 8GB에서 구동되는 LLM과 16기가에서 구동되는 LLM의 성능 차이 -> 맥 내부의 작업을 얼마나 깔끔하게 할 수 있을까?
가 될 거 같아요. 미니 M4를 한 번 초기화하고 여기에 오픈클로 + 올라마 + 16GB에서 구동 가능한 LLM 설치해보고 테스트해보면서 8GB 일 때보다 좀 더 낫다면 미니 M4 기본형은 처분하고 32기가로 가는거고,
램이 8기가나 16기가나 로컬 LLM 성능이 여전히 거지같다 이러면 그냥 미니 M4 기본형은 쓰던데로 일하는 용도로 쓰고 M1에 제미나이 같은 거 물려야죠.
이상 간단하게 써보는 오픈클로 사용기였습니다.
제 M4맥미니는 24/512이고 얼추 셋팅해서 맛은 봤는데 결국 m1 24 or 34 중고 찾고있어요.
일단 지금 갖고 있는 기본형 (16/256)을 초기화해서 여기에 맞는 LLM부터 돌려가며 테스트 해 볼 생각입니다
얘가 cron 작업 (예약 실행)을 하나도 못하고, 내가 항상 말을 해야만 작업을 하더라고요.. 인터넷 보니 스스로 사용 안할때도 자기가 알아서 작업을 처리한다고 하던데
그래서 지금은 미사용중인데 이게 정상인가요?
이게 좀 바보인게... 처음에 설치하고 각종 설정 변경, 할일들 셋팅하는 작업들은 flash로는 못합니다. pro나 클로드 물려놔야 설정이 좀 가능합니다.
여튼 지금은 어지간히 셋팅하고 flash로 돌리고 있는데, 이 정도 작업은 해 줍니다.
- 주식 갯수 알려주고 전일 대비 종목별 수익금액 계산
- 다양한 일정 양식 (그림, 표, 메신저 대화 등)을 주고 칼렌더에 등록
- Things3에 할일 등록
- 자전거 옷 다 알려주고 날씨/컬러 매치해서 추천
가능하다면 local LLM 돌려보고 싶긴 합니다. API 토큰 비용이 장난 아니어서요..
이 사양으로는 어려운가보군요
여기서 기존의 8b 대비 유의미한 발전이 있다면 32기가로 과감하게 고 하려고 하고 8b나 12b나 별 차이 없다면 좀 고민을 해보려고 합니다
로컬 모델 돌리실꺼면 nvida에서 출시한 LLM 전용 머신이 있습니다.
조금 더 투자하더라도 차라리 이런게 더 나으실꺼에요.
속도를 차치 하더라도 제미나이는 사람처럼 말 잘 알아먹는데 제가 써 본 로컬들은 바보들이어서 ㄷㄷㄷ
그리고 본문에도 적었지만 집에서 24시간 로컬 LLM 돌리고 오픈클로 올릴려면 결국 애플실리콘밖에 답이 없는 게 현실이죠. 전력과 소음...
그런데 16 -> 32로 늘려봤자 더 큰 모델 돌리는건 힘드실꺼에요.
보통 8b 다음은 중형급인데 이건 20b이상으로 갑자기 커집니다. 개인 PC에서 돌릴 수준이 아니에요.
그리고 이렇게 모델이 커지면 응답속도는 더 느려져 버리는 문제도 있구요.
qwen은 안써봤는데 일단 llama계열 한국어 파인튜닝한 모델이나 요즘 국내에서도 각 기업에서 소형 모델 출시한게 꽤 있더군요.
모델을 바꿔서 한번 시도를 해보세요.
모델은 호한성은 vllm 같은 걸 이용하면 openai 호환이 되기때문에 모델 선택에서 조금은 더 자유롭지 않을까 싶기도 합니다.
openclaw를 써보진 않았지만 openai ai를 지원한다면 아마 되지 않을까요? ㅎㅎ
이 그럭저럭이라는 것도 모델별 특화 성능이나 쓰임새에 따라 각각 제각각이라 이거 궁금해집니다 ㄷㄷㄷ
그런데 m4 pro 까지도 코어 그렇게 많은 편은 아닙니다.
구글 AI 원 구독하면 이제 한달에 10달러치 키 준다고 한거 같은데 아직인가 모르겠네요.
자료가 모델 학습에 사용되는 문제만 괜찮다면 openrouter 같은데서 무료 모델 쓰는 방법도 있죠
간단하게 이야기해서
"내일 오후 12시 점심 약속 일정을 맥의 캘린더에 반영해줘"
를 제미나이로 돌리면 바로 반영이 되는데 로컬로 돌리면 이상한 말만 하고 등록이 안 되거든요 ㄷㄷㄷ
위의 유튭과 아무런 상관없는 사람입니다.
코파일럿요금제 가입하면 성능이 약간 낮은 LLM들 API 사용이 무료라네요.
GPT 5 MINI 가 무료라네요.
다행이 진행됫나봐요?
Skill 보안 이슈가 계속 터지니 조심하세요. Api 키 몽땅 다 털어간다는군요. 무시무시합니다.
아직 mcp도 모르는데 따라가기 바쁘네요
아이메시지로 대화하는 가족들도 페어링 해 주면... 진짜 비서처럼(?) 부려 먹기 좋아요....
GPT-5-미니는 권한 없다고 배째네요 ㄷㄷㄷ
제일 큰 차이점이..
제미나이의 경우 애플 내장 앱들과 연계하려면(예: 캘린더) 앱이 권한 요청해서 유저가 OK 해주면 개입을 합니다. 예를 들어
내일 일정 입력해 → 오픈클로가 맥 캘린더 접근 권한 요청 → 사용자가 허가 → 오픈클로가 맥 캘린더에 일정 반영 완료
이런 식으로 되는데, GPT-5-미니는,
내일 일정 입력해 → 제가 권한이 없는데요
로 끝나더군요. (재미나인 된다고!!)
폴더 관리의 경우도 제미나이는
폴더 관리 요청 → 오픈클로가 폴더 수정 권한을 OS에 요청 → 사용자가 허가 → 파일 작업 완료
로 끝나는데 GPT-5-미니는 그냥 권한 없고 터미널 명령어 알려주고 끝..
브라우저 접근도 재미나이는 지가 알아서 크롬 열고 해당 페이지 접근해서 정보 뿌려주는데 GPT-5-미니는 브레이브 API 연동하거나 크롬 익스텐션 쓰라고 하네요 ㄷㄷㄷ
구글 원 프리미엄 : gemini AI 사용권한 없음
구글 AI PRO : gemini AI 사용가능
왜 Tool 기능이 중요한가요?
오픈클로 같은 에이전트 환경에서 Tool 기능이 없으면 AI는 "말만 하는 바보"가 됩니다.
• 일반 모델: "내일 날씨 알려줘" → "죄송합니다, 저는 실시간 정보를 알 수 없습니다."
• Tool 가능 모델: "내일 날씨 알려줘" → (내부적으로 get_weather 함수 호출) → "내일 서울은 맑고 20°C입니다!" qwon이 코드에 특화되어있다고 해서 깔았다가 중국어나오고 깨져서 지움
그냥 맥 환불하시는게 좋을 것 같습니다.
1) 로컬 LLM은 상용 LLM (GPT, 클로드, 제미나이) 대비 상당히 떨어집니다. 현존하는 가장 평이 좋은 Kimi k2.5 조차도 상용 모델 중 가장 낮은 성능 (보통 미니/플래시 류) 모델과 비슷한 수준입니다. 근데 그런 모델의 크기조차 1000B 수준으로 제가 가진 512GB에서도 2bit 양자화 상태로 돌려야 합니다.
그러니 쓸만한 결과를 얻으려면 일단 M3Ultra 512로도 쉽지 않습니다.
2) M3 Ultra를 쓰더라도 문제가 있습니다... 일단 맥은 큰 메모리 대비 연산 성능이 너무 떨어집니다.
이건 흔히 말하는 prefill 성능이 낮다는 거고, 입력된 데이터의 처리 속도가 매우 느리다는 겁니다. (입력된 데이터가 처리된 후 decode = 답변을 생성하는 속도는 매우 빠릅니다. 즉 첫 답변이 시작되는 시간이 길게 걸립니다.)
AI Agent 들은 대규모 데이터를 분석하고 처리하는 과정을 반복하기 때문에, decode 속도보다는 prefill 쪽 속도의 중요성이 매우 큽니다.
결국 현재 수준에서 맥으로 돌리려면 Qwen 3 coder next (80B-A3B) 정도가 실사용 가능한 수준이고, 이걸 돌리려면 4bit 수준에서 64GB 정도가 필요합니다. (아마 64GB 맥에서 설정값 수정을 통해 구동은 가능할겁니다)
32GB 맥이면... 아마 가용 메모리가 25GB 정도 안쪽일텐데... 30B-A3B 모델 정도가 최선일거고... 이건 정말 멍청한 모델입니다.
이 부분을 설명하려면 MoE 모델의 특성도 이야기 해야 하는데... 그냥 30B (전체) - 3B (활성) 의 중간 정도 수치.. 그니까 대충 16B 정도 성능으로 보면 됩니다.
3) 쓸만한 local AI를 돌리기 위해 필요한 하드웨어
진짜 쓸만한 모델 수준은... Qwen3 235B, Deepseek v3.2, Kimi K2.5 정도 수준입니다.
이걸 돌리려면 필요한 최소 사양은 아래와 같습니다.
4bit 양자화 기준
Qwen3 235B : H200 * 2
Deepseek v3.2 : H200 * 4
Kimi K2.5 : H200 * 8
전 M4 Pro 64G 맥미니를 이용해서 로컬 LLM 을 돌려볼까 했었는데...
말씀하신 대로면... 가능성이 없네요 ㅠㅠ
64GB면 Qwen 3 next 계열 (80b)를 양자화로 돌리실 수 있을거 같습니다. 55GB 정도 할당 가능하다면요.
80B 모델부터는 그럭저럭 멍청하지는 않고 그냥저냥 쓸만 합니다.
이렇게 이해하면 될까요? 오픈클로가 일종의 MCP서버이고 제미나이가 사용자에게 받은 prompt를 이해해서 이를 실행하는 개념.
discord에 물려서 이것저것 해봤는데, clien browsing해서 요약해 잘 해주고 주식 현황도 바로 네이버 접속해서 요약해주더군요.. 제가 네이버 가라고 이야기도 안했는데..
단, 속도도 문제고 4090를 24시간 켜 놓기도 뭐해서 싼 LLM 서비스를 찾아 물려봐야할 것 같네요..
PC에 있는 몇백 기가 정도의 파일을 학습해서, 내가 질문하는 것에 대답을 하거나, 자료를 만들거나 하는 정도의 수준은 아닐까요?
결국은 Skill 연동과 Heartbeat 설정을 얼마나 잘하느냐에따라 달린거 같습니다.
터미널 온보딩 방식으로 설정은 기본만하시고
이후 커서ai에 연동해서 하시면 설정이 간편합니다. 그리고 그후 메모리설정과 각종 최적화 설정을 다 할수있어요
결국은 오픈클로우를 재밌게(?) 가지고 놀려면 바이브코딩이 필요합니다...
문제는.. 토큰 비용... 이죠 하루 몇천원은 우습게 깨져서
아직은 GPT-3.5 처음나왔을때 느낌입니다.
이럴때 NPU 달린 온디바이스AI 노트북들이 성능을 발휘하고 SLM들이 추론까지 되면 좋겠지만..
이 또한 시간문제랄거라고 봅니다.
향후 몇달안에 100만원에 slm이 돌아가는 수준이 되면 그때부턴 개인 에이전트 시장이 열릴거 같습니다.
5090이 답이에요
지금의 오픈클로는 일반인들이 사용하기에는 프로토타잎 내지 과도기로만 보입니다.
다만, AI프로나 울트라를 쓰면, 크레딧을 줍니다.(API용 크레딧이라 flow/whisk의 AI크레딧관 달라요)
https://developers.google.com/program/my-benefits?hl=ko
https://developers.google.com/program/my-benefits?hl=en
(ko페이지는 좀 오류가 있어서, en페이지도 같이 보세요)
울트라는 100달러를 주고(토큰 사용에 쓸 수 있음), 프로는 10달러던가.. 줍니다.
혹시 사용안하셨다면, 이거 쓰시면 만원이 안나가실 것 같은데요.
음.. 그리고 제가 openclaw를 사용안해서 확실친 않은데, 이렇게 API사용하는 것보다,
구독(oAuth)을 쓰는게 훨씬 저렴하죠.
클로드랑 제미니는 안되게 막은 것 같은데, openai는 아마 되는걸로? 알아요. 확실친 않습니다.
저런 작업은 요새 gpt 5.3 codex가 정말 좋구요.
claude도 max 20x사용중인데, 여기로 태우더군요.
여러 모델 돌려보니 토큰대비 작업수행능력은 gemini pro3-preview 가성비인듯합니다. 다만 cli나 antigravity로 인증한경우 한다리 건너서 태우다보니 응답이 좀 느리고 치명적인건 컨텍스트가 커지면 중간에 사고과정이 뜨면서 waiting을 안하고 중단됩니다. 이건 gemini pro3 특징이라 개선이 안되는거 같더라구요. 그래서 /compact 스케쥴러를 1시간 단위로 돌려줘야합니다. 컨텍스트 커지는걸 방지해야되서요...
이게 외부 앱이라서 API를 태워야하는데 아마도 원천사쪽에서 항의가 들어가서 언젠가 막히지 않을까 싶기도 합니다
개인적으로 m1 16GB가 정말 최고 가성비인듯 합니다. 대기 전력이 m1이 가장 적더라구요.
오렌지파이 4 32GB모델 사용중인데, 이거 작업시키는게 너무 느립니다..오렌지파이 자체 성능이 느려서... 그나마 램이 32기가로 넉넉해서 여러 작업을 넉넉하게 시킬 수 있지만, 그래도 너무 느려요... 풀로드 15w먹으면서 처리하는거보면 신기하긴하지만 맥미니 m1이 아른거리는건 어쩔 수 없는거 같아요.
개발자입장에서는 설치가 쉬운편이라고 생각했는데 비개발자입장에서는 어렵겠구나 싶습니다.
설치하는 것도 사람이 하면 어려운데 사실 claude code cli켜서 설치해줘하면... 쉽게 가능할거 같습니다.
그래도 비개발자분인데 이정도 환경을 구축하신건 정말 실력자이십니다. 한두번 하시다보면 쉽게 하실 수 있을거 같아요.
로컬 LLM을 못돌린다고 하더라도 집에서 24시간 전원넣고 비서처럼 부려먹기엔 맥미니가 성능대비 유지비가 최고 가성비인듯 합니다.
rtx3060 mobile 에서는 로컬 LLM을 돌릴려면 qwen 2.5 7b 사용해야 하는데 성능도 영 덜 나오고 노트북이 이륙할려고 해서 그냥 외부 LLM 사용하는걸로 결정 했네요.
너무 좋습니다. 비서 하나 생긴것 같아요 ㅎㅎ
이런 것들을 어떻게 쓰는지 며칠 더 써보고 글을 쓰겠습니다.
그리고 최종적으로 로컬 LLM 모델을 포기하려고 합니다. 당장 깃허브 코파일럿으로 무제한 AI 들을 쓸 수가 있고 제미니 3 프로 프리뷰 같은 것들도 구글 AI 요금보다 더 저렴하게 쓸 수 있어서요.
(그록, GPT, 제미니 위주로 돌려 써보고 있는데 이 소감을 다음 글에..)
설명하자면 길어서 제가 블로그에 쓴 글을 공유해봅니다.
제 결론도 “로컬 LLM은 한계가 많다. 적당한 가성비의 유료 LLM 서비스를 찾아라” 입니다.
오픈클로(Openclaw) LLM 모델 선택 가이드 – 무료부터 유료까지 실제 사용 후기(https://signpen.net/2519173)
OpenRouter 모델 가성비 비교 – 오픈클로 에이전트 작업 적합 모델 찾기(https://signpen.net/2519196)