오픈클로(OpenClaw) 외부 AI와 로컬 LLM은 얼마나 차이가 날까? : 클리앙

※ 개인적인 견해이고 비전문가이므로 당연히 내용이 틀릴 수 있습니다.

며칠동안 오픈클로를 써보고 낸 결론은 일단 이 한 줄입니다.

- 내 문맥대로 스크립트를 AI한테 시켜서 짜주는 기능

흐름으로 좀 표현해보자면

사용자가 지시 → 오픈클로가 AI한테 전달 → AI가 해석 후 오픈클로한테 다시 전달 → AI한테 전달 받은 내용을 바탕으로 오픈클로는 이러이러한 식으로 스크립트를 짜야할거같아 라고 AI한테 지시 → AI가 스크립트 작성 후 사용자 지시 내용을 수행 → 결과값을 AI가 오픈클로한테 보냄 → 오픈클로가 사용자한테 보고

즉, AI는 크게 두 가지 목적으로 쓰인다는 느낌입니다.

1. 사용자의 지시를 오픈클로가 이해하는데 도와줌

2. 사용자의 지시를 이해한 오픈클로가 다시 AI한테 지시한 내용을 AI가 스크립트로 짜줌

다시 말하자면 AI는 말을 잘해야하고 스크립트를 잘 짜야 한다.. 정도로 저는 느끼고 있습니다.

그런데 사람이라도 말빨이 천차만별이고 개발자라도 코딩 능력이 천차만별이잖아요. AI도 동일하게 적용되는 느낌입니다.

1. 사용하는 외부 AI 모델들

우선 저는 깃허브 코파일럿으로 $10짜리를 결제했고 이중에서 그록, GPT 4.1, GPT 4o. GPT 5 미니 등은 무제한으로 사용, 제미나이 3 프로 프리뷰는 사용량 차감이 되는 요금제도 위 모델들을 돌려봤고요

일단 제가 쓰는 용도에서 가장 말 잘 듣는 건 제미나이 3 프로 프리뷰입니다.

내일 오전 11시 30분에 점심약속을 맥 캘린더에 넣어줘. 캘린더는 개인 캘린더로 넣어주면 되.

라고 텔레로 일 하나 던져주면,

- 제미나이 3 프로 프리뷰: 개인 캘린더로 내일 오전 11시 30분 점심약속 이라고 반영

- GPT-4o / GPT 4.1 / 그록: 내일 00:00에 점심약속 이라고 반영

의 차이점이 있더군요.

시간이 잘못되서 자꾸 시간 수정 요청을 해도 세개는 못 알아먹던데 그나마 그록은 전체 일정 보여달라니 자기가 시간을 잘못 넣었음을 인지하고 뒤늦게 수정하긴 했지만 어쨌든…

그리고 GPT-5-미니는 접근권한이 없다면서 배쨌던걸로 기억합니다.

아무튼, 제가 일정 넣으라고 말하면 맥 캘린더 실행시키고 일정 넣는 걸 스크립트 짜준다고 생각하면 되고 AI 모델들마다 스크립트 짜는 방식도, 내부 최적화 같은 것들도 각기 제각각인것 같습니다. 즉, GPT-5-미니는 스크립트 짜는 방법을 거의 모르는 느낌입니다.

2. 그런데 좀 재미있는 부분

제미나이가 여기서 또 강점이 있는데 뭔가 스크립트가 잘 안짜지면 제가 수동으로 작업하라거나 내 생각은 이럴 거 같아서 이렇게 해봤는데 잘 안 되네. 더 좋은 방법 알고 있어? 혹은 다른 방법으로 시도해볼게 등. 지 나름대로 최적화를 시도하려고 할 때가 있더군요.

3. 로컬 LLM은 외부 AI 대비 어느 수준일까?

그렇다면 로컬 LLM들은 어떤 수준일까요? 일단 LLM을 돌리는 최소사양도 못 미치지만 취미로 돌려보기엔 최대치에 가까운 맥미니 M4 기본형에 램만 32GB로 올려서 샀습니다.

언어 모델은 GPT-OSS:20b, qwen3 계열의 30b 들을 돌려봤는데요..

안녕? 이란 말에 대답을 듣기까지 빠르면 1분, 느리면 몇 분의 시간이 소요됩니다…..

그리고 파일작업 할 수 있어? 라고 물어보면 이유는 모르겠는데 몇 분 있다가 커넥션 타임 아웃이 뜨던가 짜다만 스크립트 던져주고 끝나기도 합니다.

그 밖에 안녕?은 한글로 답했다가 너는 무슨 모델이야? 라고 물어보면 영어로 답하기도 하고 (이건 grok도 그런 경향이..) 휴지통 비워달라고 하면 메시지를 성공적으로 보냈다는 등(…) 온라인 AI가 성인 수준이라면 로컬 LLM은 유치원 수준도 안 되는 저지능이어서 로컬 LLM으로 오픈클로를 돌려보겠다 뭐 이런 생각은 포기하시는 게 좋을듯 합니다.

즉, 32GB 맥미니 M4에서 로컬 LLM을 통해 오픈클로를 돌릴려면 문맥 다듬기 같은 것들만 가능하다… 근데 이런거 할려면 그냥 챗GPT나 구글 제미나이같은데서 하는 게 훨씬 더 빠르다 가 되겠고요,

스크립트를 통해 맥 내부에서 작업하기엔 로컬 LLM들이 스크립트도 모르고, 스크립트를 어떻게 짜야할지도 몰라서 그냥 바보라 생각하면 됩니다. (온라인 AI 중에선 GPT-5-미니가 좀 유사합니다. 4o나 4.1에선 무리없이 하는 걸 5-미니는 권한 없다고 배째는 경우가 많음)

번외 1: 맥 기준에서 점프데스크탑은 필수

외부 AI용 오픈클로는 집에 M1 맥미니에 돌리고 있는데 특히 첫 실행 동안은 오픈클로가 작업할려면 맥OS에서 사용자한테 권한 사용 여부를 물어볼 때가 많아서 한동안은 점프데스크탑 열고 권한 물어볼 때마다 일일이 사용자가 허가를 해줘야 합니다.)

번외 2: 그록은 가급적 지양

갑자기 폭주하면서 에러메시리를 수백개 이상 보낼 때가 있습니다. 해결방법은 터미널에서 게이트웨이 리스타트.. 위에도 잠깐 언급했는데 일정 넣으라고 했지만 제가 말한 시간으로 일정을 넣지 않은건 그록이나 gpt나 마찬가진데 그 날 일정 전체 보여달라고 할 때 그록은 지가 넣은 일정의 시간이 잘못됨을 깨닫고 그록은 일정 시간을 수정한 후 그 날의 전체 일정을 보여주더군요.

근데 하루에 3~4번씩 폭주하며 텔레로 메시지 수백개를 십수초만에 쏟아내는 경험을 하고 나면 일단 그록은 좀…

번외 3: 텔레그램 상에서 언어 모델 변경도 가능

잘 안 될 때도 있는데 제미나이 3 프로 프리뷰 <-> gpt 4.1을 텔레그램 상에서 바꿔달라고 하면서 왔다갔다 하며 씁니다.

번외 4: 제미나이를 기준으로 했을 때, 제미나이는 사람으로 치면?

개인적인 느낌으론 일반 성인하고 대화하는 느낌입니다. 아래는 (아마도) 제미나이의 답변입니다.

——————

정리하면, 새벽 4시 30분에 반복할 작업은 아래와 같아:

1. /Volumes/1TB SSD Y/DS120j Recording/R/ 폴더 내 전날짜 폴더(YYYY-MM-DD 형식) 진입

2. sm 확장자(*.sm) 파일 모두 삭제

3. ts 확장자(*.ts) 파일 중

→ 이름이 유사한(중복) 파일이 있으면 가장 큰 용량의 파일만 남기고 나머지는 삭제

4. 남은 ts 파일 전부 /Volumes/1TB SSD Y/SynologyDrive/ 폴더로 이동

5. (필요시 완료 알림)

이렇게 맞지?

작업 예약 걸기 전에 아래 사항만 짧게 확인해줘:

• "유사한 이름(중복)"의 기준: 예시 파일명 2~3개만 알려주면 더 정확하게 필터 가능!

• 완료 알림(텔레그램 등)도 받을지?

바로 예약 적용할 준비 되어 있어!

확인 후 진행할게!

—————————

제가 자동화 조건을 좀 추상적으로 말하니 예를 들어 구체적으로 알려주면 좋겠다라는 내용은 감탄이 나오더군요.

그리고 아마도 텔레그램 창이 하나의 세션으로 활성화되어 있고 이 세션이 종료되지 않는 한 내가 어떤 작업을 하는지 기억을 하는데 이것도 단기 기억이 있고 장기 기억이 있고 제가 뭐 기억하라고 시키진 않았지만 주인놈이 나한테 이런 작업 같은거 많이 시킨다 이런 것들은 지 나름대로 캐치해서 알더군요.

번외 5: 제가 오픈클로를 쓰는 용도

일단 텔레로 주고받는다는 게 편하고.. 제일 많이 쓰는 작업은 파일작업인데, 맥북, 맥미니, 윈도우 PC 등등 장소마다 다른 컴터들을 쓰고 있고 NAS로 시놀로지 드라이브 동기화 걸어놓고 모두 동기화 시키는데 며칠 지나면 자동으로 비동기화 NAS 폴더로 보내는 식의 자동화를 일단 제일 많이 쓰고,

조금씩 조금씩 일을 더 시켜가며, 오픈클로를 학습시키고 저도 이놈이 어떻게 돌아가는지를 이해할수록 이 녀석을 더 잘 쓸 것 같습니다 ㄷㄷㄷ 테스트삼아 헤 본 건 일정 추가, 미리알림 추가, 메모 추가 등등입니다. 웹의 경우 크롬 익스텐션 쓰면 간단한 접근은 가능한데 이것도 언어 모델마다 크롬 접근 방법이 제각각이더군요.

사용기

전자기기 오픈클로(OpenClaw) 외부 AI와 로컬 LLM은 얼마나 차이가 날까? 29