https://github.com/cookyman74/my_harness
AI로 작업하다 보면 "혼자 다 하는 AI"보다 "역할 나눠서 협업하는 AI 팀"이 결과가 훨씬 좋다는 걸 느끼게 되는데요. 그걸 자동으로 만들어주는 오픈소스를 만들어 봤습니다.
한 줄로 요약하면, Claude Code에서 "XXX 하네스 구성해줘"라고 말하면, 내 프로젝트에 맞는 AI 에이전트 팀을 알아서 짜주는 도구예요. (영어로는 "build a harness for this project")
예시 프롬프트
-
/my-harness 카드 게임을 만들고 싶어
-
/my-harness 주식투자 프로그램을 만들고 싶어.
-
/my-harness XXX라는 주제의 유튭 컨텐츠를 기획하고 싶어.
- /my-harness @{기획서} 상기 기획서의 문서를 기반으로 react 기반의 앱을 만들고 싶어.
뭐가 좋냐면
보통 AI한테 복잡한 일을 시키면 하나가 처음부터 끝까지 다 하려다 품질이 떨어지잖아요. Harness는 그 일을 쪼개서
-
누가(분석가·작성자·검수자 같은 역할) 맡을지
-
어떻게(작업 절차와 도구) 할지
를 자동으로 설계해줍니다. 일종의 "AI 팀을 만들어주는 공장" 이라고 생각하면 편해요.
게다가 작업물을 자기들끼리 한 번 검수하고, 외부 AI(Codex/Gemini)로 한 번 더 교차 검증하는 이중 품질 체크까지 들어가 있어서 결과물 신뢰도가 높습니다.
제가 만들어 써보고 있지만,, 꽤 괜찮습니다.
이런 데 써볼 수 있어요 (README에 바로 복붙할 수 있는 예시 프롬프트가 많습니다)
-
딥 리서치 (여러 각도에서 조사 → 교차검증 → 리포트)
-
웹사이트 풀스택 개발 (디자인→프론트→백엔드→QA)
-
웹툰/유튜브 콘텐츠 기획
-
코드 리뷰 & 리팩토링
-
기술 문서 자동 생성 등
같이 쓰면 좋은 플러그인 들
-
context-mode
-
caveman
-
graphify
참고
-
라이선스는 Apache 2.0 (자유롭게 사용 가능)
-
Claude Code가 메인이고, Codex 런타임도 함께 지원해요
ps:
관종이라 별좀 눌러주세요 ㅋ
webcopilot 이라는 크롬 확장앱도 만들어서 배포하고 있습니다.
저는 그냥 바이브 코딩할때 검증 에이전트, 개발 담당 에이전트, UX 담당 에이전트를 그냥 말로 요청해서 작업해달라고 하는데 막상 이게 정말 효과적으로 작동 되는지는 알길이 없어서요.
이런 오픈 소스를 사용하면 확실히 차이가 있을까요?
초보적인 질문은 아니고 핵심적인 질문이네요 ㅎㅎ
일단 보통 님이 하시는 방식처럼 단순히 클로드에게 말로 "검증/개발/UX 에이전트"라고 요청해도 작동은 합니다. 다만 한 AI가 1인 다역을 하는 거라 자기가 쓴 걸 자기가 검증하게 되고(같은 맹점), 세션이 끝나면 그 역할 정의도 휘발돼요.
하지만 이런 하네스 오픈소스는 그 부분들에 대해 개발자들이 쌓아온 노하우 — 역할을 파일로 고정해 일관되게 재사용하고, 검증은 독립된 다른 엔진에 맡기는 식 — 으로 미리 짜놓은 겁니다. 그래서 매번 직접 설계 안 해도 믿고 써볼 만하실 껍니다.
물론 짧고 단발성 작업이면 지금처럼 말로 하셔도 충분하고요. 반복·품질·검증이 중요해질수록 차이가 커집니다.
깃허브 주소주시면 그다음 액션은 뭔가요 ㅎㅎㅎ
일단 리눅스 환경에서만 가동되기 때문에
윈도우의 경우 WSL이 필수 입니다.
만약 설치환경이 준비되셨다면
git clone https://github.com/cookyman74/my_harness.git
클론 받으시고
클로드코드 사용하시면..
1. 마켓설치
/plugin marketplace add cookyman74/my_harness
2. 플러그인 설치
/plugin install myharness@myharness-marketplace
3. 리로드 하시거나 클로드를 재실행해주세요.
/reload-plugins
이렇게 하면 플러그인이 설치하신후 /myharness 명령어로 사용하시면 됩니다.
만약 클로드코드가 아니라 코덱스 사용하시면
해당 디렉토리에 install.sh를 실행시켜 주신후 다시 코덱스를 재실행한 후에
$myharness 명령어로 사용하시면 됩니다.