CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·방탄소년당 ·일본산당 ·MaClien ·자전거당 ·안드로메당 ·개발한당 ·이륜차당 ·소셜게임한당 ·AI당 ·소시당 ·나스당 ·가상화폐당 ·육아당 ·젬워한당 ·위스키당 ·오른당 ·노젓는당 ·골프당 ·디아블로당 ·PC튜닝한당 ·스팀한당 ·패스오브엑자일당 ·야구당 ·클다방 ·걸그룹당 ·IoT당 ·키보드당 ·달린당 ·찰칵찍당 ·리눅서당 ·바다건너당 ·맛있겠당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·사과시계당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·물고기당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

새로운소식

파이썬 200줄로 GPT 핵심 구현한 ‘마이크로GPT’ 공개 17

17
2026-02-18 15:21:09 211.♡.200.4
nest


대형언어모델(LLM)의 복잡한 구조를 요약, 단 200줄의 순수 파이썬 코드로 GPT의 핵심 원리를 구현한 프로젝트가 공개됐다. 안드레이 카르파시가 선보인 ‘마이크로GPT(MicroGPT)’는 외부 라이브러리 없이도 GPT의 학습과 추론 과정을 모두 수행하는 단일 파일 프로그램이다. 거대한 인프라나 복잡한 프레임워크 없이, LLM이 작동하는 알고리즘의 본질만을 가장 단순한 형태로 담아냈다는 평가를 받고 있다.

.

.

마이크로GPT는 단 하나의 파이썬 파일로 구성된다. 이 파일 안에는 ▲데이터셋 처리 ▲토크나이저 ▲자동 미분(autograd) 엔진 ▲GPT-2와 유사한 신경망 구조 ▲아담(Adam) 옵티마이저 ▲학습 루프 ▲추론 루프까지, GPT가 작동하는 전 과정이 모두 담겨 있다.


마이크로GPT는 거대한 웹 데이터 대신 약 3만2000개의 영어 이름을 학습 데이터로 사용한다. 각 이름을 하나의 ‘문서(document)’로 간주하고, 이 이름들에 담긴 글자 배열의 통계적 패턴을 학습해 새로운 이름을 만들어낸다.

.

.

.

실제 상용 모델들이 BPE(Byte Pair Encoding)와 같은 서브워드 기반 토크나이저를 사용하는 것과 달리, 마이크로GPT는 훨씬 단순한 방식을 택했다. 데이터에 등장하는 알파벳 문자(a~z) 각각에 정수 ID를 부여하고, 여기에 문서의 시작을 나타내는 BOS(Beginning of Sequence) 토큰을 더해 총 27개의 어휘만 사용한다.


이렇게 변환된 텍스트는 숫자의 나열(정수 시퀀스)이 되고, 신경망은 이 숫자들을 입력으로 받아 다음에 올 문자의 확률을 예측하는 방식으로 학습을 진행한다.


마이크로GPT의 가장 인상적인 부분은 자동 미분(autograd)을 직접 구현했다는 점이다. 카르파시는 과거 공개했던 마이크로그래드(micrograd) 프로젝트를 발전시켜, 단 하나의 스칼라 기반 Value 클래스만으로 역전파(backpropagation)를 구현했다.


이 클래스는 덧셈, 곱셈, 로그, 지수 같은 각 연산에서의 미분값을 저장해 두고, 최종 손실(loss) 값에서부터 계산 그래프를 거꾸로 따라가며 체인룰(연쇄법칙)을 적용한다. 원리는 파이토치(PyTorch)의 loss.backward()와 동일하지만, 텐서가 아닌 스칼라 단위로 동작해 구조가 훨씬 단순하고 이해하기 쉽다.


이 모델은 비교적 작은 트랜스포머 구조로 만들어졌다. 임베딩 차원은 16이고, 어텐션 헤드는 4개, 레이어는 1개뿐이다. 전체 매개변수 수도 4192개에 불과하다. 이는 15억개 이상의 매개변수를 가진 'GPT-2'나, 수천억개 규모에 이르는 최신 LLM과 비교하면 매우 작은 수준이다.


구조는 GPT-2와 비슷하지만, 훨씬 단순하게 구성됐다. 예를 들어 LayerNorm 대신 RMSNorm을 사용했고, GeLU 대신 ReLU 활성화 함수를 적용했다. 기본 블록은 멀티헤드 어텐션과 MLP(다층 퍼셉트론)로 이루어져 있으며, 각 블록 사이에는 잔차 연결(residual connection)도 유지했다.


즉, 규모는 작지만 '토큰끼리 서로 정보를 주고받는 어텐션 구조'와 '각 위치에서 계산을 수행하는 MLP'가 번갈아 쌓이는 트랜스포머의 핵심 뼈대는 그대로 유지하고 있다.

.

.

.


마이크로GPT는 거대한 모델 규모나 최고 성능을 목표로 한 프로젝트가 아니다. 대신 GPT 구조의 ‘기술적 실체’를 최대한 투명하게 보여주는 데 초점을 맞췄다.


불필요하게 복잡한 추상화 계층을 걷어내고, 기초적인 수학 연산과 신경망 계산을 직접 구현함으로써 모델이 어떻게 학습하고 예측하는지 과정을 그대로 드러낸다. 그 덕분에 학습자나 개발자는 내부 작동 원리를 블랙박스가 아닌, 이해 가능한 구조로 한눈에 살펴볼 수 있다.


마이크로GPT의 전체 소스코드는 깃허브 지스트(GitHub Gist) 형태의 microgpt.py 파일로 공개됐다. 또 전용 웹페이지와 구글 코랩(Colab) 노트북 형태로도 제공돼, 누구나 직접 실행해 보고 구조를 살펴볼 수 있다.


- https://gist.github.com/karpathy/8627fe009c40f57531cb18360106ce95

출처 : https://www.aitimes.com/news/articleView.html?idxno=206917
nest 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [17]
juxtizm
IP 14.♡.242.116
02-18 2026-02-18 16:21:24
·
코드를 노트북lm에 넣으니 아주 재미있네요 ㅎㅎ
nest
IP 211.♡.200.4
02-18 2026-02-18 17:26:35
·
@juxtizm님 분량도 적당하고 좋네요.ㅎ
카우보이태봉
IP 218.♡.226.30
02-20 2026-02-20 14:51:52
·
@juxtizm님 넣어서 어떻게 하셨나요???
juxtizm
IP 14.♡.242.116
02-21 2026-02-21 16:52:39
·
@카우보이태봉님 이해시켜달라고 박박 졸랐습니다 ㅎㅎㅎ
전 보통 잘 모르는 내용이 있으면
유치원생이 이해할 수 있게 설명해줘
초등학생이 ... 고등학생이... ~ 20대가 ~ 30대가 ~
이런식으로 청자의 연령을 올려가며 설명해달라 합니다.
쭉 듣다 보면 어느순간 이해되는 지점이 찾아옵니다 ㅎㅎ
juxtizm
IP 14.♡.242.116
02-21 2026-02-21 16:54:54
·
@카우보이태봉님 초등학생 친구가 이해하기 쉽게 '장난감 로봇'에 비유해서 설명해 줄게요!
1. 딱 200개의 블록으로 만든 '초미니 로봇'이에요 우리가 아는 '챗GPT'가 수천억 개의 부품으로 만든 거대한 변신 로봇이라면, 이 '마이크로GPT'라는 로봇은 코드가 딱 200줄밖에 안 되는 아주 작고 단순한 장난감 로봇이에요. 부품(파라미터)도 고작 4,192개밖에 없답니다.
2. 대화는 못 하지만 '영어 이름 짓기' 달인이에요 부품이 적어서 챗GPT처럼 모든 질문에 대답하거나 긴 대화를 나눌 수는 없어요. 이 로봇이 아는 글자는 알파벳(a~z)과 특수 기호 딱 1개를 합쳐서 27개뿐이거든요. 하지만 영어 이름 3만 개를 열심히 읽고 공부해서, '카몬(kamon)', '안톤(anton)'처럼 진짜 사람 이름 같은 새로운 이름을 지어내는 데에는 아주 훌륭한 성능을 보여줘요.
3. "다음 알파벳 맞히기" 게임으로 똑똑해져요 처음에는 규칙을 몰라서 아무 알파벳이나 막 뱉어내요(초기 손실값 3.3). 하지만 스스로 "아, 'a' 다음에는 'n'이 많이 오네!" 하고 1,000번 정도 틀린 문제를 고치며 연습하다 보면, 점점 규칙을 깨닫고 그럴듯한 이름을 만들어내게 돼요(손실값 2.37).
4. 안 똑똑한데 왜 만들었을까요? (투명한 유리 뇌) 진짜 챗GPT의 뇌는 너무 복잡하고 꽁꽁 싸매져 있어서 어떻게 생각하는지 속을 알 수가 없어요. 하지만 이 미니 로봇은 뇌가 투명한 유리로 되어 있어서, 인공지능이 어떻게 공부하고 상상력을 발휘하는지 누구나 훤히 들여다볼 수 있답니다.
그래서 만든 사람도 이 로봇을 엄청나게 똑똑한 비서가 아니라, 인공지능의 원리를 쉽게 알려주기 위한 **"예술 작품"**이라고 불렀어요.
독고구패
IP 221.♡.148.136
02-18 2026-02-18 17:33:36
·
LLM으로써 기능은 못하겠지만, 트랜스포머와 어텐션 매커니즘을 이해하기 위한 일종의 교육용으로서의 의의가 크겠군요?
nest
IP 211.♡.200.4
02-18 2026-02-18 17:34:21
·
@독고구패님 옙!!
보고또또보고
IP 125.♡.41.31
02-18 2026-02-18 19:24:06
·
karpathy 라면 vscode 의 확장으로 ai rule을 공개한 맨처음 알게된 분이군요~
아제로써
IP 175.♡.214.63
02-18 2026-02-18 20:44:29 / 수정일: 2026-02-18 20:45:06
·
제가 뭐 제대로 된 LLM 코드를 구현한 적도 없고 실제 내부를 들여다 볼 기회도 없습니다만...(냄새도 못 맡;;;)
어디가서 아는척이라도 할까 싶어 관심이 갔습니다. 수학모델과 개념적으로만 늘 들여다 보던 것이라...
아무리 파이썬이라고 하지만 200줄로 구현을 했다라...관심이 가더군요. ㅎ
nest
IP 211.♡.200.4
02-18 2026-02-18 21:06:59
·
@ 아제로써님 살짝 난해한 부분은 LLM으로 해설 받아 보면서 보니 볼만하네요!
컴구조
IP 58.♡.189.231
02-18 2026-02-18 20:51:54
·
교육용으로는 정말 좋네요. 이 코드 관련 책들도 나올 듯..
nest
IP 211.♡.200.4
02-18 2026-02-18 21:07:45
·
@컴구조님 책이요...와, 그럴것 같아요.
에스퀘어
IP 211.♡.78.50
02-18 2026-02-18 21:53:41
·
좋은 내용 공유 감사합니다.
nest
IP 211.♡.200.4
02-18 2026-02-18 21:54:18
·
@에스퀘어님 감사합니다!
OLIVER
IP 39.♡.212.216
02-19 2026-02-19 01:06:48
·
'바이브 코딩'이란 용어를 처음 만드신 분이죠?
nest
IP 211.♡.200.4
02-19 2026-02-19 05:58:56
·
@OLIVER님 오 그런가요
OLIVER
IP 104.♡.84.19
02-19 2026-02-19 11:36:23
·
@Bigtory님 체감상 엄청 오래전부터 써온 용어 같은데 이제 1년 됐네요ㄷㄷ
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.