CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·아이포니앙 ·방탄소년당 ·주식한당 ·MaClien ·일본산당 ·자전거당 ·개발한당 ·이륜차당 ·바다건너당 ·AI당 ·노젓는당 ·안드로메당 ·클다방 ·소셜게임한당 ·소시당 ·물고기당 ·콘솔한당 ·갖고다닌당 ·찰칵찍당 ·걸그룹당 ·가상화폐당 ·여행을떠난당 ·ADHD당 ·골프당 ·나스당 ·방송한당 ·캠핑간당 ·개판이당 ·e북본당 ·전기자전거당 ·3D메이킹 ·X세대당 ·AI그림당 ·날아간당 ·사과시계당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·디아블로당 ·동숲한당 ·날아올랑 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·IoT당 ·KARA당 ·키보드당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·리눅서당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·PC튜닝한당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

AI관련, AI요약) 초소형 언어모델 직접 구현하는 튜토리얼이네영 6

2026-04-21 15:48:44 수정일 : 2026-04-21 15:50:33 1.♡.181.115
Juzis

종류별로 소규모 테스팅용도로 만들어보면서 이것저것 익히고 있어요 ㅎ


아직 개인이라 고가의 칩 구입이나 서버비 마련은 힘들어서용.





이 영상은 1350만 파라미터 규모의 작은 언어 모델(Tiny Language Model)을 특정 도메인(연구 논문 분석 및 지식 추출)에 맞춰 구축하고 최적화하는 전체 과정을 다룹니다. 주요 내용은 다음과 같습니다.


1. 합성 데이터 생성 (5:28 - 20:00)

•    Outlines 라이브러리를 활용해 로컬 LLM(Qwen 3.5 4B)으로 구조화된 JSON/Pyantic 형식의 합성 데이터를 생성합니다. 이는 모델이 복잡한 작업에서도 일관된 결과를 출력하도록 돕습니다.

•    질문-답변 쌍뿐만 아니라 지식 그래프, 요약, 비교 등 다양한 태스크를 생성하여 모델의 데이터셋을 풍부하게 만듭니다.


2. 모델 파인튜닝 (23:49 - 33:41)

•    Unsloth를 사용하여 효율적으로 모델을 파인튜닝합니다. 

•    '채팅 템플릿(Chat ML)' 형식을 적용하여 학습 데이터를 변환하고, '어시스턴트 응답'에만 가중치를 두는 학습 방식을 사용합니다.

•    하이퍼파라미터 튜닝(Rank 16 vs 32)을 통해 검증 손실(Validation loss)을 0.7 수준까지 낮추는 실험 과정을 공유합니다.


3. 평가 및 배포 (33:51 - 43:52)

•    GPT-4o-mini를 '판사(Judge)'로 활용하여 모델의 성능을 비교 평가했습니다. 직접 학습한 모델은 동급 규모 모델 대비 훨씬 뛰어난 성능을 보였으며, 대형 모델과도 경쟁력 있는 결과를 나타냈습니다.

•    마지막으로 모델을 실무에서 바로 사용할 수 있도록 SDK와 하네스(Harness)를 구축하여 로컬 기기에서 초당 수백 개의 토큰을 처리할 수 있는 고성능 파이프라인을 완성합니다.


이 과정은 적은 비용($8 내외)으로도 특정 분야에 특화된 빠르고 효율적인 언어 모델을 만드는 실무적인 지침을 제공합니다.

출처 : https://youtu.be/gvZIUEL6Ruc?si=vxccirED5iIWtfwS
Juzis 님의 게시글 댓글
SIGNATURE
이해하면 나도 할 수 있다.


결과보다 과정을 중요시하는 사람

어설픈 추측은 놉. 방구석 제갈량 그만yo

힌트 흘리고 다니는 사람이 생각보다 잘 없음.

LR네임:

모두에게 떳떳한 사람으로 남아야 한다.

나만의 후라이드:

술, 담배 안 하기
노래방 안 다님
첫 직장을 목적 없이 아무 직종이나 대충 지원하지 않기
나와 상대의 보안 철저
내가 아는 선에서 최선의 선한 길부터 생각함
남의 거 응용 최소화(얻어걸치기 싫어함)
말과 글은 같게
되는 방향부터 먼저 생각한다
없는 말, 거짓말 안 하기(매우 싫어함)
패 다 까고 시작하기
취미는 최대한 전공과 동떨어진 것으로(전공과 접목 시 폭넓게 활용하기 위함)
대출 없이 내가 벌어서 살아보기
삐치지 않기
지극히 당연한 것은 빼고 말하기/생각해보기
기존에 없던것을 생각하라
모르면 확실하게 질문하기


B형 INTP

가장 싫어하는 대답:

경우에 따라 달라요 << 이런식
질문에 되묻기
뻔한 대답 등

클리앙에서 느낀점:

댓글이 필요없을 정도면, 게시물이 이 서명 내용처럼 주절주절 너덜너덜 해져야된다
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [6]
모닝9
IP 223.♡.91.223
15:57 2026-04-21 15:57:58
·
와 대단하시네요.

이 튜토리얼을 따라해보려면 어느정도의 사양이 필요할까요?
Juzis
IP 1.♡.181.115
16:09 2026-04-21 16:09:24 / 수정일: 2026-04-21 16:09:48
·
@모닝9님 이미지가 들어가는 비전 처리만 없다면 텍스트로된것은 양자화랑 다해서 아주 기초적인것 30분 ~ 1시간 이내에 만들어집니다.. 데이터 규모가 커질수록 또는 이미지 십만장 정도를 램24기가인 일반 맥북에서 하루걸려 만들고나서 겨우 테스트해보곤 했는데, 일단은 저런 간단한 데이터들을 확보해서 판별하는 미니 LLM부터 만들고 서빙연습 해보는거 재밌습니당
Juzis
IP 1.♡.181.115
16:10 2026-04-21 16:10:45
·
@모닝9님 로컬 내부에 온디바이스형 AI를 구축해두고 있는데, 인터넷 없이도 추론하는 공식이 있는겁뉘당
모닝9
IP 223.♡.91.223
18:22 2026-04-21 18:22:33
·
@Juzis님
램24GB 맥북정도 환경이 있어야하는군요. 답변 감사합니다.
ThunderGurum
IP 211.♡.87.214
18:59 2026-04-21 18:59:41
·
제가 구상하고 있는 구조랑 비슷하네요. slm 이나 sllm 도 고려하고 있는데 tlm 도 참고해봐야겠네요.
Juzis
IP 1.♡.181.115
19:29 2026-04-21 19:29:08
·
@ThunderGurum님 스몰랭기쥐랑 타이니랭기쥐랑 용어만 다르게 쓸뿐 직은사이즈로 엘엠 만들어보는건 마찬가지일겁니당 ㅎㅎㅎ 만들고 계신분이 더 계시니 좋군요👏🏻👏🏻👏🏻
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.