CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·방탄소년당 ·일본산당 ·개발한당 ·자전거당 ·이륜차당 ·소시당 ·AI당 ·패스오브엑자일당 ·안드로메당 ·나스당 ·클다방 ·바다건너당 ·걸그룹당 ·사과시계당 ·물고기당 ·전기자전거당 ·노젓는당 ·노키앙 ·가상화폐당 ·곰돌이당 ·윈폰이당 ·축구당 ·키보드당 ·리눅서당 ·IoT당 ·창업한당 ·소셜게임한당 ·여행을떠난당 ·골프당 ·콘솔한당 ·디아블로당 ·찰칵찍당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

시장에 충격을 준 구글의 '터보퀀트'가 무엇인가에 대해 6

6
2026-03-26 19:04:57 수정일 : 2026-03-26 19:29:18 122.♡.56.205
천문공

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/


AI 기술에 대해 깊이 아는 분이 아니어도 이해하기 쉽게 설명해 보겠습니다.


로컬LLM이든 서비스 기업의 모델을 이용하든,

대화를 하다 보면 그 기억을 잃고 엉뚱한 답을 내놓던 초기를 기억하실 것입니다.

이 때문에 대화 내용을 잃어 버리지 않게 하기 위한 그간의 노력이 있어 왔습니다.


대화 내용이 얼마 안되면 그리 부담을 느끼지 않겠지만,

전문가용 딥리서치 및 에이전트 기능을 이용하다 보면...

기하급수적으로 늘어나게 됩니다.


그런데 AI서비스 기업 입장에서는 각 사용자에게 이 대화 기억을 무한정 제공하다 보면,

서비스에 무리가 발생하게 됩니다.


여기서 등장하는 개념이 KV캐시라는 것이 있습니다.

몰라도 되니 그러려니 하시고요. (저도 자세히는 모릅니다. ^^)


구글의 터보퀀트는 그러니까 이 기억의 부피를 줄여 주는 역할을 하는 알고리즘입니다.

그럼 새로운 개념이냐고 하면.. 그렇지는 않습니다.

이런 정도의 사고는 이미 일찌감치 등장했었습니다.


그걸 구글이 기억을 압축하면서도 손실이 없게 하는 방식을 만들어 냈다는 것입니다.


이걸 시장에서는 메모리가 덜 필요할 것으로 해석하면서 충격이 온 것인데요.

물론 그럴 가능성이 없지는 않지만... 지금까지의 AI의 발전 과정을 돌이켜 보면...


오히려 더 대중화를 이끌어 내며 더 많은 메모리가 필요할 가능성이 더 높습니다.

지금의 장기 기억의 문제는 이미 여러 관련 기술로 어느 정도 극복해내는 지점에 와 있습니다.

그러나 원천적인 해결은 아니었기 때문에 KV캐시를 압축 하는 것은 

오히려 그간 활용하지 못했던 분야까지 시장을 확장 시키는 역할을 할 수 있습니다.


예를 들어 보겠습니다.

아무 기억이나 압축한다고 다 효율이 높지는 않겠죠.

짧게 주고 받는 대화 정도는 안 하는 것 보다 별반 나을 것도 없습니다.


개발자가 몇 시간 작업해야 하는 아주 긴 작업을 할 때...

이럴 대 효과가 극대화 됩니다.


그럼 AI서비스 기업들은 이런 롱 컨텍스트 관련 에이전트 서비스를 더 늘림과 동시에

울트라가 아닌 프로 구독자에게도 풀어 줄 수 있겠죠.


이런 식으로 서비스 확대 및 시장 확대의 길목에서

한 단계 점프하는 역할을 하는 것으로,

기억 하는 메모리 절약 때문에 삼성전자와 하이닉스의 메모리가 덜 필요로 할 것이라는,

해석은....과거 온디바이스, ASIC 때문에 엔비디아 제품이 덜 팔릴 것이라고 했던 주장과

흡사해 보입니다.


덧) 예를 하나 들어 보면 이렇습니다.

서비스가 아니라 로컬LLM을 집에서 돌린다고 가정해 보겠습니다.

16GB의 GPU로 12GB 모델을 올려서 사용하게 되면,

이제 대화 내용을 기억해야 하는 KV캐시 용량이 약 3GB가 남습니다.(시스템 안정성을 위해 약간의 마진으로 1GB정도 남겨 둡니다. 오프로딩을 하게 되면 시스템메모리로도 되지만 좀 느려집니다.)

이것으로 대화를 열 번 정도 했다고 칩니다.

이 3GB가 기억하던 대화 내용을 몇 배 압축을 합니다.

그럼 16GB 사용하던 사람이 몇 배 압축이 된다고 해서 1GB 이하로 할당하면서,

15GB 를 쓰다가 13GB 이하로 쓰게 될 것이라는 말과 비슷한 것으로,

오히려1 15GB로 더 많은 컨텍스트 용량을 선택하여 활용할 것입니다.


서비스 기업 역시 더 많은 기능을 프로 구독자에게 뿌리고,

또 그 위의 천만 컨텍스트를 울트라로 서비스 하는 방식을 취하게 될 것으로 보는 것입니다.



천문공 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [6]
love114
IP 140.♡.29.2
03-26 2026-03-26 19:06:52
·
한줄요약 : 메모리가 더 다양한곳에 필요해지는건데 단단히 사람들이 오해함
Millicent
IP 112.♡.97.184
03-26 2026-03-26 19:10:51 / 수정일: 2026-03-26 19:11:15
·
본질은 중요하지 않죠 가격을 후려칠 구실이 필요했을뿐... 그러고 보니 정치판이랑 비슷하네요
게지히트
IP 125.♡.92.209
03-26 2026-03-26 19:22:56
·
kv cache 에 대해서 간단히 설명해보겠습니다. llm 은 self attention 이라는 기술을 씁니다. 입력된 문장의 모든 단어들간 상관관계를 계산하는거죠. 5단어짜리 문장으로 보면 4+3+2 개의 단어간 상관관계가 발생합니다. 그런데 여기에 새로운 단어가 추가되면 6단어간 상관관계를 다시 처음부터 계산해야 할까요? 아니죠. 기존 단어들간 관계는 그대로 두고 새로 추가된 단어만 기존 단어들과 관계 즉 5개의 새로운 관계만 계산하면 되겠죠. kv cache 는 이 기존 단어들간 관계 계산해둔 값을 저장한거라고 보면 됩니다. 대화가 길어지면 단어간 상관관계가 계속 늘어나는데. 결국 이게 메모리에 상주해야 하고 이걸 줄이기 위한 연구는 꾸준히 되고 있습니다.
cleritie
IP 118.♡.11.27
03-26 2026-03-26 19:24:32
·
설사 이걸로 기억 효율이 좋아진다 하더라도 지금 이런 성능에서 발전이 멈출 수도 없고, 더 길고 많은 작업이 이어질텐데 그냥 설레발이죠. 매수 찬스입니다. 궁극적으론 핸드폰에서 로컬로 gpt 7쯤이 무난히 돌아갈 즈음은 되지 않아야 할까 생각 중입니다.
jidi0109
IP 112.♡.214.71
03-26 2026-03-26 20:14:40
·
예고된 발전이죠.
식염수
IP 125.♡.98.43
03-26 2026-03-26 22:25:42
·
압축프로그램 발전한다고 하드디스크 필요없는건 아니지 않나요 ?? 메모리는 흠 늘 언제나 근 몇년간을 제외하고 목말랐습니다…
게임피씨에 몇년전 풀뱅으로 메모리 채워놓고 (그래봤자 64기가였지만 ) 조아졌다~ 저렴해지는것도 있고 그랬는데, 짠돌이 맥이 램 혜자라는 이야기를 듣는지경이 ;;
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.