CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·아이포니앙 ·주식한당 ·MaClien ·방탄소년당 ·일본산당 ·자전거당 ·안드로메당 ·개발한당 ·이륜차당 ·소셜게임한당 ·AI당 ·나스당 ·소시당 ·디아블로당 ·골프당 ·가상화폐당 ·육아당 ·야구당 ·젬워한당 ·위스키당 ·오른당 ·노젓는당 ·걸그룹당 ·클다방 ·IoT당 ·키보드당 ·PC튜닝한당 ·달린당 ·찰칵찍당 ·맛있겠당 ·패셔니앙 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·사과시계당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·물고기당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·리눅서당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·바다건너당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

새로운소식

탈라스, 칩에다 모델 새겨 넣어 추론 속도 10배 향상한 기술 공개 34

6
2026-02-24 23:45:47 211.♡.200.4
nest

207148_209218_5138.png

'라마 3.1 8B'를 하드와이어링한 탈라스 HC1 (사진=탈라스)



AI 모델을 전용 실리콘 칩으로 구현하는 플랫폼이 등장했다. 대형언어모델(LLM)과 같은 컴퓨팅 집약적인 애플리케이션의 처리 속도를 높이기 위해 최적화한 그로크의 추론 엔진 ‘언어 처리 장치(LPU)’와 유사하다.


스타트업 탈라스는 최근 새로운 모델을 전달받으면 약 두달 만에 이를 맞춤형 반도체(ASIC)로 구현할 수 있는 플랫폼을 개발했다. 이렇게 탄생한 결과물은 ‘하드코어 모델(Hardcore Models)’로 불린다.


탈라스의 핵심 전략은 ‘완전한 특화(Total Specialization)’다. 범용 GPU 위에서 다양한 모델을 실행하는 대신, 특정 AI 모델 하나에 최적화된 전용 실리콘을 제작한다. 


이렇게 제작된 하드코어 모델은 소프트웨어 기반 구현 대비 10배 빠르고, 10배 낮은 전력 소비, 10배 낮은 비용을 달성한다는 주장이다.


.

.

.


탈라스는 첫 제품으로 메타의 오픈소스 모델을 기반으로 한 ‘하드와이어드 라마 3.1 8B’를 공개했다. 챗봇 데모와 추론 API 서비스 형태로 제공된다.


207148_209219_5255.png 하드와이어드 라마 3.1 8B 성능 비교 (사진=탈라스)



이 ‘실리콘 라마’는 사용자당 초당 1만7000토큰을 처리할 수 있어, 기존 최첨단 칩 대비 약 10배 빠르다. 구축 비용은 20분의 1, 전력 소비는 10분의 1 수준이라는 설명이다.


특히 공개된 테스트 결과에 따르면, 엔비디아 'H200'은 초당 230개의 토큰을 생성했다. 하지만 탈라스의 칩은 1만6960 토큰을 생성했다. 이는 무려 73배에 달하는 속도다.


.

.

.

출처 : https://www.aitimes.com/news/articleView.html?idxno=207148
nest 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [34]
nest
IP 211.♡.200.4
02-24 2026-02-24 23:50:15 / 수정일: 2026-02-24 23:50:35
·
미래에는 NPU에 내장 모델 하나씩 임베딩되서 출시될지도요.ㄷㄷ
memberst
IP 59.♡.182.175
02-24 2026-02-24 23:57:11
·
@Bigtory님 저도 그렇게 되리라 봅니다 몇년후면 이제 GPU 처럼 NPU가 별도로 나오겠죠
nest
IP 211.♡.200.4
02-24 2026-02-24 23:59:21
·
@memberst님 속도가 어마어마 하네요.ㄷㄷ
Juzis
IP 211.♡.74.91
02-25 2026-02-25 00:06:08
·
항상 똑같은 기어만 맞물려 굴리지 않고 기어 자체에 변형을 줘서 실행되게 해주면 거기서부터 소프트웨어 부담이 덜어지니 좋긴하죠. 하지만 하드웨어적 업데이트 비용이 만만찮을겁니다. 완벽하기 전까진요
nest
IP 119.♡.233.218
02-25 2026-02-25 00:08:32 / 수정일: 2026-02-25 10:25:01
·
@Juzis님 어떻게든 규모의 경제 달성과 중상급 티어 모델의 발전의 정체기 같은게 기폭제가 될 수 있을 것 같습니다.
없다고요우
IP 104.♡.116.104
02-25 2026-02-25 03:38:41
·
오오 사운드카드나 글픽카드처럼 ai카드가 나오겠군염. 개인이 집에서도 로컬 llm굴릴날이 머지 않았네요. 개인적으로는 2족 보행로봇에 달고 수행비서처럼 데리고 다니고 싶네욤
nest
IP 211.♡.200.4
02-25 2026-02-25 05:50:36
·
@없다고요우님 오홋, AI카드 네이밍이 좋네요.
훔훔
IP 104.♡.55.236
02-25 2026-02-25 06:17:25
·
저것도 나중에 점점 커지다가 지금 그래픽 카드처럼 카드에 메인보드 달린듯이 되려나요..
nest
IP 14.♡.194.56
02-25 2026-02-25 07:22:55
·
@훔훔님 그럴 것 같아요!
__ei
IP 101.♡.149.164
02-25 2026-02-25 08:15:29 / 수정일: 2026-02-25 08:20:32
·
Groq 은 어떻게 그렇게 빠른가 했더니 이런 방식이었군요. ㅎㅎ
자율주행이나 빠르게 뭔가를 지속적으로 인식해야 하는 시스템 (출입 통제를 위한 안면인식, 특정 문자열 인식 등)에서 효과 좋겠네요.
nest
IP 14.♡.194.56
02-25 2026-02-25 08:22:41 / 수정일: 2026-02-25 08:23:48
·
@__ei님 그록보다도 더 극단적으로 특정 모델 자체를 칩으로 구워버린 것 같네요.ㄷㄷ 업뎃불가네요ㅋㅋㅋ
더미코코
IP 223.♡.51.98
02-25 2026-02-25 09:12:08 / 수정일: 2026-02-25 09:14:40
·
그러면... 컨텍스트는 어디에 저장되죠? 계속 임베딩을 반복적으로 넣어야하는데... 컨텍스는 메인 램에 저장하나? 자체적으로 큰 램이 없다면.. 큰 의미가 적지 않을까요? 뭐 그런건 전문가분들이 잘 해결하시겠지만.. 그냥 그렇다고요
nest
IP 14.♡.194.56
02-25 2026-02-25 09:13:19
·
@더미코코님 램을 연산유닛이랑 하나로 통합했다고 나오긴 하는데, 용량은 모르겠네요.
콜라군
IP 123.♡.159.100
02-25 2026-02-25 09:25:01
·
신형 모델 출시 주기가 엄청 빠른데 하드웨어에 하드와이어되어있다면...
최신 컴퓨터가 1년만에 구형 컴퓨터가 되어버렸던 90년대 시절처럼 되겠군요.
nest
IP 14.♡.194.56
02-25 2026-02-25 09:26:43
·
@콜라군님 그렇겠네요..모델들의 발전이 너무 빠르죠.
에몽군
IP 211.♡.67.78
02-25 2026-02-25 14:58:04
·
@콜라군님 언젠가는 새로운 AI모델 발전도 한계에 다다르지 않을까요?
GTI
IP 211.♡.197.64
02-25 2026-02-25 09:49:38
·
아쉽게도 응원 중인 퓨리오사 새소식은 별로 없네요. 메타 인수 제안을 수락했어야 하는 건지...
nest
IP 119.♡.233.218
02-25 2026-02-25 10:07:29
·
@GTI님 좋은 소식 기다리고 있습니다!!!
그럴수도있구나
IP 221.♡.239.100
02-25 2026-02-25 10:35:48
·
8B면 추론모델 자체가 좀 아쉬울듯합니자
nest
IP 119.♡.233.218
02-25 2026-02-25 10:43:22
·
@그럴수도있구나님 그렇죠.
원근법
IP 211.♡.155.116
02-25 2026-02-25 10:40:43 / 수정일: 2026-02-25 10:44:33
·
GPU > TPU > NPU > LPU ...
이런빙식이면 HBM, TOPS문제가 있지만 다시 fpga가 효과적일수도 있겠군요
nest
IP 119.♡.233.218
02-25 2026-02-25 10:52:18
·
@원근법님 가격이 문제 겠네요.
OLIVER
IP 140.♡.29.3
02-25 2026-02-25 12:24:56
·
비트코인도 상용 gpu로 채굴하는줄 알고있는 사람들이 많던데, 사실 나온지 얼마 안되서 전용 asic 채굴장비로 다 바꼈었죠..
nest
IP 119.♡.233.218
02-25 2026-02-25 12:27:13
·
@OLIVER님 이정도면 1년은 쓸만한 모델이 나오면...저런 칩도 나쁘진 않겠네요.
가브리엘
IP 223.♡.94.19
02-25 2026-02-25 15:03:08
·
@OLIVER님 비트코인이 주목받은 시점부터 전용 asic을 썼죠..
비트코인이 2009년인가 10년인가 처음 공개됐고, 2018년쯤부터 주목받기 시작했고, 그즈음에 비디오카드 1차 파동이 왔잖아요..
OLIVER
IP 140.♡.29.2
02-25 2026-02-25 15:28:23
·
@가브리엘님 네, 비트코인이 처음 대중적으로 주목을 받기 시작한게 2013년쯤인데 그때 난이도가 이미 많이 올라가서 asic으로 캐기 시작했습니다.
가브리엘
IP 121.♡.61.89
02-25 2026-02-25 23:21:00
·
@OLIVER님 와우 그렇군요
덕분에 식견을 넓혔습니다
케이엠8
IP 14.♡.58.74
02-25 2026-02-25 12:44:46
·
범용화될일은 적어보이고 아주 니치한 영역에서만 사용될 것 같습니다.
nest
IP 119.♡.233.218
02-25 2026-02-25 13:38:20
·
@케이엠8님 범용화 되기에는 넘어야 하는 허들이 너무 많긴하죠.
에일리언
IP 92.♡.186.150
02-25 2026-02-25 15:40:19
·
단점... 맨날 새로운 AI가 나오는데...
장점... 근데 조금 지난게 될지언정 준수한 모델하나 굴릴 수 있고 오지게 빠름...
으음...
옛날에 회사 다닐적에... 옆팀이 네트워크 분석 프로그램을 만들어서 대박이 났는데... (3G초기) 처음엔 노트북한대랑 세트로 납품하다가 전용하드웨어 디자인해서 확장 카드화해거 서버하나에 다량탑재하게해서 왕창 통신회사에 납품하더라구요
nest
IP 119.♡.233.218
02-25 2026-02-25 16:26:23 / 수정일: 2026-02-25 16:46:30
·
@에일리언님 오...오......전용 하드웨어 제작이요. 살짝 동경하는 분야입니다.
에일리언
IP 92.♡.186.150
02-25 2026-02-25 17:12:31
·
@Bigtory님
팀장님의 원형탈모 3개가 지금도 기억납니다.
맨날 의자에서 팔짱끼고 자고 일어나서 바로코딩하고... 쓰러지니까 사장님이 문병가셔서 꽃이랑 노트북 주면서 또 일시키고...
제가 폴짝 뛰어 업혔더니 허리 나가서 또 병원가시고... 그러셨더랬죠. 정말 그 업계에서 성품 너무 좋고 머리도 좋은 분이셨어요...
닠님
IP 211.♡.29.122
02-25 2026-02-25 15:48:00
·
이건 확장성 때문에 사장되지 않을까 싶습니다. 아무리봐도 이렇게 해서는 요즘 AI발전 속도를 감안하면, 빈번하게 HW를 바꿔야 할거 같아서요;;;
nest
IP 119.♡.233.218
02-25 2026-02-25 16:26:41 / 수정일: 2026-02-25 16:36:07
·
@닠님님 그렇죠 모델들이 뭐 장난 아니게 업데이트 되니 말이죠...ㄷㄷ
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.