CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·일본산당 ·방탄소년당 ·자전거당 ·개발한당 ·소시당 ·이륜차당 ·안드로메당 ·나스당 ·걸그룹당 ·영화본당 ·골프당 ·가상화폐당 ·클다방 ·AI당 ·육아당 ·사과시계당 ·디아블로당 ·패스오브엑자일당 ·리눅서당 ·IoT당 ·젬워한당 ·노젓는당 ·창업한당 ·소셜게임한당 ·노키앙 ·축구당 ·윈폰이당 ·여행을떠난당 ·바다건너당 ·물고기당 ·라즈베리파이당 ·캠핑간당 ·패셔니앙 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·키보드당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

모델 파라미터도 공개하는 xAI 그록과 잡담 4

2025-11-16 01:21:14 수정일 : 2025-11-16 08:43:18 122.♡.56.205
천문공

그록3와 4의 파라미터는 3T였다고 합니다.


최근에 가장 큰 주목을 받은 오픈소스 K2 씽킹이 1T라는 점을 감안하면,

상당히 크다고 할 수 있습니다.

애초에 프런티어 모델의 크기는 거의 공개하지 않으려 하는 판이라,

추정만 하다 이번에 그록5가 6T라는 말이 나오면서 같이 묻어 나온 정보입니다.


여기서 유추해 볼 수 있는 것은...

오픈AI와 구글의 파운데이션 모델의 크기가... 생각 보다 더 클 것 같다는 것입니다.

아무래도 제 개인적 느낌은...이들 역시 3T전후가 아닐까 싶습니다.


제가 xAI를 무시하려는 것은 아니고 그록을 사용하면서 느낀 ...

아주 근거 없는...그저 주관에 의거한 생각을 한 번 풀어보겠습니다.


구글의 경우 타이탄즈에 이어 호프까지...기억 문제 및 종합적인 지능 및 활용성 극대화를 위한

.. 즉 트랜스포머를 갈아 엎는 수준으로 다른 생명을 갖게 하기 위한 투자를 계속해왔습니다.


나노바나나가 일관성을 해결하며 주목 받았던 것도 그렇고,

그 이전에 백만 컨텍스트 제공의 포문을 연 것도 그렇고,

모두 타사 대비 한 발 앞서서 중요한 길목에 도달했습니다.


즉, 모델의 최대 극복 난관...뚫어야 할 절대관문 같은...

그것을 벗어날 방법이 없고, 오로지 정면으로 뚫어야 다음이 가능한 난관을

선제적으로 풀어냈습니다.


일관성 없이 이미자와 영상의 상업성은....현저히 떨어질 것이고,

컨텍스트 길이 확장은 보다 심도 깊은 세부 분야의 진출의 바틀넥 부수기가 됩니다.  


제미나이 2.5프로가 종합 점수 면에서는 지피티5에...밀렸고, 지피티5.1에는 더 크게 밀리지만,

언어 작문 같은 것과 지식이 필요한 것에 대한 질문에 가장 두루 무난하고,

나아가 종합점수에서는 제법 큰 차이가 나는 지금 시점에도 여전히 일부에선 뒤지지 않거나

저마다 다르며 일부는 아직도 더 좋습니다.


그래서 추정해 보는 것이 이런 능력치는 주로 크기에서 비롯 되는 경우가 많습니다.

구글의 파운데이션 모델이 적어도 3T이상일 것임을 짐작해 보게 되는 이유입니다.


그런데 xAI와 구글, 오픈AI가 다르게 느껴지는 점은...

스케일을 키우는 것 자체가 큰 난관이자 어려움인데,

xAI는 이 부분을 막대한 투자로 그 겉모습은 따라 하는데 이미 성공했고,

앞으로도 성공할 것 같은데, 내실은.... 에서... 질문을 갖게 합니다.


구글과 오픈AI는 이 내실 다지기를 다지면서 동시에 활용성 ,수익성을 위한 여러 사업도 병행하고 있습니다.

이 두 곳 외에는... 비슷한 시도는 있지만... 미미 합니다.


제조업으로 비유하자면, 상품을 찍어 파는 것에 급급한 것이 아니라

신상품 및 시장 확대를 동시에 연구하고 투자하는 것과 비슷합니다.


지피티5.1은 이제 화제도 잘 안 되지만,

단순 벤치마크를 위한 점수가 아니라 실제 5에 이어 연속 SOTA를 찍습니다.

스케일을 키우는 것 외에 뭔가 인텔리젼스를 올리기 위한 방법을 찾아 낸 것이 아닌가 싶습니다.

5.1은  0.1이 붙은 정도가 아니라 앞자리 수가 바뀌어야 할 정도가 된 것 같습니다.  


조금 지나간 이야기 일 수도 있지만,

엄청나게 큰 데이터를 한 꺼 번에 엄청난 GPU로 학습하고,

그것을 생각의 사슬로 다시 반복...

이렇게 나온 합성 데이터를 인간이 검수 하고,

또 반복...

GPU 숫자가 필요한 이유를 말해주는 이런 스케일의 싸움 외에도

같은 크기에서 더 뛰어난 지능을 만들기 위한 

온갖 방법론을 ... 연구하고 적용시키고 있는 두 선두 기업들에 비해

그록은 이런 관문을 뚫는 연구...가 부족한 것이 아닌가...

이런 생각을 해보았습니다.

그나마 스케일로만 보면 넘어설 수도 있는 유일한 곳이 xAI임에도

실 성능에서 체감적으로 부족한 이유를 생각해 보았습니다. 

천문공 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [4]
memberst
IP 121.♡.223.41
11-16 2025-11-16 01:35:05 / 수정일: 2025-11-16 01:35:16
·
모델의 크기가 커진다고 이제 더이상 큰폭으로 성능이 증가하지 않죠 이제 추론 모델에 집중할수 밖에 없습니다
오히려 데이터 오염을 걱정해야 합니다.
문제는 추론이 쉽지 않죠
언어분석
IP 211.♡.250.234
11-16 2025-11-16 02:05:57 / 수정일: 2025-11-16 02:07:01
·
다른 회사들은 파라미터 크기 잘 공개 안 하던데
일론 머스크는 그냥 공개하더라고요
그록 5의 파라미터가 6조개라고 공개했더라고요
5개월 안에 출시될 예정이라 하던데, 기대하고 있습니다. 부디 잘 나오기를 바랍니다

그리고 구글 제미나이가
작문 능력이 좋다는 건 어디까지나 한국어 기준이고요
영어로 보면 얘기가 다릅니다

STEM 분야 전문가들이
왜 GPT를 최우선으로 쓰겠습니까?
제미나이를 한 수 아래로 보는 데는
그만한 이유가 있다고 봅니다

국내에서 제미나이가 최고라는 분들 얘길 들어보면
"한국어가 자연스러워서"라는 거거든요
그건 그냥 한국어 학습량이 많아서 그런 게 아닐까 생각합니다

저만 해도 모델별 용도가 확실히 나뉩니다.
일반적인 글쓰기는 제미나이 2.5 프로를 쓰고
STEM 분야는 GPT-5.1-HIGH 쓰고요

특히 돈이나 이익이 되는
중요한 문제는 무조건 GPT-5.1-HIGH를 기본으로 쓰고
제미나이를 보조로 활용합니다

그냥 잡담하거나 일상적인 고민 이야기할 때는
제미나이나 챗GPT-5.1-THINK나 아무거나 그냥 씁니다
이런 건 아무거나 써도 솔직히 비슷합니다
그로구
IP 73.♡.228.166
11-16 2025-11-16 02:27:29
·
@언어분석님
https://www.clien.net/service/board/park/18907351CLIEN
https://www.clien.net/service/board/park/18925916CLIEN
독고구패
IP 211.♡.91.82
11-17 2025-11-17 07:26:52
·
아하..딥시크나 제미나이같은 LLM의 스케일이 상당히 큰가보군요..
뭐 직접 돌려본 건 아니지만 연초에 이슈가 되었던 딥시크R1 671B같은 모델이나 라마 405B같은 모델들이
현존 프론티어 모델들에 비하면 한국어나 다국어 지원에서 약하다고 본 것 같아요.
하긴 많은 국가의 언어들을 지원하려면 모델 규모가 클 수밖에 없겠네요.
여러분야의 근본적인 지식 자체는 주요 언어들을 학습하면서 벡터 내에 어차피 녹아들어 있다고 하더라도
각 언어들에 대한 문자, 문법규칙같은 지식들은 또 별도로 추가 입력되어 벡터공간 안에 녹여야 할테니..
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.