CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·아이포니앙 ·주식한당 ·MaClien ·방탄소년당 ·일본산당 ·개발한당 ·자전거당 ·안드로메당 ·노젓는당 ·육아당 ·나스당 ·소시당 ·영화본당 ·디아블로당 ·소셜게임한당 ·가상화폐당 ·리눅서당 ·여행을떠난당 ·X세대당 ·달린당 ·퐁당퐁당 ·보드게임당 ·키보드당 ·날아간당 ·뚝딱뚝당 ·창업한당 ·덕질한당 ·이륜차당 ·총쏜당 ·스팀한당 ·AI그림당 ·개판이당 ·바다건너당 ·물고기당 ·콘솔한당 ·IoT당 ·시계찬당 ·AI당 ·냐옹이당 ·야구당 ·3D메이킹 ·ADHD당 ·사과시계당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·활자중독당 ·볼링친당 ·캠핑간당 ·문명하셨당 ·클래시앙 ·클다방 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·걸그룹당 ·안경쓴당 ·골프당 ·차턴당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·파도탄당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

업스테이지 솔라 프로4에 대한 추가 정보 4

1
2026-07-05 08:29:37 수정일 : 2026-07-05 08:47:22 122.♡.56.205
천문공

스크린샷 2026-07-05 080800.png

https://artificialanalysis.ai/?intelligence=artificial-analysis-intelligence-index

그림의 저 끝에 있는 것이 전 버전인 프로3입니다.


프로4의 성능은 기자간담회에서 밝힌 아티피셜 벤치의 인텔리전스 지수 부분의 44.4 점이라고 하므로, 

위의 그림(방금 뜬 AAII 스샷)에서 해당 성능은 Qwen3.7 MAX 바로 아래, 미니맥스 M3 바로 위입니다.

이 정도면 전 대성공인 것 같습니다.


프로4는 상업용 모델로 공개 모델이 아닙니다.  아무래도 아래 기사 보시면 아시겠지만

컨텍스트에 차이를 두고 이름을 달리 하여 '오픈2'라는 이름으로 공개 될 예정으로,

모델 성능 자체는 거의 같은 것 같습니다.


https://v.daum.net/v/prgaeSSr7S

상세한 내용은 기사 내용 참고 해 보시면 좋겠습니다.


앞선 글에서 다 다루지 못한 부분이 있는 점이 하나 정도가 아니라 두엇이 되어 적는 글입니다.

일단 모델 사이즈가 놀랍습니다.

약 200B 정도라고 하네요.


또한 댓글 중에 에이전트 기능에 대한 언급이 있었는데,

타우2-벤치가 98%가 나왔다고 합니다.

사실 아는 사람은 아는 것이지만 타우2가 주요 벤치인 것은 맞습니다.

다만, 에이전트 관련 몇 가지가 더 있기 때문에 다른 벤치도 같이봐야 할 것입니다.


# 사용 해 본 사람들의 체험 성능


에이전트 관련해서는 긍정적 이야기가 많습니다. 그러나 일방적이진 않더군요.

뭐랄까 어떤 느낌이냐면... 벤치 점수 만큼의 지능을 보이긴 보인다는 것인데,

다양한 사용자 층이 있고 그들의 눈 높이가 높아져 있는 상태여서

일부 밟히는 부분들이 없잖아 있는 모양입니다.

어떤 사용자는 제미나이 3.5 플래시 정도의 체감 성능이라 말하기도 합니다.

최종 버전이 나오게 되면 보다 안정화 되어 나올 것을 기대해 보게 합니다.

사용은 주로 타임리에서 해본 것 같습니다. 


# 다음과의 시너지.


제가 생각하는 AI모델들의 단점은 이 검색에 있는데요.

심지어 검색의 왕자인 구글이 만든 제미나이조차 환각이 심합니다.


이걸 원천적으로 잡는 방법을 아무도 쓰지 않는데 

업스테이지가 이 방법을 쓰려고 합니다.

즉 검색 엔진을 직접 사들여서 데이터 구조를 직접 이용하는 것입니다.

과거 외부에서 가장 잘 한다고 보였던 퍼플렉시티도... 한계는 있었는데 말입니다.


다음과의 시너지로 다음 검색 능력도 더욱 강화 하고,

AI모델로 같이 동반 업그레이드 되는 시나리오... 괜찮아 보입니다.


덧) 수능 벤치 출처 궁금해 하시는 분들이 있는 것 같아 남깁니다.

https://hehee9.github.io/2026-CSAT/

천문공 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [4]
블루바다
IP 157.♡.216.14
08:34 2026-07-05 08:34:33
·
다음이 다시 카카오를 먹는 그날까지!
Gomgome
IP 106.♡.138.119
09:51 2026-07-05 09:51:21 / 수정일: 2026-07-05 09:51:30
·
까마득하네요...
생각보다 격차가 좁혀지지않네요
천문공
IP 122.♡.56.205
10:00 2026-07-05 10:00:01
·
@Gomgome님
ㅎㅎ 그렇게 보실 수도 있습니다.
격차가 좀 있긴 하죠.

제 생각에 중국 모델 선두권에는 미치지 못하지만...
조만간 비슷하게 되는 정도가 된다면... 성공일 것 같습니다.
그럴 가능성이 보인 상태구요.
jidi0109
IP 112.♡.214.71
10:24 2026-07-05 10:24:37
·
같은 모델이라도 서비스단계에서 여유컴퓨팅용량에 따라 실성능 차이가 크니 벤치마크 신뢰도가 하락하는 느낌입니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.