CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·일본산당 ·방탄소년당 ·자전거당 ·개발한당 ·이륜차당 ·안드로메당 ·소시당 ·나스당 ·골프당 ·디아블로당 ·육아당 ·AI당 ·가상화폐당 ·영화본당 ·클다방 ·리눅서당 ·소셜게임한당 ·걸그룹당 ·젬워한당 ·노젓는당 ·사과시계당 ·야구당 ·패스오브엑자일당 ·IoT당 ·창업한당 ·캠핑간당 ·패셔니앙 ·라즈베리파이당 ·맛있겠당 ·물고기당 ·노키앙 ·바다건너당 ·여행을떠난당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·배드민턴당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·도시어부당 ·FM한당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·키보드당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

유용한사이트

실시간 AI 코딩 랭킹 사이트 26

3
2026-01-11 08:47:40 수정일 : 2026-01-11 17:46:49 223.♡.78.53
LeChatNoir

IMG_5905.jpeg

주류 AI 모델의 신뢰성을 분석하여 벤치마크 순위를 알려주는 사이트입니다. 


AI 모델은 때때로 사용자 수가 너무 많고 수요가 너무 높아서 출력 품질을 떨어뜨릴 수 있습니다. 물론, 일부 버그나 고장으로 인해 출력 성능에 영향을 줄 수도 있습니다. 


글 작성 현재 1위는 CLAUDE-SONNET-4 입니다(4.5 아님;;;).


사진 출처 및 관련 사이트는 아래와 같습니다. 

https://aistupidlevel.info/

출처 : https://aistupidlevel.info/
LeChatNoir 님의 게시글 댓글
SIGNATURE
포옹은 누군가를 안으며 동시에 나를 안는 것
- 조해진
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [26]
소프트코어
IP 125.♡.241.175
01-11 2026-01-11 11:08:32
·
잼민이는 아예 없네요
LeChatNoir
IP 223.♡.78.53
01-11 2026-01-11 11:21:07 / 수정일: 2026-01-11 11:21:30
·
@소프트코어님 댓글 작성 현재 12위 정도입니다.
ones
IP 211.♡.68.160
01-11 2026-01-11 13:24:34
·
제미나이 할인 많이 하길래 구독했더니... gpt보다 말 못알아 먹네요. ...
주사위내기
IP 14.♡.174.40
01-12 2026-01-12 02:10:10
·
@ones님 제미나이 유료구독 하셨으면 안티그래비티로 클로드 소넷/오퍼스 쓰세요
체감상 클로드 코드보다 구글 AI Pro에서 주는 Antigravity의 클로드 사용량이 더 많다고 느낍니다.
껍질파괴
IP 218.♡.54.216
01-11 2026-01-11 14:46:03
·
이런건 어떤 식으로 순위를 매기는 것인지 궁금하네요
이걸보니 오픈소스 기반의 모델 순위도 궁금하네요
LeChatNoir
IP 223.♡.78.53
01-11 2026-01-11 14:55:57 / 수정일: 2026-01-11 15:19:37
·
@껍질파괴님 사이트 FAQ에서 자세히 다루고 있으니 참고하시기 바랍니다.

일부 번역하면 다음과 같습니다.

“우리 시스템은 인공지능 모델의 성능을 4시간마다 자동 벤치마크를 통해 지속적으로 모니터링합니다.
각 모델에 대해 147개의 고유한 코딩 과제를 수행하며, 7가지 주요 지표(axis)에서 성능을 측정합니다.
그 결과를 28일간의 이동 기준선(rolling baseline)과 비교하여 z-점수 표준화(z-score standardization) 통계 분석을 적용함으로써 의미 있는 성능 저하를 감지합니다.
또한 CUSUM(누적합) 알고리즘을 사용해 지속적인 성능 저하 패턴을 식별함으로써, AI 기업이 계산 비용을 절감하기 위해 모델 능력을 의도적으로 낮추는 경우를 포착할 수 있습니다.”
Ytl
IP 211.♡.197.227
01-11 2026-01-11 17:22:14
·
@LeChatNoir님 아니 그럼 코딩용 순위자나요. 확실히 말씀 해주셔야죠.
D - DAY ™ ☆
IP 59.♡.241.190
02-10 2026-02-10 09:08:26 / 수정일: 2026-02-10 09:10:16
·
@Ytl님 난독증이 있으신가 봅니다. 제목에 "코딩용 랭킹 사이트" 라고 명시 되어 있습니다. 단순히 AI 순위 사이트가 아니구요. LeChatNoir 님께 아주 실례가 되는 말씀 이시네요.
Neo_
IP 222.♡.182.17
01-11 2026-01-11 16:28:09
·
딥식이두 꽤 높네요
답답해서
IP 111.♡.48.101
01-11 2026-01-11 16:48:42
·
제 경험으로는 절대로 신뢰할 수 없군요. 지피티가 얼마나 엉망진창이고 한심한지 날마다 끊임없이 경험하는데... 잼민이보다 아득히 위라고?
절대 못 믿겠군요....
애초에 랭킹에 있는건 잼민이 2.5..... 뭐 잼민이 3.0은 그보다도 더 아래에 있다는 건가요??????
LeChatNoir
IP 223.♡.78.53
01-11 2026-01-11 17:08:35
·
@답답해서님 사이트 FAQ에 의하면 코딩 능력만으로 벤치마킹한 이유가 설명되어 있습니다.

일부 번역하면 다음과 같습니다.
“코딩 작업에 일반 언어 능력보다 초점을 맞추는 이유는 코딩이 객관적이고 이진적인 성공 기준을 제공하기 때문입니다. 코드가 작동하든 하지 않든 명확한 결과가 나오며, 창작 글쓰기나 의견 생성처럼 주관적인 작업과 달리 자동화된 테스트로 검증 가능한 출력을 보장합니다.”
nikescar
IP 117.♡.242.7
01-11 2026-01-11 18:39:30
·
@LeChatNoir님 벤치마킹 방법을 공부해보면 어떻게 하면 모델들을 잘 쓸수 있는지 알수 있겠군요. 좋은정보 감사합니다.
실뱌나스
IP 175.♡.236.26
01-11 2026-01-11 16:56:58
·
라이브벤치 https://livebench.ai/

아티피셜 인텔리전스 https://artificialanalysis.ai/

정도 참고하시길 추천합니다.
고멍
IP 128.♡.217.52
01-11 2026-01-11 16:58:58
·
같은걸 물어도 지피티에 비해 재미나이가 뭔가 답이 짧아요.
Mr.UN
IP 14.♡.43.15
01-11 2026-01-11 17:40:03
·
랭킹 자체는 그냥 재미로 보면 될 듯 합니다.
실제로 LLM 업체들의 서비스가 항상 균일하지 않은 것이 사실이며 그걸 디텍트 해주는 기능이 있다는 점은 의미 있는 시도 같습니다. (대표적으로 주말에 한없이 멍청해지는 클로드 모델들...)
철쇄아
IP 39.♡.28.90
01-11 2026-01-11 18:38:41
·
성능저하 랭킹인데요??
nikescar
IP 117.♡.242.7
01-11 2026-01-11 18:42:56
·
@철쇄아님 사이트 들어가보시면 stupid meter는 전체 모델들의 성능을 측정해서 더한거고요. 스크린샷에 있는 live model ranking은 각 모델의 측정치이고 높은게 좋은거라네요.
철쇄아
IP 39.♡.28.90
01-11 2026-01-11 19:00:28
·
@nikescar님 아, 말씀이 맞네요 ㅎㅎ 아래 설명을 먼저 읽었더니;; 실제 사용 상의 결과와 너무 달라서 확증편향이 왔나 봅니다.
kaminus
IP 219.♡.147.58
01-11 2026-01-11 19:55:10
·
오푸스가 더 잘하는데 소넷이 1등이라니 이상하네요
리릿
IP 175.♡.33.88
01-12 2026-01-12 03:09:00 / 수정일: 2026-01-12 03:10:50
·
AG로 제미니3프로랑 오퍼스4.5 둘다 번갈아써봤는데...
비교도 안되네요.
제미니3프로는 진짜 큰 파일 처리할때만 잠깐 씁니다.

코딩에는 제미니3프로 진짜 최악이에요.
플래시만도 못해요.
빠르게 3.1이나 3.5 나오지 않으면 다 떨어져나갈 것 같은데요.
할인한게 여세를 몬다기보다는 위기감에 한 것 같아요.
코디악곰
IP 118.♡.254.75
01-20 2026-01-20 14:14:53
·
어디에나 랭킹이 존재하는구나
세끼치킨
IP 172.♡.52.234
01-24 2026-01-24 22:51:50
·
OPUS 코딩 실력이 장난아니게 좋더군요.
그 동안 다른 모델을 사용하면서도 아직 내가 대체는 안되겠구나 싶었지만 Opus를 사용하고서는 곧 내가 대체되겠구나라는 생각이 들었네요.
스티븐84
IP 118.♡.90.9
01-26 2026-01-26 16:02:25
·
클라우드가 4.5대신 4.0을 쓰는 이유가 있나요?
보고또또보고
IP 125.♡.41.31
02-26 2026-02-26 11:59:22
·
kimi 는 어떤 모델인가요? 전 좀 생소하네요.
PepperPark
IP 222.♡.218.180
02-26 2026-02-26 16:13:21
·
역시 클로드군요
jjlabsio
IP 218.♡.145.217
03-18 2026-03-18 23:46:22
·
아직도 opus 4.6이 안나오는거 보니까 업데이트가 많이 늦네요
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.