키미(Kimi)를 개발한 중국의 AI 스타트업 Moonshot AI가 코딩과 자율 에이전트 작업에서 특히 강력한 성능을 보이는 오픈소스 언어 모델을 출시했습니다.
Kimi K2라고 불리는 새로운 모델은 총 1조 개의 매개변수와 320억 개의 활성화된 매개변수를 특징으로 합니다.
회사는 두 가지 버전을 출시했습니다.
연구자와 개발자를 위한 파운데이션 모델, 그리고 채팅 및 자율 에이전트 애플리케이션에 최적화된 인스트럭션 조정 변형 모델 입니다.
Kimi K2는 LiveCodeBench에서 53.7%의 정확도를 기록해 GPT-4.1의 44.7%를 앞섰습니다.
수학 문제 해결 능력을 측정하는 MATH-500에서도 97.4%로 GPT-4.1의 92.4%보다 높은 점수를 얻었습니다.
출처 : Moonshot AI
더 주목할 점은 이 모델이 단순히 질문에 답하는 것을 넘어서 실제 작업을 수행할 수 있다는 것입니다.
예를 들어 급여 데이터 분석을 요청하면 16개의 파이썬 작업을 자동으로 실행해 통계 분석과 시각화를 완성합니다.
런던 콘서트 계획을 세워달라고 하면 검색, 일정 관리, 이메일, 항공편 예약까지 17개의 도구를 연계해 종합적인 계획을 수립합니다.
Moonshot AI의 기술적 혁신도 눈에 띕니다.
'MuonClip'이라는 새로운 최적화 기술을 개발해 대규모 모델 훈련 시 발생하는 불안정성 문제를 해결했습니다.
가격 경쟁력도 높습니다.
API를 통해 백만 토큰당 0.15달러(캐시 히트 기준)에서 2.50달러로 서비스를 제공하는데, 이는 OpenAI나 Anthropic보다 훨씬 저렴합니다.
동시에 오픈소스로도 공개해 누구나 무료로 사용하고 수정할 수 있습니다.
https://moonshotai.github.io/Kimi-K2/