AI 채팅 서비스 초간단 비교 입니다.
이진산술연산시 플래그 값 변화를 맞추는 문제 1개로 아주 간단한 비교 테스트를 했습니다.
ChatGPT는 유료 구독 서비스 모델도 포함되었고 나머지 서비스는 모두 무료 상태로 비교한 것입니다.
[ 비교 결과 ]
결과 요약입니다.
----------------------------------------------------------------------------
● ChatGPT 4 (무료) : ✕ 틀림
● ChatGPT 4o (유료만 가능) : ○ 맞춤
● ChatGPT o1-Preview (유료만 가능) : ○ 맞춤
● Claude 3.5 Sonnet : ○ 맞춤
● 구글 Gemini : ○ 맞춤
● DeepSeek 일반모델 : ✕ 틀림
● DeepSeek DeepThink모델 : ○ 맞춤
● 네이버 CLVOA X : ✕ 틀림
----------------------------------------------------------------------------
중국 기업 DeepSeek의 DeepThink 모델의 성능도 놀랍네요.
마치 ChatGPT-o1-Preview 처럼 추론 과정을 길게 거치면서 문제를 풉니다.
그 추론 과정을 영어로 아주 길게 출력합니다.
[ 문제 ]
문제는 다음과 같은 것이었습니다.
----------------------------------------------------------------------------
다음은 산술논리장치(ALU)에 대한 상태 플래그들이다. A=01100010 과 B=01001010 을 산술논리장치에 의해 A+B를 실행한 후 각 플래그의 상태는 무엇인가? (단, 2의 보수로 저장 및 연산한다)
V 오버플로우 V=1:overflow, V=0: non-overflow
Z 제로 Z=1: zero, Z=0: non-zero
S 부호 S=1: 음수, S=0: 음수가 아님
C carry C=1 : 캐리 발생, C=0: 발생 안함
(1) V=0, Z=0, S=1, C=0
(2) V=0, Z=1, S=0, C=1
(3) V=1, Z=0, S=0, C=0
(4) V=1, Z=0, S=1, C=0
----------------------------------------------------------------------------
아래는 정성껏 캡처한 이미지입니다. (DeepSeek DeepThink 모델은 중간 추론이 너무 길어서 그 부분 생략했습니다.)
[ ChatGPT 4 ]

[ ChatGPT 4o]

[ ChatGPT o1-Preview ]

[ Claude 3.5 Sonnet ]

[ Gemini 무료]

[ DeepSeek 일반모델 ]

[ DeepSeek DeepThink모델 ]

(중간 과정은 너무 길게 출력되어서 생략)

[ 네이버 CLOVA X ]

끝
copilot(무료) : 정답 1번 (틀림)
perplexity pro(유료) : 정답 4번 (맞음) 으로 나오네요....