AI 채팅서비스 간단 비교(ChatGPT, Claude, Gemini, DeepSeek, ClovaX) : 클리앙

AI 채팅 서비스 초간단 비교 입니다.

이진산술연산시 플래그 값 변화를 맞추는 문제 1개로 아주 간단한 비교 테스트를 했습니다.

ChatGPT는 유료 구독 서비스 모델도 포함되었고 나머지 서비스는 모두 무료 상태로 비교한 것입니다.

[ 비교 결과 ]

결과 요약입니다.

----------------------------------------------------------------------------

● ChatGPT 4 (무료) : ✕ 틀림

● ChatGPT 4o (유료만 가능) : ○ 맞춤

● ChatGPT o1-Preview (유료만 가능) : ○ 맞춤

● Claude 3.5 Sonnet : ○ 맞춤

● 구글 Gemini : ○ 맞춤

● DeepSeek 일반모델 : ✕ 틀림

● DeepSeek DeepThink모델 : ○ 맞춤

● 네이버 CLVOA X : ✕ 틀림

----------------------------------------------------------------------------

중국 기업 DeepSeek의 DeepThink 모델의 성능도 놀랍네요.

마치 ChatGPT-o1-Preview 처럼 추론 과정을 길게 거치면서 문제를 풉니다.

그 추론 과정을 영어로 아주 길게 출력합니다.

[ 문제 ]

문제는 다음과 같은 것이었습니다.

----------------------------------------------------------------------------

다음은 산술논리장치(ALU)에 대한 상태 플래그들이다. A=01100010 과 B=01001010 을 산술논리장치에 의해 A+B를 실행한 후 각 플래그의 상태는 무엇인가? (단, 2의 보수로 저장 및 연산한다)

V 오버플로우 V=1:overflow, V=0: non-overflow

Z 제로 Z=1: zero, Z=0: non-zero

S 부호 S=1: 음수, S=0: 음수가 아님

C carry C=1 : 캐리 발생, C=0: 발생 안함

(1) V=0, Z=0, S=1, C=0

(2) V=0, Z=1, S=0, C=1

(3) V=1, Z=0, S=0, C=0

(4) V=1, Z=0, S=1, C=0

----------------------------------------------------------------------------

아래는 정성껏 캡처한 이미지입니다. (DeepSeek DeepThink 모델은 중간 추론이 너무 길어서 그 부분 생략했습니다.)

[ ChatGPT 4 ]

[ ChatGPT 4o]

[ ChatGPT o1-Preview ]

[ Claude 3.5 Sonnet ]

[ Gemini 무료]

[ DeepSeek 일반모델 ]

[ DeepSeek DeepThink모델 ]

(중간 과정은 너무 길게 출력되어서 생략)

[ 네이버 CLOVA X ]

끝

사용기