실제로 팩트체크 사실확인 벤치가 있습니다
불과 이전모델에 비해서도 기하급수적으로 떨어졌는데
근데 아직도 예전 3.5 4o시절의 ai로 생각하시는 분들이 많네요
gpt5 모델은 꼭 thinking과 검색을 켜고 쓰세요
그렇게 쓴다면 오류율이 1퍼센트 이하입니다.
물론 검증은 해야하고요. 1퍼라도 틀릴순 있으니까요. 띵킹과 검색을 켜고 쓴다면 좋은 팩트체크 도구가 맞습니다.
무료나 레거시 모델의 예시를 들어 환각이 많다는 일반화의 오류보다는
최신기술을 활용해 시간을 절약하면 좋습니다ㅎㅎ
그건 성능의 문제라 막으면 검색노출 금지하는 구글같은 깡패 제미나이나 퍼플렉서티로 교차검증 하시면 될 것 같습니다.
실제로 질병 진단 모델의 진단율을 높이기 위해 비슷한 방법을 쓰면 진단율이 대폭 상승합니다. 최근 마소가 발표했죠.