@맥모닝불여일견님 제 기준은 프론티어 3사 인데, 최근에는 거의 그렇지가 않은 것 같습니다. 다들 컨텍스트도 길어졌고.. 저는 무조건 추론모델 쓰는데 이 모델들은 더 잘하더군요. 기업에 특강 다니는 AI 전문가분들이 어떻게 전문가이신지 모르겠지만 실사용은 제가 뒤떨어지지는 않을 거 같습니다. 요즘을 잘해요.
어떤 문서이신지는 잘 모르겠지만 문서 특성도 있긴 하겠죠. 그런데 뭐 오늘이 제일 못하니 내년 연초에 또 프론티어 모델들 업그레이드 되면 더 잘하지 않겠습니까 ㅎㅎ
pdf, hwp와 같은 파일은 내부적으로 구조 데이터가 없어서 AI에게 불리한 포맷인건 맞습니다. 자신이 직접 올리는 소규모의 데이터 기반에서는 당연히 잘될 수 있지만 대규모 rag 기준으로 볼때는 마크다운 된 형태 대비 확실히 난이도가 많이 올라갑니다. 그리고 추론으로 문맥을 파악을 해야 해서 오류 가능성도 높아지구요.
미디르
IP 121.♡.143.5
12-15
2025-12-15 15:54:50
·
전역한지 20년이 넘었지만, 그때 작전과에 있었는데, 그때는 hwp에 표를 가지고 온갖 그림을 다 그렸는데, 해석이 어떻게 될지 궁금하네요 ㅋㅋ
ISLAY
IP 220.♡.45.7
12-15
2025-12-15 15:57:04
·
HWP도 읽을수있으면 공문서작성하는 AI개발 제발 부탁드립니다 ;ㅡ; 혹시 있나요?
산들바람12
IP 61.♡.181.34
12-15
2025-12-15 16:18:59
·
@ISLAY님 AI는 없지만 노가다로 공문서 포맷 만들어서 배포하시는 분 있지 않았나요? ^^
태지보이스
IP 211.♡.120.208
12-15
2025-12-15 16:29:10
·
일단 표에 다 때려넣는 양식부터 없애야 합니다. 저도 마크다운 형태로 바뀌었으면 합니다. 배우기도 쉽고요. 1. 가. 1) 가) 규격이나, □ ○ - · 을 안맞춰도 마크다운이라면 ai가 인식하기도 쉽고요.
웹도 html 4.0 넘어가면서 div로 다 대체한 영역인데. 아직 hwp 쓰는 공공기관들은 규격화된 양식이 너무 많아요. 지자체 보도자료부터 그모양이고요...
섬마을생산직
IP 106.♡.128.229
12-15
2025-12-15 17:44:07
·
차라리 HWP에 마크다운 전환 기능을 넣어주는 것이 더 빠르고 쉬울 듯 하네요.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp 지나치게 큰 이미지의 크기는 조정될 수 있습니다.
모든 AI는 마크다운을 젤 좋아합니다.
한두장가지고 이야기 하시는걸까요?
내용을 잘 이해하고 답변을 해주는 게 잘 읽는다는 거죠.
제가 테스트 했을때도 그렇고, 최근에 AI 전문가분 오셔서 우연치않게 특강 듣게됬는데 그분도
하신말씀도 동일한 경험이시던데요. HWP는 데이터 손실이 좀 있다고 하시던데요.
어떤 문서이신지는 잘 모르겠지만 문서 특성도 있긴 하겠죠. 그런데 뭐 오늘이 제일 못하니 내년 연초에 또 프론티어 모델들 업그레이드 되면 더 잘하지 않겠습니까 ㅎㅎ
제가 너무 AI를 무시했나보네요 ㅎㅎ
다만 읽는건 하는데, 쓰는건 잘 못쓰더라고요ㅠ
그걸 파일 구조 탓을 할 필요는 없어요...
JPG는 읽는데 PNG는 못읽고 BMP는 거부하는 AI도 많은데요머... =_=
hwp 파일구조는
공개한 문서로 알 수 없는 영역이 많습니다.
이미지(쉽게 말해 스크린샷)로 만들어서 읽는 방향으로 가고 있어서.. 제약사항이 많이 사라졌습니다...
한국에서만 유일하게 사용되는 포맷이라 의지가 잘 안생기죠. ㅎㅎ
심지어 pdf도 던져주면 파이썬으로 텍스트 긁어보고 안되면 다른 방법으로 시도해보고...삽질 엄청 해서 어찌어찌 읽는 거라서, 데이터 손실이 생깁니다.
실무자들도 그게 편하고, 깨지지도 않고 제일 좋은데 말이죠.
자신이 직접 올리는 소규모의 데이터 기반에서는 당연히 잘될 수 있지만 대규모 rag 기준으로 볼때는 마크다운 된 형태 대비 확실히 난이도가 많이 올라갑니다.
그리고 추론으로 문맥을 파악을 해야 해서 오류 가능성도 높아지구요.
AI는 없지만 노가다로 공문서 포맷 만들어서 배포하시는 분 있지 않았나요? ^^
1. 가. 1) 가) 규격이나, □ ○ - · 을 안맞춰도 마크다운이라면 ai가 인식하기도 쉽고요.
웹도 html 4.0 넘어가면서 div로 다 대체한 영역인데.
아직 hwp 쓰는 공공기관들은 규격화된 양식이 너무 많아요. 지자체 보도자료부터 그모양이고요...