이재명 대통령이 취임 후 첫 업무보고에서 한컴오피스의 아래아한글(HWP) 형식이 인공지능(AI) 활용에 적합하지 않다며 대책 마련을 주문했다. 정부와 공공기관에서 주로 사용해 온 HWP 문서 형식이 AI 학습에 적합하지 않아 공공 데이터 활용에 장애물로 여겨졌는데, 개선에 대한 논의가 본격화할지 주목된다.
◇ 李대통령 “AI가 못 읽는 아래아한글 데이터… 기술적 해결책 찾아달라”
18일 관련 업계에 따르면 이 대통령은 지난 11일 세종컨벤션센터에서 열린 2026년 업무보고에서 안형준 국가데이터처장의 보고를 받고, 아래아한글의 공공 데이터 호환성 문제를 지적하며 대책 마련을 요구했다.
이 대통령은 “데이터의 중요성이 커지면서 인공지능 사회의 핵심은 결국 데이터”라며 “어떤 양질의 데이터를 만들어 어떻게 활용할 것인지가 중요하다”고 말했다. 이어 “정부 공문서는 데이터 측면에서 가장 양질의 자산인데, 대부분이 아래아한글로 작성되고 각종 기법이 적용되면서 기계가 못 읽는다는 거 아니냐”며 “이걸 어떻게 해결할 것인가”라고 물었다.
이에 안 처장은 “AI가 읽을 수 있도록 표준화를 실시해야 한다”며 “아래아한글을 PDF 파일 등으로 변환해 ‘머신 리더블(Machine Readable)’한 형태로 만들 준비를 하고 있다”고 말했다. 이어 이 대통령은 “PDF로 변환하면 다 읽을 수 있느냐”고 재차 확인했고, 안 처장은 “일반적인 경우는 읽히지만, 불투명한 경우에는 PDF 파일로도 읽히지 않아 기술적으로 또 다른 변환이 필요하다”고 답했다. 이 대통령은 “기술을 충분히 활용하면 방법은 있을 것”이라며 “사람 손으로 할 수는 없고, 기술적인 해결책을 잘 찾아달라”고 주문했다.
이 같은 지적은 AI 시대의 핵심인 양질의 데이터가 정부의 낡은 관행으로 인해 제대로 활용되지 못하고 있는 현실을 대통령이 공식 석상에서 처음으로 짚은 사례다. 데이터의 활용성을 높이기 위해 문서 체계 전반을 근본적으로 개선해야 한다는 강력한 메시지로 해석된다.
(후략)
다른데는 일부러 신경을 안쓰는건 아닌것 같고 구글이 살짝 빨랐다? 또는 구글이 한국 자료를 많이 가지고 있었다. 정도가 되는것 같네요
결국 다 읽어드릴겁니다만 이걸 적극적으로 하느냐 보고 있느냐는 다른 일이겠죠
이전 데이타들은 당연히 어찌 해야 하지만 앞으로 만들어질 문서들 때문이라도 지금의 양식을 바꿔야 하지 않나요. 계속 놔두면 계속 똥만드는 것이잖아요.
법은 잘 모르는데 이런 법 자체의 취지와 관련 없는 부분에 대해서 많은 법을 한번에 고치는 패키지 입법 같은게 되면 좋겠네요.
그래서 업무보는 사람은 구글을 더 선호합니다.
글로벌 표준도 아니거니와
막말로 관에서 대놓고 키운거잖아요
배짱장사로 라이선스 장사나해먹고
대관 업무 쪽 하는 쪽에 pdf로 보내도되는데 담당자는 귀찮다고 그냥 .hwpx로 던지고
pdf고치라하면 그런거 니들이 알아서해야지 이러고 이런 행태가 hpw 독점이라서 그래요 관쪽에
이거부터 고쳐먹어야죠