됩니다.
직업과 관련해서
한달전부터 로컬LLM 만든답시고 낑낑댔는데
가장 힘든것중 하나가 품질좋은 자료로 AI가 먹기좋게
만들어 학습시키는 것이더군요.
많은 데이터가 현행법령 ㅡ 건축법. 전기...등등인데
DOC.HWP.PDF외엔 없습니다. 사람위주 자료죠
AI는 사람과달리
PDF파일은 글귀도 잘 못알아먹습니다
그림이라도 섞이면 너무많은 노가다가 필요합니다.
AI경쟁력 높이고 기업자료등 국외자료 유출 방지하려면
제미나이같은 클라우드가 아닌 기업별 개인별
로컬LLM이 필수이고.
하드웨어는 시간이 지나면 적당한 가격대로 내려올겁니다.
qwen. llama 같은걸 쓸수밖에 없고
설사 국산LLM을 쓴다고 해도
결국은 품질좋은 학습자료를 얼마나 확보해서 기업경쟁력을
끌어올리느냐가 소버린Ai. 내재화의 선결과제가 아닐까
합니다.
AI 소버린이니 뭐니도 좋은데 질좋은 다량의
한글학습자료 확보가 그시작이고
제발 현행법령등 정부제공 자료부터 품질좋은 AI소스로
제공했으면 좋겠어요.
한글 hwp 로 표를 이렇게 까지 만든다고? 싶은게 많아서...학습 시키려면 HWP 전용 OCR 이라도 나와야 할겁니다. ㅋ
하물며 한글 파일이야.
doc 파일 제공도 안하던 공무원들이 마크다운이라니 장족의 발전이라고 봅니다.
시도중인데 파편화 느낌.
차라리 hwp처럼 KMD같의
AI전용포맷을 개발해 만드는것도
좋구요.
kmd 좋네요.
hwp란게 국제표준이 아니란 비판도 있지만
컴퓨터 문서,검색엔진의 독자성에 기여해
많은 자본유출을 차단한 공도 있죠.
한국시장이 중요하면 글로벌메이커가 알아서 변환기 만들던지 할거고요.
개발자가 문서 읽을 일이 사라졌습니다.