우와 맥의 미리보기에서 PDF파일 한글검색이 안되는군요. : 클리앙

고객지원

MaClien

맥당이야기 우와 맥의 미리보기에서 PDF파일 한글검색이 안되는군요. 17

2022-03-12 20:39:21 39.♡.227.148

스티브웍스

21세기에 이런일이...

기본앱의 기본기능이 안된다는게 참 그렇습니다.

아이폰 문자검색도 그렇고요.

한영전환 딜레이, 자소분리 포함해서 한글 관련한 문제들만 해결돼도 쾌적할 것 같은데 아쉽군요.

스티브웍스 님의

댓글 • [17]

tiwlndel

되는 것 같은데.. pdf ocr까지 잘 뜨네요

aegas

encoding 문제일 수 있어요. pdf를 만든 쪽에서 괴랄하게 만들어 놓으면 그렇습니다.
pdf에서 한글 부분을 긁어서 cmd-c 한 뒤에 textedit 같은 데에서 cmd-v 해서 보세요.
뭔가 마구 깨져있으면 해당 pdf 파일에 문제가 있는 겁니다.

스티브웍스

@aegas님 아예 안되는 것은 아닌가보군요. 그게 정부기관에서 생산한 PDF이기는 합니다. 제가 가지고 있는 파일은 복붙하면 깨지는 것, 깨지지 않는 것 둘다 동일하고요. 윈도우즈 어도비에서는 잘 되는 것을 보면 마냥 PDF 생산자만 탓하기는 어렵네요.

viper_JS

영문 pdf만 봐서 한글 검색이 안되는 것도 몰랐네요 ㅎㅎ

aegas

@viper_JS님 잘 됩니다.

viper_JS

@aegas님 안됩니다.

aegas

@viper_JS님 영문 pdf만 봐서 그런 문제가 있는 줄 몰랐다고 하시지만,
사실 영어도 인코딩 꼬인 문서는 검색 안 되긴 마찬가지죠.

예를 들어 80년대나 90년대 초반 정도까지 학계에서 생산된 tex -> dvi -> ps -> pdf를 거쳐서 만들어진
pdf 문서들 같은 경우에는 모던한 시스템에서 utf-8 같은 걸 가정하고 검색할 때 검색이
제대로 되지 않습니다. tex 자체의 괴랄한 인코딩 때문이죠. 요즘에야 tex 생태계가
많이 현대화되어 그런 문제가 없습니다만…

한글 문서야 두말할 필요가…

viper_JS

@aegas님 다른 앱에서는 검색이 됩니다.. 사파리에서도 찾기로 검색이 되는 파일이에요..

viper_JS

@aegas님 아니요... 지금 이 글에서 계속 '미리보기' 앱에서 한글 찾기가 안되는 문제를 말하고 있잖아요 ㅠㅠ 근데 자꾸 본인의 주장을 관철시려고 끝도없이 다른 이야기를 끌어오시면 ㅠㅠ
미리보기 앱에서는 한글 찾기가 안되는게 맞아요... 수정이 되어야 할 사항이라구요..

꽈보

한글 잘 검색됩니다. 간혹 검색복사방지된 pdf파일은 안되더라고요.

스티브웍스

@꽈보님 제한적으로 가능한 것 같네요. 윗분들 말씀을 들어보니 인코딩 방식을 심히 타는 것 같은데 개선이 되면 좋겠습니다.

백에이커의숲

되긴되는데 버그인가 지금은 잘 안되네요. ㅠㅜ

스티브웍스

@백에이커의숲님 파일마다 복불복인가봐요. 미리보기 엄청 편한데 아쉽네요 ㅜㅜ

aegas

아마도 맥의 preview는 유니코드 검색만 지원하는 것 같군요.
유니코드가 이제 나온지 30년이 지났는데, 이제 충분히 그럴 때가 되었다고 생각합니다.
옛날에 생산된 비 유니코드 인코딩 문서를 위한 배려가 있으면 나쁘지 않겠지만,
모든 pdf 뷰어가 다 그럴 필요는 없지 않을까 싶고요.
그리고 대체 어디까지의 레거시 인코딩을 지원해야 잘 지원하는 것인지의
문제도 있지요.

또한, 현재 생산되고 있는 문서가 예를 들어 euc-kr 같은 인코딩으로 생산되는
경우가 있다면, 현 시점에서는 그건 그 워크플로우에 문제가 있다고 봐야
한다고 매우 진지하게 생각합니다. 이메일이건, pdf건, 유니코드 아닌 걸로
만들어진 문서를 보면 드는 생각은 오직, “대체 언제까지?!?”

aegas

연관된 이슈로, macos의 기본 메일앱은 이제 문서의 인코딩을 수동으로 선택하지 못하는 것 같습니다.
몇 년 전까지는 문서의 실제 인코딩이 선언과 다르다거나… 하여튼 뭔가 꼬여서 이상하게 온 이메일을
인코딩을 바꿔서 보는 시도를 할 수 있었던 것 같은데 이젠 그 기능이 사라진 것 같아요.

희안하게도, 근데 macos 기본 메일 앱에서 깨지는 것이 ios 기본 메일 앱에서 멀쩡하게 보이는
것들이 있습니다. 넥스트스텝에서 온 mail.app이 공통 조상이라고 생각했는데 아닌가봐요.

근데 결국 이렇게 깨지는 이메일은 원인을 따져보면 거의 대부분 메일 서버를 운영하는 X들께서 설정을
잘못해서 이상한, 혹은 레거시 인코딩으로 보내지기 때문인데, 이걸 받는 쪽에서 곱게 받아서 곱게 인코딩
잘 고려해서 곱고 예쁘게 보여주는 것이 맞나 싶기도 합니다. 오냐오냐하고 잘 받아주면 서버 관리하시는
분들께서 잘못된 게 없는 줄 알거든요. 마구 깨져서 받는 쪽에서 불평을 해야 뭔가 문제가 있다는 것을
인지하지요. 표준은 느슨하게 구현하는 게 아니라 엄격하게 구현하는 것이 생태계를 위해서는 장기적으로
좋은 일이라고 생각합니다.

viper_JS

@aegas님 유니코드로 작성된 pdf파일은 한글로 검색이 된다고 하시는데요.
저의 맥만 문제가 있는지 저는 한글로 검색이 되는 파일이 없네요...
혹시 샘플 파일 있으실까요!??

aegas

@viper_JS님 https://ctan.math.washington.edu/tex-archive/language/korean/kotex-utf/doc/kotexdoc.pdf

예를 들어 이 파일을 시험해 보시면 어떨까요?

한글의 경우에는 페이지 단위까지 찾아주네요. 페이지 내에서의 개별 위치를 찾지 못할 이유가 없는 것 같은데 이 부분은 딱히 구현 못할 이유도 없어보여서 잘 이해되지 않는 부분입니다. 영어의 경우에는 페이지를 찾을 뿐 아니라 페이지 내에서의 위치까지 찾는 것 같습니다.

목록으로

글쓰기

이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고

개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책

보안 강화를 위한 이메일 인증

안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
개인정보에서도 이메일 인증을 할 수 있습니다.

지금 이메일 인증하기

등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.