안녕하세요.
PDF 번역 프로그램이 1.4 버전으로 업데이트되었습니다.
소개
PDF의 페이지 레이아웃을 그대로 유지하면서 페이지를 번역하는 프로그램입니다.
번역 엔진은 자체 개발한 번역엔진과 구글, DeepL, ChatGPT, Gemini, Claude 번역 API를 이용할 수 있습니다.
번역 가능한 언어는 영어,일본어,중국어 등 18개의 언어를 지원합니다(자체 번역엔진은 영어만 가능)
1.4 버전 변경 사항
- 한국어 이외의 언어(18개 언어)로도 번역 지원(기본 번역 엔진은 제외)
예: 일본어->영어, 영어->중국어 등으로 번역 가능
- 번역 엔진으로 Claude API 추가
- 프로그램 실행 시 서버가 설치 또는 실행되어 있지 않은 경우 설치/실행하게 기능 개선
- 대문자로 이루어진 PDF 파일에 대해 드래그앤드롭으로 파일을 가져오지 못하는 문제 수정
설치
프로그램의 크기가 커서 홈페이지에서 다운로드 받으신 후 압축을 풀어주세요.
번역 서버 설치
Google나 ChatGPT와 같은 외부 번역 엔진만 사용하는 경우에는 setup.bat를 실행합니다.
기본 번역 엔진을 사용하고 Nvidia 그래픽 카드가 있으며 GPU를 이용해 번역하고자 하는 경우에는 setup_gpu.bat를
그렇지 않으면 setup.bat를 실행합니다.
실행
1. 번역 서버 실행
Server 디렉토리에 있는 run.bat 파일을 실행합니다.
2. 번역 프로그램 실행
번역->번역 엔진 메뉴에서 번역에 사용할 번역 엔진을 선택합니다.
DeepL, ChatGPT, Gemini, Claude를 사용하는 경우 환경 설정에서 API 키를 등록해야 합니다.

환경설정에서 Gemini 모델을 gemini-2.5-pro로 선택하시면 됩니다.
프로그램 자체에서 페이지 제한은 없습니다.
lm에서 가상 api 지원하지 않나요?
지원할 예정으로 있는데 가능하면 다음 버전에 지원하도록 하겠습니다.
녜. 기업에서도 자유롭게 사용하실 수 있습니다.
호오오옥시 맥버전은 계획에 없으신지요 ㅠ
물론 지금도 너무 감사드립니다!!
제가 맥을 써 본 적이 없어서 맥을 지원할 계획은 없습니다.
run.bat 파일은 setup.bat를 실행하면 생성되는 파일이니 먼저 setup.bat를 실행해 주세요.
PDF 레이아웃 분석을 서버에서 하기 때문에 외부 API를 사용한다 하더라도 번역 서버는 필요합니다.
c:\User\user\Downloads\BluePDF_v1.4\Server\server.py", line 2, in <module>
from fastapi import FastAPI, HTTPException
ModuleNotFoundError: No module named 'fastapi'
계속하려면 아무 키나 누르십시오 . . .
setup.bat를 다시 실행하고 run.bat 실행하니 작동합니다.~
이것저것 설치되던데 모두 삭제하려면 어떻게 해야 하나요?
일단 프로그램이 설치된 디렉토리(하위 디렉토리 포함)를 삭제하면 하나를 제외하고 모두 삭제됩니다.
그리고 C:\Users\사용자명\.cache\huggingface\hub\models--juliozhao--DocLayout-YOLO-DocStructBench
디렉토리를 삭제하시면 됩니다.
이미지로 스캔된 파일은 먼저 OCR 처리를 먼저 해줘야 합니다.
OCR 메뉴에 있는 OCR 기능을 이용하여 텍스트 이미지를 텍스트로 변환한 다음 번역하시면 됩니다.
raise EnvironmentError(
OSError: Can't load tokenizer for 'paust/pko-t5-base'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name. Otherwise, make sure 'paust/pko-t5-base' is the correct path to a directory containing all relevant files for a T5TokenizerFast tokenizer. -이런 에러가 뜨면서 서버가 실행이 안되고 있는데 뭐가 문제일까요?
에러 메세지를 보니 아마 model 디렉토리가 이미 존재해서 그런 것 같습니다.
Server 디렉토리 밑에 있는 models 디렉토리를 삭제한 다음 다시 setup.bat를 실행해 보세요.
curl: (35) schannel: next InitializeSecurityContext failed: CRYPT_E_NO_REVOCATION_CHECK (0x80092012) - 해당 함수에서 인증서에 대한 파기 여부를 검사하지 못했습니다.
-File 매개 변수에 대한 인수 'install-uv.ps1'이(가) 없습니다. 기존 '.ps1' 파일의 경로를 -File 매개 변수의 인수로 제공하십시오. - 혹시 이것은 어떤 문제일까요?
아래 단계대로 해보시고 도중에 문제가 발생하면 설치한 프로그램을 삭제하고 재설치하는 게 나을 것 같습니다.
1) 라이브러리 설치
uv pip install -r requirements.txt
실행이 정상적으로 되는지 확인. 문제 발생 시 재설치
2) 모델 다운로드
Server 디렉토리 밑에 models 디렉토리가 없으면
mkdir "models"
이 후 아래 명령어 실행
uv run download.py "Darong/BlueT" --save_dir models
3) run.bat 생성
메모장을 열고 uv run server.py 입력 후 run.bat으로 저장
이상이 없으면 설치가 정상적으로 된 것이니 run.bat 실행 후 프로그램을 실행하면 됩니다.
저도 어제 테스트하다가 설치가 안되는 문제가 발생해서 살펴보니 python 라이브러리 하나가 업데이트되는
바람에 설치가 안되는 거였습니다. 홈페이지에 해당 문제를 수정해서 다시 올려 놓았습니다.
설치가 안된 이유가 동일한 원인이라면 해결될 겁니다.
불편을 겪게 드려서 죄송합니다.
Library installation has been completed.
Download model...
모델 'Darong/BluePaper' 다운로드 중...
모델 설정 다운로드 중...
오류 발생: There was a specific connection error when trying to load Darong/BluePaper:
401 Client Error: Unauthorized for url: https://huggingface.co/Darong/BluePaper/resolve/main/config.json (Request ID: Root=1-68c96a00-34b685c20e21fd2055dee39b;36cc354b-c386-4fa4-b867-3fdedcbd34b8)
Invalid credentials in Authorization header
모델 다운로드에 실패했습니다.
====================================
Create a program executable...
Double-click the run.bat file that was created to run the program.
====================================
계속하려면 아무 키나 누르십시오 . . .
모델은 직접 다운로드 받아도 되니 아래의 url에서 config.json, generation_config.json, model.safetensors
세 개의 파일을 다운로드 받아 models 디렉토리 밑에 BluePaper 디렉토리에 저장하시면 됩니다.
https://huggingface.co/Darong/BluePaper/tree/main
그 다음에 run.bat를 실행해서 정상적으로 동작하는지 확인해 보세요.
다음 버전에는 서버를 설치하지 않고 사용할 수 있는 선택 사항을 추가할 예정입니다.
기존 1.3 설치 사용시 새로 1.4 Server 인스톨 하고 사용해야 할까요?
(필요한 경우, 기존 설치 화일 삭제 등)
새로 설치할 필요없이 1.4버전을 덮어쓰시면 됩니다
V1.4 사용해 보니 기존에 오류 났던 pdf도 잘 번역이 되네[요. ^^
배치파일 돌리니 나머진 설치 절차는 잘 되네요.
잘 사용했습니다! 감사합니당 ㅎ
사용자의 환경에 따라 설치가 안되는 문제가 있어 향후에는 배치 파일 대신에 별도의 설치 프로그램으로 변경할 계획입니다.
사용해보고 피드백드리겠습니다.
온라인, 구독, GPT류보다 장점이있는면도 크기에
공수에 무한 감사드립니다.
중간에, 배포설치 프로세스가 멈춰도 F5로 새로고침하면 계속진행되니 참고하시면좋겠습니다.
자체 번역 엔진은 로컬에서 돌아가기 때문에 외부로 유출되는 경우는 없습니다.
외부 번역 엔진을 사용하는 경우는 번역 요청을 위해 데이터를 전송합니다. 다만 파일 단위가 아니라
문단 단위로 번역을 요청합니다.
보안이 걱정되시다면 ollama와 같은 프로그램을 설치해서 로컬로 사용하시는 걸 추천합니다.