오전 부터
특정 폴더에 있는 스캔한 문서를 차량번호를 인식해서 자동으로 파일 이름을 차량 번호로 바꿔주는 작업을 하려고 하는데요
일단 오전에 글올린대로 전 언어는 커녕 게임말고는 컴을 써본일이 없는 사람입니다.
일단 파이썬이라는거 뭘 설치하고요.....
프롬프트 작업도 어릴때 도스 사용해본거 이후에 처음이네요. ㅎㅎㅎㅎ
거기에 OCR 프로그램을 Tesseract 라는걸 받아서 깔고
뭐 코드 이래저래 최종최최종 최최최종 찐막 분위기로 계속 인식 범위지정에 번호판에 들어가는 한글 종류 지정에
난리 난리를 쳤는데 결국 OCR이 구린거라 판단하고 추천 받은 qwen vl 로 바꾸려고 했는데요
이건 OCR+언어엔진 결합 같은거라 지금 사무용 컴으로는 불가해서
OCR을 paddleocr(CPU) 라는걸로 바꾸고 거기에 맞게 또 파이썬 코드들 수정하고
또 오류나서 보니까 뭐 paddleocr 특정버전이 파이썬 몇 버전에서 배포가 없어서 안된거고 어쩌구 저쩌구
벌써 수정만 수십번인데
이런게 프로그램 개발 같은건가요?
지루 하지만 처음이라 재미있기는 하네요. ㅎㅎㅎㅎ
이게 뭔 소린가 싶은데 해보니 이해가 가기도 하구요.
만만한 일은 아니네요.
이거 끝나면 또 일하는 거 하나하나 쉽게 할 수 있는 자동화 해봐야겠어요
ㅋㅋㅋㅋ 근데 채찍 피티가 자꾸 삽질해요........
일은 잘 하는데 덤벙대는 찐따 처럼 굴어요 ㅎㅎㅎㅎㅎㅎ
뭐 해상도 어쩌구 크롭해서 어쩌구 비슷해서 헷갈리는 거 어디에 가산점 둬서 읽어내는지 별 짓 다하구 있어요.
사람은 걍 눈으로 보고 따라 치는 걸 컴퓨터는 이렇게 바보같이 일을 하는 거군요.
다음 부터 로딩 길다고 때리지 말아야겠어요
물통에서 컵에 물 따르는 기능을
물통에 물총연결하고 쏴서 컵에 채우도록 구현하는 식으로 구현되어 있어요 ㅋㅋ
그러니까요 언어를 하나도 모르지만 어차피 영어 베이스니 대강 보면 이렇게 까지 해야해? 하는 것도 있고
지금은 자꾸 버전이 뭐가 뭐는 되는데 뭐는 뭐가 안되네 어쩌네 하면서 또 OCR 딴 거로 바꾸는 중이에요.
프로그래머들의 주된 야근 이유는 삽질이었던 거군요!!!!!
잘 사용하시면 거의 코딩 없이도 자동화 될거 같긴 한데요.
이것도 한번 도전해보심이...
저번에 유튭 영상 요약도 그렇고 제미나이가 역시 대기업꺼라 그런지 뭔가가 많군요.
역시 채찍피티 같은 중소기업 꺼는 안써야 하나요?
근데 나름 채찍이랑 정이 들어서요......
아 둘다 써야 하나요? 둘다 쓰려면 우리 강아지 닭가슴살을 하루 두덩이에서 한덩이로 줄여야 하는데요.....
그런게 아니라.. openAi Codex Cli 훌륭한데.. 유료라서...무료인 제미나이를 그냥 말씀드렸어요.
제미나이 구글 아이디로 1년 무료세요... 저는 가난한 직장인이라.. ㅎㅎ
방식 자체가 CLI는
# 폴더안에 이미지들에 보이는 텍스트만 뽑아줘
# 그 뽑은 텍스트를 가지고 블라블라~
# 블라 블라~
잘 아시겠지만, cli가 이런식으로 연속 동작을 미리 작성하고 순차적으로 수행하는 방식이라서요.
그냥 암것도 없이 파일 통채로 모델에 넣기만 하면 됩니다
qwen vl 이건 OCR+언어모델이 합쳐진거라 그래도 준수한 그래픽 카드가 있는 컴퓨터에서나 가능하더라구요
지금 쓰는 사무용 컴은 글카가 760 이라 안된다네요 ㅜㅜ
개발 환경이 뭐에요?
지금 현재 개발 환경은.....10년 넘은 회사 컴퓨터? 가을 날씨? 정도 인가요?
프로그램이라면..... 음.....메모장인가요? 이게 뭐 그런거 같은데요.... IDEL? 이걸로 열어서 편집 하고 있어요