위스퍼ai로 영상 자막 추출할때 결과값 문제가 있네요.
같은 단어만 계속 영상 끝날때까지의 반복이 됩니다..
ex) 원본
1. 나는 홍길동 입니다.오늘 날씨가 어때? 너는 누구니
2. 나는 누구누구야 너는 누구니
3. 만나서 반가워
ex) 추출 (오류)
1. 나는 홍길동 입니다.오늘 날씨가 어때? 너는 누구니
2. 나는 홍길동 입니다.오늘 날씨가 어때? 너는 누구니
3. 나는 홍길동 입니다.오늘 날씨가 어때? 너는 누구니
이런 식입니다.
혹시 이거 이유가 있나요..?
medeum, large 모델로 돌려봤는데요 문제는 동일합니다.
제 cpu 문제인가요..?
아니면 영상 문제일까요..
저런 오류 발생 안되게 해결하는 방법이 있을까요?
위 문제가 발생이 되는 이유는
음성 파일의 시간을 100%로 본다면 그중에 차지하는 음성이 20~30%일경우에
나머지 70%는 음성이 비워져있어서 특정 문구가 반복이 되는 현상이 발생이된다.
라는 말씀 맞으실까요?
제가 맥위스퍼 라는 프로그램을 쓰는데 http://gisadan.github.io/%EC%95%A0%ED%94%8C/2023/08/27/macwhisper.html
말씀하신 워드타임스템프?, 플래그 true? 이건 해당 프로그램이 지원 안해주는거겠죠..?