vrew 예전에 한번 슥보고 가입만 해뒀었는데 오늘 써보니까 성능이 괜찮은 것 같습니다.
유튜브 편집에 최적화 된건지 무음인 부분은 자동으로 제거해주는 부분도 있구요.
다만 큰 비용은 아니지만 유료인데다가 음성 분석이 사용 패턴에 따라서는 부족할 수도 있겠다는 생각이 들었어요.
그래서 무료로 쓸수 있는 도구가 있는지 한번 찾아봤습니다.
5 Lines of Python Code to Create Video Subtitles (youtube.com)
참고한 영상입니다.
제가 6시간 짜리 게임유튜브 영상을 돌려봤는데 꽤 괜찮네요.
이걸로 팟캐스트를 돌려서 빠르게 내용을 훑어볼때 유용하게 쓸수도 있을것 같습니다.
import assemblyai as aai
# Set your AssemblyAI API key
aai.settings.api_key = "apikey"
config = aai.TranscriptionConfig(language_code="ko")
# Create a transcriber object
transcriber = aai.Transcriber(config=config)
# Path to your audio file
audio_file_path = "/Users/사용자 이름/Downloads/오디오 파일 이름.m4a"
# Transcribe the audio file
transcript = transcriber.transcribe(audio_file_path)
if transcript.error:
print(transcript.error)
# Export subtitles in SRT format
subtitles = transcript.export_subtitles_srt()
# Save subtitles to a file
with open("/Users/사용자 이름/Downloads/자막 파일 이름.srt", "w", encoding="utf-8") as f:
f.write(subtitles)
정적인 환경에서 여러 음성이 겹치지 않는 내레이션 음성은 정확도가 더 좋을것 같네요.
유튜브에 코드도 짧아서 복잡한것도 없네요. 몇가지 파라메터 설정이 있는 모양이지만 그런건 스킵하구요.
추가한 코드라고는 config에 디폴트 설정을 한국어로 변경한것과 srt 자막 파일 생성할때 utf-8 설정 밖에 없습니다.
srt 파일로 만들어서 맞춤법 검사기를 돌리고 어느정도 편집한 후 이 파일을 기반으로
프리미어나 파컷에 적용하거나
자막을 이미지로 만드로는 코드로 한방에 뽑아내면 영상 만드는데 시간을 많이 줄일수 있을 것 같기도 합니다.