컴터 1: 맥미니 M1 / 8GB / 512GB
컴터 2: 라이젠 7530U / 32GB / 1TB
이고 둘다 8분짜리 동일영상 SRT 자막 추출 작업을 시켰는데 맥은 2분도 안 되서 뽑아준 반면 라이젠은 30분째 진행중이네요;;;
아래는 맥쪽 오픈클로에게 물어본 답변:
------------------------
그럼 거의 답 나왔습니다, 보스. Ryzen 7 7530U는 “U(저전력) CPU”라서, 만약 알타 쪽이
• GPU 가속 없이 CPU만으로 Whisper를 돌리고,
• 모델이 medium/large거나,
• 오디오를 고해상도로 그대로 먹이고 있으면,
8분짜리 영상도 20~40분 충분히 나올 수 있어요. (특히 large면 더 늘어납니다)
반대로 저는:
• Apple Silicon에서 Metal(GPU) 가속이 자동으로 잘 붙고
• small 모델로 돌렸기 때문에 1~2분대가 가능한 거고요.
알타 쪽 속도 올리는 “현실적인 처방”은 이 순서가 제일 효과 큽니다.
1. 모델을 small/base로 낮추기 (체감 가장 큼)
2. 입력을 16kHz mono wav로 변환해서 넣기
3. 가능하면 **GPU 지원되는 STT(예: NVIDIA GPU가 있는 PC)**에서 돌리기
• 7530U 내장그래픽으론 보통 큰 가속 기대가 어렵습니다.
알타가 어떤 모델(large/medium/small)로 돌리고 있는지와, GPU 사용 여부만 알려주면 “예상 시간”도 더 정확히 찍어드릴게요.
------------------------
그리고 GPU를 쓰느냐는 x64쪽 질문에 대한 답변:
------------------------
보스, SRT 자막 추출(음성 인식, Whisper API)은 기본적으로 GPU 활용 가능하지만
제가 지금 쓰는 OpenAI Whisper API는 서버 측에서 자동으로 GPU 활용(로컬 PC는 CPU만 씀)입니다.
즉, 보스 컴퓨터에선 GPU 영향은 없고
OpenAI 서버에서 GPU로 돌기 때문에, 일반적으로 처리 속도가 빠른 편입니다!
------------------------
그리고 위스퍼는 AMD쪽은 못 돌리고 CPU 깡성능으로만 돌료야하는데 이것도 수십분 예상이라 말하네요;;;;
로컬에서 코딩보조 고속으로 받는게 목표는 gpu 2개라도 깨지는데 저렴할려는지..
로컬 llm 백에 올리는데 좋지만 대역폭 땜에 답변속도능 글카2개단 윈도우보다 못하다고도 하더군요
오픈클로등은 좀 느려도되니 구독해도 상관없들 듯한데 말이죠