CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·방탄소년당 ·아이포니앙 ·주식한당 ·MaClien ·일본산당 ·자전거당 ·개발한당 ·이륜차당 ·바다건너당 ·클다방 ·안드로메당 ·노젓는당 ·AI당 ·가상화폐당 ·소시당 ·물고기당 ·찰칵찍당 ·여행을떠난당 ·소셜게임한당 ·걸그룹당 ·콘솔한당 ·갖고다닌당 ·VR당 ·골프당 ·캠핑간당 ·개판이당 ·전기자전거당 ·e북본당 ·나스당 ·키보드당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·사과시계당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·디아블로당 ·동숲한당 ·날아올랑 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·IoT당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·리눅서당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·PC튜닝한당 ·그림그린당 ·소풍간당 ·심는당 ·패스오브엑자일당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·창업한당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

시각 장애인을 위한 서비스를 개발 중이데요. 9

1
2025-10-31 10:00:52 124.♡.13.203
rwsrwxrwx

안녕하세요.


저를 포함한 시각장애인들은 드라마나 영화를 볼 때 같이 송출 되는 화면 해설 방송을 즐겨 보는데요.

유튜브는 아쉽게도 이런 화면 해설이 없어요.

화면 해설을 만들려면 돈이 많이 들어가거든요.

작가가 영상에 맞는 대본을 만들어야지, 성우가 녹음 해야지...

유튜브 영상은 이렇게 못 만들죠.


그래서 요새 제가 gemini를 이용 해서 화면 해설을 자동으로 만들어서 영상과 같이 볼 수 있는 서비스를 개발 중이에요.

지금 주변 시각 장애인들을 상대로 베타 테스트 중인데요.

다른 시각 장애인들도 사용 할 수 있게 공개 하려는 계획인데 문제는 비용이네요.

gcp에 서버를 올렸는데 그 vm 비용 + gemini api 사용 비용

vm 비용이야 월 정액으로 들어간다 치고 큰 문제는 api사용 비용 입니다.

테스트로 생성된 영상들의 평균 api사용요금이 영상당 600원 정도인데

사용자가 늘어나면 최소 한달에 몇 십만원은 들거 같아요.

개발 비용이야 제가 그냥 무료로 유지보수 한다 치지만

저 금액들은 제가 감당하지는 못하는 돈이네요.

어디선가 후원이라도 받지 않는 이상 공개 서비스는 어렵지 않나 싶네요.


rwsrwxrwx 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [9]
니파
IP 211.♡.143.246
10-31 2025-10-31 10:05:28
·
유튜브를 비롯한 업체들이 못하는것도 그 이유지 않을까 생각해봅니다... 다만 컴퓨팅 파워가 더 발전하면 나중에는 기기 자체적으로 가능해지지 않을까 생각해봅니다.
When2Fly
IP 115.♡.136.26
10-31 2025-10-31 10:06:52 / 수정일: 2025-10-31 10:08:54
·
유료 구독 모델로 하시는게 가장 빠른 방법이지 않을까 싶어요. 아니면 서버가 필요없는 설치형 프로그램으로 하고 gemini api key 는 프로그램에 개별적으로 설정해서 하도록 하던가 말이죠. 언제까지인지는 모르겠으나 gemini api 가 무료로 하루단위 쿼터가 있으니까요.
삭제 되었습니다.
Luzi
IP 106.♡.29.163
10-31 2025-10-31 10:18:54
·
저는 해당 유투버에게 협찬(?) 을 구할 거 같습니다.
rwsrwxrwx
IP 124.♡.13.203
10-31 2025-10-31 10:42:11
·
이 서비스는 사용자가 유튜브 영상을 검색 하거나 영상의 url을 입력 하여 본인이 보고 싶은 영상을 실시간으로 화면 해설을 볼 수 있는 서비스 입니다.
@Luzi님
Luzi
IP 106.♡.29.163
10-31 2025-10-31 11:43:35
·
@rwsrwxrwx님 아, 물론 그 부분은 이해 했습니다. 제 의견은 AI 비용이 가장 걸림돌이라고 생각했고, 그 비용을 유투버에게 협찬받아서, 하시는 서비스가 잘된다면, 핸디켑이 있으신 분들이 그 유튜버의 영상을 더 찾게 되고, 그게 선순환이 되어, 더 많은 비용과 지원을 여러 유투버들에게 받을 수 있고, 결과적으로 AI 에 들어가는 비용을 낮출 수 있지 않을까? 해서 말씀 드려본것입니다.
님님
IP 210.♡.60.19
10-31 2025-10-31 10:46:44
·
사용자 별로 매번 다른 영상이라면 답이 없지만..
같은 영상이라면 화면 해설에 대한 정보를 저장하고 캐시해서 사용하면 api 비용을 상당히 줄일 수 있을것 같습니다.
rwsrwxrwx
IP 124.♡.13.203
10-31 2025-10-31 10:49:03
·
맞아요. 이미 그렇게 구현 해 놨습니다.@님님님
aiko
IP 211.♡.204.77
10-31 2025-10-31 10:59:26 / 수정일: 2025-10-31 11:02:42
·
로컬 gpu로 설치형 구현이 어려운가요? 성능제한이나 시간이 걸려도 가능하면 좀 낫거든요(빠르게나. 더 좋은걸 원하면 돈내라 등등)
음성은 whisper는 로컬로 돌리는게가능하니 이런식으로 전처리한번하면 될것같긴하거든요
rwsrwxrwx
IP 124.♡.13.203
10-31 2025-10-31 11:23:09
·
tts 비용은 전체 비용 중 아주 미미 합니다. 문제는 키프레임 추출 후 그걸 gemini에게 전달 하여 화면 해설 대본을 만들 때 비용이에요. 720p 영상 기준으로 프레임 하나당 6원 정도 들고 보통 20분 짜리 영상 하나에 평균 키프레임이 90개 정도 나와요. @aiko님
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.