요즘 AI 발전 속도가 정말 무섭습니다.
그렇다면 실제 광고주를 상대로 AI 영상 퀄리티는 어디까지 가능할까요?
저는 현업에서 기업 영상을 제작하는 일을 하고 있습니다.
마침 2주 전, 제 개인 프로젝트 홍보영상을 AI를 활용해 직접 만들어보았습니다.
이 작업 과정을 통해 사용기를 공유해 볼까 합니다.
(아래 링크는 홍보 문구와 실제 연결 링크를 제거한 시안 확인용 계정입니다)
기획은 일하면서 틈틈이 구상했고, 본격적인 제작은
2주전 일요일에 약 3시간 정도 집중해서 완성했습니다.
1. 컨셉 기획 (gemini)
요즘 일반인들을 대상으로 하는 '바이브코딩 워크샵'을 진행하고 있습니다.
문득 제 본업이 영상 제작이니, 이 워크샵 홍보영상을 AI로 만들면 재밌겠다는 생각이 들었습니다.
바이브코딩의 컨셉안을 Gemini로 돌려보니 여러 키워드 중
'지휘자', '오케스트레이션' 같은 단어들이 마음에 들었습니다.
그래서 일반적으로 워크샵 내용을 나열하는 식상한 느낌 대신,
전체를 조율하고 지휘하는 색다른 느낌으로 방향을 잡았습니다.

폰트로 악기를 표현하는 아이디어와 지휘하는 실루엣 등을 뽑아봤는데,
'Vibecoding' 단어에 악기 질감을 입힌 표현이 괜찮더군요. 이걸 디벨롭했습니다.

이런 식으로 Gemini를 열심히 굴려서

최종 형태를 완성했습니다.
2. 영상 디자인 및 소스 생성 (Gemini & Midjourney)
처음에 생각했던 영상 디자인은 사람은 등장하지 않고,
지휘자의 지휘에 맞춰 악기들만 연주되는 컨셉이었습니다.
먼저 바이올린 솔로 연주 장면을 뽑아봤습니다.

그런데 막상 뽑아보니 생각보다 임팩트가 약해서(구려서...),
결국 사람이 연주하는 방향으로 선회했습니다.

음... 마음에 안 드네요.
이렇게 만들어서는 영상미를 살리기 힘들 것 같았습니다.
Gemini 자체로는 매력적인 인물 이미지를 뽑아내기가 어려워 Midjourney를 활용했습니다.
오케스트라 연주하는 사람 위주로 여러 장을 생성하다가,


마음에 드는 인물을 발견했습니다. (지금 자세히 보니 손가락 디테일은 좀 엉망이네요;;)
이분을 주인공으로 구성을 시작합니다.
그리고 다시 오케스트라 연주 장면 프롬프트를 돌리던 중, 우연히 이 그림을 얻게 됩니다.

유화 느낌이 마음에 들었습니다.
3. 시나리오 수정
사실.. 별 시나리오는 없었습니다.
그냥 지휘자가 있고, 바이올린 솔로가 나오는 오케스트라 장면 정도만 생각했었죠.
그런데 우연히 얻어걸린 저 유화 느낌의 그림을 보고 생각이 바뀌었습니다.
그리고, 나름의 시나리오 플롯이 머릿속에 정리되었습니다.
"유화 질감의 '가상 공간'에서 연주하던 두 사람이, '바이브코딩(오케스트레이션)'을 통해
'현실 세계'의 웅장한 오케스트라 합주로 확장된다."
단순한 장면 전환이 아니라, 가상에서 현실로 구체화된다는 서사를 담기로 한 것이죠.
"바이브코딩 - AI가 당신의 의도로 코딩합니다" 같은 삽입 문구들은
Gemini를 통해 생성했습니다.
Midjourney에서 얻은 레퍼런스를 바탕으로,
Gemini(나노바나나)를 활용해 필요한 이미지 소스들을 추가로 만들고
텍스트를 얹어 스토리보드를 완성했습니다.

4. BGM (suno)
AI 영상이기에 음악도 suno로 만들었습니다.
bright, hopeful crescendo, cinematic, theme, uplifting, modern classical, violin
이런 프롬프트 조합으로 50개쯤 생성해 본 것 같습니다.
듣자마자 느낌이 아닌 것은 바로 지우고, 괜찮은 것만 남기는 식으로 작업을 반복하다가 하나가 귀에 들어왔습니다.

https://suno.com/s/j53Fgvy76q1xq2Og
처음 도입부는 애매했는데,
1분 20초 부근 중간 브릿지에서 피아노 솔로 건반이 나오며 다시 시작되는 부분이 있더군요.
"이거다" 싶어서 이 부분을 활용하기로 했습니다.
5. 비디오 생성 (VEO3 & Kling AI)
이제 대망의 하이라이트, 영상 만들기입니다.
사실 앞단의 밑작업(이미지 소스 생성)이 훨씬 오래 걸렸습니다. ㅎㅎ
영상 생성은 구글의 최신 모델인 Gemini VEO3를 사용했습니다.
Gemini 웹브라우저에서도 가능하지만, 아래 Labs 사이트에서 만들면 좀 더 체계적인 관리가 가능합니다.
https://labs.google/flow/about

한글 프롬프팅도 잘 지원합니다.
영상 하나 생성에 20크레딧이 소모되고, 기본 요금제로 2,000 크레딧을 줍니다.
대략 100번 생성이 가능한데, 한 번에 4개씩(x4) 뽑으면 25번 정도 시도할 수 있습니다.
(제대로된 작업을 위해선 크레딧 충전을 하거나 ultra 요금제가 필요할 수 있습니다.)
저는 Ultra 요금제를 사용합니다. 26,000 크레딧을 줍니다.

영상에 쓸 9컷을 위해 112장을 뽑았습니다.
생각보단 덜 뽑았습니다.
이런식으로 원하는 컷이 나올때까지 계속 뽑아봅니다.
가장 하이라이트가 되는 부분이
2D 이미지에서 실사로 전환하는 장면인데요
VEO3는 그냥 디졸브를 해버리더라구요..
12장쯤 뽑다가 포기하고...
그래서 KLingAI를 켰습니다.
중국에서 만든 AI인데, VEO3가 나오기 전까지는 영상 퀄리티 면에서 가장 뛰어난 툴 중 하나였습니다.


다행히 Kling AI에서는 4번의 시도 만에 원하는 '모핑' 느낌의 전환 영상을 뽑아낼 수 있었습니다.
6. 영상 편집 (Adobe Premiere Pro 2025)
이제 만들어둔 영상과 음악 소스들을 하나로 합치는 일만 남았습니다.
AI가 '딸깍'하고 만들어주는 건 재료(소스)까지이고,
결국 이걸 자르고 붙여서 요리하는 건 인간이 해야 합니다.
컷 편집을 하고, 음악 박자에 맞춰 싱크를 조절하고, 자막을 띄웠습니다.
그래도 소스가 다 준비된 30초짜리 영상이라, 최종 편집에는 1시간이 채 걸리지 않았습니다.

그렇게 해서 완성을 했습니다.
결론
이번 작업을 통해 느낀 점을 정리해 봅니다.
-
AI가 '딸깍' 한 번에 최종 30초 영상을 자동으로 완성해주지는 않습니다.
기본적인 편집 지식은 여전히 필요합니다. -
하지만 이미지, 비디오, 음악 등 고퀄리티의 모든 소스를 '딸깍'으로 단시간에 생성해 줍니다.
-
과거에는 며칠, 어쩌면 몇 주가 걸렸을 소스 제작 과정이 단 몇 시간으로 압축되었습니다.
-
이 압도적인 시간 단축 덕분에, 이제는 전문적인 편집 기술만 조금 더해진다면
상업용으로도 충분히 손색없는 퀄리티를 만들어낼 수 있는 시대가 왔습니다.
영상뿐만 아니라 다른 모든 영역도 마찬가지일 것 같습니다.
자신만의 전문적인 지식이나 기술이 있다면,
AI라는 강력한 도구를 만나 엄청난 시너지를 낼 수 있는 세상이 된 것 같습니다.
30초 호흡상 시선이 분산돼서 결국 두 사람에게만 집중했습니다.
확실히 AI 덕분에 그런 아이디어를 부담 없이 바로 시안으로 뽑아보고
테스트할 수 있다는 게 현업에서 느끼는 가장 큰 장점 같습니다.
프리미어 편집처럼 영상 자체 기초적인 편집만 배우시면 됩니다.
악기를 다뤄본 사람이 프롬프트를 세세히 작성해서 수십장 뽑아보면 싱크를 맞출수있지 않을까 싶습니다.
피아노의 경우도 여러장 뽑아서 싱크를 맞춘거거든요
작년 초만해도 상상도 못할 일이 벌어지는데 2-3년 뒤면 진짜 어떻게 될 지 궁금합니다.
지휘하는 장면
연출이 멋지네요.
지휘자의 동작을 극적으로 한다거나. 장면 앵글을 밑에서 잡는다면 효과가 더 극대화 될것 같습니다
노래 자체도 오케스트라급으로 다양한 악기가 쓰였으면 어떘을까 싶습니다
연출은 좋았는데 악기들이 따라와주지 못하는 느낌이 들어서 살짝 아쉽습니다
그래도 이렇게 상세하게 알려주셔서 감사합니다
차차 나아지겠지요
아직은 아쉬운점이 보이지만 빠른 시간안에 개선되리라 예상됩니다.
이정도 광고는 단가가 얼마나 되는지 궁금하네요.
요즘 흥미있는 분야인데, 올려주신 글 덕분에 관심있게 잘 봤습니다. 👍👍
영상, 디자인... 앞으로 더 많이 바뀌게 될 것 같습니다.
제게 너무 유용한 글입니다.
감사합니다.