EMO: 사진1장으로 비디오를 만드는 기술 : 클리앙

알리바바 그룹에서 공개한 기술입니다.

사람이 노래를 부르거나 얘기하는 원본동영상을 바탕으로 단 1장의 레퍼런스 이미지를 합성해 동영상을 만들어준다고 합니다.

지금도 딥페이크를 비롯해서 AI가 동영상을 합성해주는 기술은 많이 있습니다만

이 모델은 1장의 레퍼런스 이미지만 이용해서 저런 정신나간 수준의 동영상을 만든다는게 놀랍고 두렵네요.

게다가 알리바바에서 만들었다는 것도 좀 걸리는 부분입니다.

레딧의 코멘트를 보니 알리바바에서 만든 AI 관련 기술은 거의 오픈소스로 공개가 안 된다고 합니다.

향후 이 기술이 중국에서 어떻게 활용될지가 두려워집니다.

아무튼 따라가기 힘든 수준으로 가는 AI 기술입니다.

AI그림당