구글, Imagen, Veo 등 미디어 생성 ai 모델 주요 업데이트 발표 : 클리앙

구글이 Vertex AI 클라우드 플랫폼을 통해 제공하는 미디어 생성 AI 모델들의 주요 업데이트가 발표되었습니다.

텍스트로 음악을 만드는 'Lyria' 모델이 선별된 고객들에게 프리뷰로 제공됩니다.
이 모델은 재즈 피아노 솔로부터 로파이 트랙까지 다양한 스타일과 장르의 음악을 만들 수 있습니다.

비디오 제작 모델인 'Veo 2'는 새로운 편집 기능과 시각 효과 옵션으로 강화되었습니다.

이제 기존 비디오에서 배경 이미지나 로고, 객체를 제거하고 비디오 프레임을 확장할 수 있습니다.

또한 AI 생성 장면의 카메라 각도와 속도를 조정해 타임랩스나 드론 스타일 클립 제작도 가능해졌습니다.

이러한 Veo 기능들은 현재 프리뷰로 제공됩니다.

오디오 이해 모델인 'Chirp 3'는 약 35개 언어로 음성을 합성할 수 있으며, 이를 기반으로 한 'Instant Custom Voice' 기능이 정식 출시되었습니다.

단 10초 분량의 오디오만으로 음성을 복제할 수 있는 이 기능은 악용 방지를 위해 적절한 음성 사용 권한을 확인하는 실사 과정을 거칩니다.

이미지 생성기 'Imagen 3'도 성능이 향상되어 객체 제거와 이미지의 손상된 부분 복원 능력이 개선되었습니다.

구글은 Chirp를 제외한 Imagen, Veo, Lyria로 생성된 모든 미디어에 SynthID 기술로 워터마크를 적용하고, 모든 생성형 AI 모델에 유해 콘텐츠 생성을 방지하는 안전장치를 내장했다고 밝혔습니다.

한편 구글은 모델 훈련에 사용하는 구체적인 데이터에 대해서는 여전히 명시하지 않고 있습니다.

새로운소식