구글이 음성-텍스트 및 HD 텍스트-음성 모델인 'Chirp 3'를 다음 주부터 Vertex AI 개발 플랫폼에 추가한다고 발표했습니다.
Chirp 3는 31개 언어로 8개의 새로운 음성을 제공하며, 음성 비서 구축, 오디오북 제작, 지원 에이전트 및 비디오 음성 내레이션 개발 등 다양한 용도로 활용될 수 있습니다.
Thomas Kurian 구글 클라우드 CEO는 오용 방지를 위한 사용 제한이 있을 것이라고 언급했습니다.
이번 발표는 Sesame과 ElevenLabs 등 여러 스타트업들이 AI 음성 서비스 분야에서 급속히 성장하는 가운데 이루어졌습니다.
특히 Sesame은 현실적인 음성을 제공하는 "Maya"와 "Miles" AI 앱으로 주목받고 있으며, 최근 개발자들을 위한 모델을 출시했습니다.
구글은 2021년부터 개발자들이 클라우드에서 머신 러닝 서비스를 구축할 수 있는 Vertex AI를 운영해왔으며, Microsoft와 Amazon과 같은 다른 회사들을 따라잡기 위해 부분적으로 Vertex AI에 집중해왔습니다
개발자들은 Gemini 위에 생성형 AI를 구축하는 것 외에도 Vertex AI를 사용하여 데이터를 분류하고, 모델을 훈련시키고, 생산을 위한 모델을 설정할 수 있습니다.
https://cloud.google.com/text-to-speech/docs/chirp3-hd?hl=ko