구글이 속도가 느린 인터넷 환경에서도 음성을 끊김없이 전송할 수 있도록 설계된 Lyra 음성 코덱을 오픈소스로 공개했습니다.
GitHub - google/lyra: A Very Low-Bitrate Codec for Speech Compression
구글 설명에 따르면 70개가 넘는 언어의 상당한 데이터셋을 얻어 머신러닝 학습 과정을 거쳐 3kbps 속도에서도 잘 작동하도록 설계되었다고 하며, 이론적으로 AV1 비디오 코덱과 함께 쓰면 56kbps 모뎀 인터넷 환경에서도 영상 통화가 가능하다고 합니다.
□ 소개 영상 (영어, 2분 25초)
□ 출처 아래 해외 기사 요약
- Google Posts Initial Code For Lyra Speech Codec | Phoronix
- Google's New Lyra Voice Codec + AV1 Aim For Video Chats Over 56kbps Modems In 2021 | Phoronix (2월 발표 기사)
여기서 예제를 들어볼수 있네요
https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html?m=1
아이폰은 이쪽으로...
미쳤네요 와...
코덱에 자동으로 노이즈캔슬링이 들어가 있..ㅎㄷㄷㄷㄷ
원본과 큰차이도 안나는것 같은데 3kbps라니요.
파형이 아니라 메타데이터(?) 비스므리한걸 보내서 학습한 쪼가리로 조립하는 형태겠네요.
와 진짜 미친 기술이네요 ㄷㄷ
1.6kbps짜리 음성 오디오 코덱도 있습니다 ㅎㅎ 품질은 Lyra에 비해 떨어지지만 대화할 수준은 되더군요
3kbps 라니
어마무시하군요.