Introducing Gemini's speech-to-speech translation capabilities - YouTube
tts로 하던 기존방식이 딜레이가 있으니
그냥 멀티모달로 tts를 안하고 바로 음성 to 음성 동시번역
이어폰만 꽂으면 동시통역이 되는 세상의 시작인데..
지금은 어설프겠지만, chatgpt가 나온지 3년이라고 생각하면 5년뒤 세상은 어떻게 되려나요..
그냥 이어폰 꽂고 동시통역사 수준으로 해준다면 그래도 외국어를 배우려는 수요가 있을까요?
위고비가 나왔는데 다이어트를 위한 pt시장이 살아남을까 같은 느낌인데요....
기술의 완성도나 그런 것이 아니라 5년 뒤 완벽한 기술이 나왔을 때도 지금처럼 외국어에 대해서 어마어마한 투자를 사람들이 할지
그리고 외국어를 잘하는 것이 여전히 하입이 될지가 궁금합니다.
본문에 대한 생각은 해당 외국어 능력이 과거처럼 엄청 크리티컬하거나 특정 점수 이상 필수인 시대는 사라질거 같기도 하네요. 가르치는 직업도 분야나 수준에 따라 생존이 좀 애매해질 수 있구요. 대신에 통시통역이 언어의 모든게 아니기도 하고. 실제 해당 언어를 어느정도 알고 모르고에 따라 앱 사용의 질이 달라지는건 사실이라 앱이 대중화 되어도 따로 공부하는 사람들은 여전하지 않을까요.
외국어도 비슷하지 않을까 싶은데요.
예를 들어 저걸로 가볍게 의사소통 문제를 해결할 수 있는 여행이나 사교 목적의 AI 통역은 상당히 활성화 되겠지만, 비즈니스 하다가 잘못된 번역으로 손해가 생기면 누가 책임질건가 하는 문제는 여전히 있을거에요. 손해가 큰 분야일수록 여전히 사람이 온전한 외국어 능력에 의존할 수 밖에 없고요. 어찌보면 진입장벽으로서 중요성이 강화될수도요.
AI로 배우는 와국어 같은 강의나 책도 나올거고요.
PT 시장도 나름 시대 흐름과 유행을 타고 살아 남더군요. 약이나 주사로 체형을 가꾸는 시대가 오지 않는 한 어떻게든 살아 남응거예요.
대한민국도 지원합니다
google translate 어플로 할 수 있는 건데
아직 한국은 지원되지 않는 게 맞습니다
저는 동일한 보이스 모델로 해봤는데 잘 되더라고요
모델이름이
Gemini 2.5 Flash Native Audio Preview 12-2025
입니다
이걸 사용해봤다는 뜻입니다
저게 이번에 업데이트 된거고요
ais에서 저 모델을 번역처럼 쓸 순 없고요
저 모델을 번역처럼 돌리는 게 있습니다
그걸로 해봤습니다
외국어도 마찬가지 아닐까요? 다른 사람과 만나서 이야기 하는 즐거움을 기계가 대신 내가 직접 하는데서 오는 만족감이 있지 않을까요?
원어민은 원어만으로 가르치고 서로 통역 켜서 피드백 받고
좋네요
아직 좀 어색하긴 한데 사용해도 될 정도인거 같습니다
1년에 한두번 단순히 여행다니려고 외국어 공부를 해야할꺼 같지는 않네요~
정말 자비스가 현실화되고 있네요~
보급시장에서는 이게 다 할것같습니다
카메라도 DSLR 하고 폰카로 나뉘듯ㅇㄱ
놀랍네요... 이젠 뭐 통역기 귀에 끼고 여행다니겠어요...