Google почти убрала паузу между языками
Новая модель Gemini 3.5 Live Translate переводит речь почти в реальном времени более чем на 70 языках. Она старается сохранять не только смысл, но и темп, интонацию и особенности голоса говорящего. То есть переводчик теперь не просто переводит. Он пытается звучать как человек.
Google сделала ещё один шаг к миру, где фраза «простите, я не говорю на вашем языке» постепенно теряет силу.
Компания представила Gemini 3.5 Live Translate — новую аудиомодель для почти синхронного перевода речи. Она поддерживает более 70 языков, включая русский, и работает не как старый переводчик с паузой после каждой фразы, а ближе к живому разговору: человек говорит, система почти сразу переводит.
Главное здесь не только скорость.
Google утверждает, что модель сохраняет интонацию, темп, высоту голоса и манеру речи говорящего. Это важная деталь. Потому что плохой перевод часто убивает не смысл, а человека за смыслом. Фраза может быть переведена правильно, но звучать как объявление в аэропорту. А живой разговор держится на паузах, раздражении, улыбке в голосе, усталости, акценте, скорости.
Gemini 3.5 Live Translate как раз пытается сохранить эту человеческую часть речи.
В Google говорят, что модель будет использоваться в Google Meet. Там она расширит перевод с прежних пяти языков до 70+ и позволит вести разговоры более чем в 2000 языковых комбинациях — не только через английский. Компания также пишет, что доступ к речевому переводу появится в Google Translate и инструментах для разработчиков.
Есть и вопрос безопасности. Все аудиофрагменты, созданные моделью, Google обещает маркировать с помощью SynthID — невидимого водяного знака для AI-аудио. Это нужно, чтобы снижать риск подделок и манипуляций, потому что технология, которая умеет говорить чужим голосом на другом языке, полезна ровно настолько, насколько опасна.
Для обычных людей это может быть огромным сдвигом. Видеовстречи, путешествия, интервью, медицина, образование, международные команды, семьи, живущие между странами, — всё это становится проще, если язык перестаёт быть стеной.
Но есть важная оговорка.
Даже лучший машинный перевод не отменяет нюансов. Юмор, культурные отсылки, эмоции, юридические формулировки, медицинские детали, конфликтные переговоры — всё это по-прежнему требует осторожности. Модель может звучать естественно, но естественный голос ещё не означает идеальное понимание.
И всё же направление понятно.
Перевод больше не выглядит как отдельная операция: сказал, подождал, получил чужую фразу. Он постепенно становится фоном общения. Почти как субтитры, только голосом.
Вавилонскую башню, конечно, пока никто не отменил.
Но Google уже поднесла к ней наушники.