Home » Разговаривать с японцем и слушать его по-испански: машины уже набирают популярность в области языкового перевода | Технологии

Разговаривать с японцем и слушать его по-испански: машины уже набирают популярность в области языкового перевода | Технологии

До недавнего времени это звучало бы как научная фантастика: соединение по видеозвонку, где на экране человек, живущий на другом конце света. Этот человек говорит по-японски, но вы через его наушники слышите его слова на испанском. Это ситуация аналогичная тому, что делают переводчики, которые переводят на разные языки лично или онлайн. Однако большая разница в том, что здесь участвует не человек, а искусственный интеллект (ИИ), который одновременно переводит и передает речь на другой язык.

Kudo, компания, которая выросла на рынке за счет подключения переводчиков языков с корпоративными клиентами, сделал шаг вперед, включив технологию синхронного перевода на онлайн-конференциях. И речь идет не о переводе письменных предложений, а о голосовом переводе, позволяющем участникам видеоконференции прослушивать перевод так, как если бы у них присутствовал переводчик.

На демонстрации, организованной для EL PAÍS, Цачи Леви, менеджер по продукту Kudo, говорит на английском языке, а его речь практически в реальном времени слышна на испанском языке. Хотя голос звучит немного роботизированно и есть небольшая задержка по сравнению с человеческим переводом, результат все равно потрясающий. В то время как человеческие действия обычно запаздывают на 5–7 секунд, искусственный опыт — примерно на 10.

У компании уже 20 корпоративных клиентов используют этот функционал, который продолжает постоянно совершенствовать. Этот инструмент работает на собственной платформе видеоконференций Kudo, но он также интегрирован с Microsoft Teams, очень популярной в корпоративном мире.

В Kudo подчеркивают, что в ситуациях, когда требуется 100% точность перевода, лучшим вариантом всегда будет переводчик-человек. Менеджер приводит в качестве примера сессии Европейского Парламента: «Вероятно, искусственные системы не будут использоваться, но на небольших собраниях, где в данный момент нет переводчиков, такое решение может быть эффективным».

Read more:  4-летняя кампания взломала iPhone с помощью, возможно, самого продвинутого эксплойта за всю историю

Леви отмечает, что развитие искусственного интеллекта неизбежно и что прогресс, который, как первоначально предполагалось, займет от 5 до 10 лет, был достигнут за считанные месяцы. Эта область развивается настолько быстро, что, по его оценкам, в течение следующего года ИИ сможет точно обеспечить синхронный перевод в 90% распространенных ситуаций.

Искусственный и человеческий интеллект

В июне этого года Проводной провел сравнение технологии Кудо и интерпретация экспертами. Люди получили гораздо лучшие результаты по сравнению с инструментом ИИ, в основном в отношении контекста выступлений. Клаудио Фантинуоли, руководитель отдела технологий Kudo и создатель инструмента автоматического перевода, уверяет EL PAÍS, что модель, оцененная американскими СМИ три месяца назад, уже улучшена на 25%. Следующим шагом в разработке является интеграция генеративного искусственного интеллекта, чтобы сделать взаимодействие с пользователем более приятным: голос звучит более плавно, человечно и улавливает интонацию.

По мнению Фантинуоли, одна из главных задач — заставить ИИ интерпретировать контекст повествования, то, что человек понимает под строками. Эта задача все еще серьезна, но ее можно улучшить «с помощью больших языковых моделей», как та, что стоит за диалоговых чат-ботов.

Фантинуоли, который также является профессором университета и обучает молодых студентов, которые стремятся стать профессиональными исполнителями в будущем, говорит, что «не видит конфликта» между искусственным интеллектом и обучением людей. Кроме того, он гарантирует, что работа специалиста всегда будет более качественной. «Я пытаюсь объяснить им, что роботы — это реальность на рынке и что они должны быть лидерами. ИИ заставляет их быть очень хорошими переводчиками», – уточняет он.

Один голос, много языков

Одной из возможностей, которая видится в ближайшем будущем, является добавление собственного голоса говорящего в перевод. Фантинуоли утверждает, что технически это уже осуществимо, и расширение инструмента его компании — вопрос нескольких месяцев. Другие компании уже протестировали возможность использования одного голоса для воспроизведения контента на разных языках, но не одновременно. Это случай платформы ОдиннадцатьЛабскоторый оживляет контент на 30 разных языках одним голосом.

Read more:  Гастон Глок, изобретатель пистолета, носящего его имя, умер в возрасте 94 лет

Процесс прост: все, что вам нужно сделать, это загрузить аудиофайл продолжительностью более минуты с речью, которую вы хотите воспроизвести. Из этого файла инструмент читает вслух нужный вам текст либо на том же исходном языке, либо на других доступных. Платформа предоставляет возможность вносить индивидуальные настройки, точно настраивать четкость чтения или даже усиливать стиль голоса в зависимости от предпочтений. Обратная связь не только имитирует голос, но и улавливает и отражает такие отличительные нюансы, как высота звука, ритм, ударение и интонация.

Недавно, Meta запустила мультимодальную модель перевода, который может выполнять переводы «речь в текст», «речь в речь», «текст в речь» и «текст в текст» для более чем 100 языков, в зависимости от задачи. Одно из обещаний — для носителей-полиглотов, тех, кто смешивает два или три языка в одном предложении. Компания Марка Цукерберга утверждает, что эта модель способна распознавать разные языки и осуществлять соответствующие переводы. Хотя это правда, что эта функция все еще показывает некоторые небольшие ошибки, она работает довольно хорошо, когда фраза выражена на одном языке. Инструмент находится в свободном доступе в бета-версии.

Клаудио Фантинуоли находит новый инструмент Meta удивительным и сравнивает его с «ChatGPT устного дискурса». «Они собирают вместе все модели, которые могут выполнять множество задач одновременно. Это будущее», — заключает он.

Вы можете следить СТРАНА Технологии в Фейсбук й Твиттер или зарегистрируйтесь здесь, чтобы получать наши Семанал информационного бюллетеня.


2023-09-02 03:20:00


1693770494
#Разговаривать #японцем #слушать #его #поиспански #машины #уже #набирают #популярность #области #языкового #перевода #Технологии

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.