Компания DeepL представила новый сервис голосового перевода в реальном времени, который позволяет переводить разговоры во время встреч, звонков и групповых обсуждений. Также компания открыла API для разработчиков и бизнеса, что позволяет создавать собственные решения на базе её технологий, сообщает TechCrunch.
По словам генерального директора Ярека Кутиловского, развитие голосовых инструментов стало логичным шагом после многолетней работы над текстовыми переводами.
Новые возможности включают интеграции с платформами Zoom и Microsoft Teams. Пользователи могут слушать перевод в реальном времени или следить за переведённым текстом на экране. На данный момент функция доступна в режиме раннего доступа.
Кроме того, DeepL представила решения для мобильных и веб-разговоров, а также инструмент для групповых сессий — например, тренингов или воркшопов.
Система способна адаптироваться к специализированной лексике, включая отраслевые термины, названия компаний и имена.
В компании отмечают, что новая технология поможет бизнесу, в частности в сфере клиентской поддержки, работать с разными языками без необходимости привлекать дорогостоящих специалистов.
В настоящее время система работает по принципу преобразования речи в текст, последующего перевода и обратного озвучивания. В будущем DeepL планирует создать модель, которая позволит переводить речь напрямую, без текстового этапа.
На рынке DeepL конкурирует с другими компаниями, работающими в сфере голосовых технологий. В частности, стартап Sanas разрабатывает инструменты для изменения акцента в реальном времени, Camb.AI специализируется на дубляже и локализации видео, а Palabra работает над переводом речи с сохранением голоса спикера.