Массовый подбор персонала и кадров

Клоны синтетических голосов от стартапа в области речевых технологий Resemble AI теперь можно научить говорить на полдюжине языков. Новая функция «Локализация» переводит цифровой голос, чтобы он говорил на других языках, так же, как он воспроизводит голос, чтобы произносить новые предложения на родном языке исходного говорящего.

ПЕРЕВЕСТИ TALK

Компания Resemble AI разработала платформу для создания профилей синтетической речи с минимальными данными, теоретически превращая даже пять минут голоса человека в ИИ, способный говорить все, что хочет пользователь, как если бы это была новая запись. Обычно голосовой помощник или аналогичная платформа может переводить то, что кто-то говорит, на другой язык, но все равно будет использовать стандартный искусственный голос. Локализуйте перевод наложенным поверх генератора искусственного голоса, чтобы вы могли произнести предложение на английском языке, а через мгновение услышать его собственный голос на французском.

«У нас много клиентов из разных стран, которые очень заинтересованы в переводе языков», - сказал генеральный директор Resemble Зохаиб Ахмед в интервью Voicebot. «Мы начали создавать разные голоса на разных языках, но нам мешали слова на английском языке, появляющиеся на других языках, например, Burger King в предложении на испанском. Бургер Кинг - англичанин; Вы же не хотите, чтобы в нем был испанский акцент. Итак, мы начали развивать эту функциональность ».

Ахмед объяснил, что перевод голосовых талантов обычно занимает несколько месяцев и стоит больших денег. Для тех, кто хочет делать переводы, но не имеет одного или обоих этих факторов, функции локализации могут быть привлекательным предложением. Прямо сейчас Resemble может переводить на английский, французский, немецкий, голландский, итальянский и испанский языки. Ахмед сказал, что в разработке находятся и другие языки, на очереди японский, корейский и китайский. Перевод работает как расширение существующей платформы, еще больше упрощая дело, даже если для этого требуется больше аудиоданных, чем просто создание синтетического голоса на одном языке.

«Это встроено в платформу, но процесс немного отличается», - сказал Ахмед. Это не пятиминутное обещание. На запись уходит чуть больше часа ».

ГЛОБАЛЬНЫЙ ГОЛОС

Перевод искусственных голосов представляет интерес для тех отраслей, на которые компания Resemble уже направила свою платформу. По словам Ахмеда, в особенности должна быть заинтересована индустрия развлечений. Добавление местных языков означает, что фильмы или игры можно дублировать голосом оригинального актера, сохраняя при этом его голос без необходимости изучать новый язык. Здесь также играет роль способность платформы настраивать эмоции голоса. По словам Ахмеда, поскольку для работы платформы не требуется много данных или технических знаний, база потенциальных клиентов обширна. Между тем, более мощные функции перевода, предлагаемые Amazon, Google и другими техническими гигантами, по-прежнему больше подходят для текста, перевода веб-сайтов или получения аудио и его перевода в текстовый дисплей.

«Локализация речи находится на ранней стадии развития, но локализация текста - очень зрелая. Мы пытаемся идти по этому пути », - сказал Ахмед. «Наша цель по-прежнему состоит в том, чтобы минимизировать объем необходимых данных и упростить контроль разработчика».