Компания КВИНТ создала модуль по синтезу речи

Компания КВИНТ разработала модуль по синтезу речи, который может воспроизводить естественный тембр, тон, ритм, мелодику речи.
Синтез речи – важнейшая составляющая любого голосового робота. Звучание голоса в значительной степени определяет, насколько робот смог приблизиться к человеку. Для того чтобы пользователю было комфортно общаться с голосовым роботом, его речь должна быть выразительной, эмоциональной, естественной и, в идеале, неотличимой от речи живого оператора. В диалоге должны быть правильно расставлены паузы, интонационные ударения. Любой изъян или излишний металл в голосе будут сразу услышаны, и неизбежно вызовут отторжение у пользователей.
Теперь KVINT может для своих партнеров создавать индивидуальные голоса для подключаемых голосовых ассистентов всего за несколько недель. Использование нейронных систем даёт возможность передавать плавность и натуральность звучания. Каждый желающий может получить цифровую копию своего голоса и свободно общаться с ее помощью на различных языках.
Модуль по синтезу речи является неотъемлемой частью платформы KVINT по созданию голосовых роботов. Благодаря встроенному графическому конструктору диалогов на платформе KVINT можно проектировать голосовых роботов, не зная языков программирования, не обладая навыками кодирования.
По словам Генерального директора компании «Квинт», Арсения Назаркина: «Сегодня у нас появился синтез на русском языке. Это был длинный путь длиной не в один год. За это время нам пришлось переработать огромное количество часов записанной человеческой речи, сделать разметку записей, собрать и протестировать не одну речевую модель. Я очень рад, что нам удалось это сделать. В ближайшее время мы планируем запустить синтез на казахском языке, а потом на английском».
При озвучивании роботов на платформе KVINT используются как предзаписанные фразы, не меняющиеся в диалоге, так и синтезированная речь, которая чаще всего применяется для динамического, переменного контента в разговоре. Собственный синтез речи дает возможность делать бесшовные склейки, благодаря которым сложно будет заметить переходы от живой записанной речи к синтезированной. В результате отличить диалоги с роботом от диалогов с человеком неподготовленному пользователю практически невозможно.
В недалеком будущем более широкое применение данной технологии позволит известным компаниям использовать для своих брендов индивидуальный голос для создания персонифицированных голосовых помощников, ассистентов. Именно они, голосовые роботы, станут не только полноправной частью привычного маркетинга и инструментом для продвижения товаров и услуг, но и будут подчеркивать инновационность бренда, а также являться его имиджевой составляющей.