21.10.2019

Компания KVINT создала модуль по синтезу речи




Компания Квинт разработала модуль по синтезу речи, который может воспроизводить естественный тембр, тон, ритм, мелодику речи.


Синтез речи – важнейшая составляющая любого голосового робота. Звучание голоса в значительной степени определяет, насколько робот смог приблизиться к человеку. Для того чтобы пользователю было комфортно общаться с голосовым роботом, его речь должна быть выразительной, эмоциональной, естественной и, в идеале, неотличимой от речи живого оператора. В диалоге должны быть правильно расставлены паузы, интонационные ударения. Любой изъян или излишний металл в голосе будут сразу услышаны, и неизбежно вызовут отторжение у пользователей.


Теперь KVINT может для своих партнеров создавать индивидуальные голоса для подключаемых голосовых ассистентов всего за несколько недель. Использование нейронных систем даёт возможность передавать плавность и натуральность звучания. Теперь каждый желающий может создать цифровую копию своего голоса и свободно общаться с ее помощью на различных языках.[АН1]


Модуль по синтезу речи является неотъемлемой частью платформы KVINT по созданию голосовых роботов. Благодаря встроенному графическому конструктору диалогов на платформе KVINT можно проектировать голосовых роботов, не зная языков программирования, не обладая навыками кодирования.

По словам Генерального директора компании «Квинт»: «Сегодня у нас появился синтез на русском языке. Это был длинный путь с забегом не на один год. За этот период нам пришлось переработать огромное количество часов записанной человеческой речи, сделать разметку записей, собрать и протестировать ни одну речевую модель. Я очень рад, что нам удалось это сделать. В ближайшее время мы планируем запустить синтез на казахском языке, а потом на английском».


При озвучивании роботов на платформе KVINT используются как предзаписанные фразы, не меняющиеся в диалоге, так и синтезированная речь, которая чаще всего применяется для динамического, переменного контента в разговоре. Собственный синтез речи дает возможность делать бесшовные склейки, благодаря которым сложно будет заметить переходы от живой записанной речи к синтезированной. В результате отличить диалоги с роботом от диалогов с человеком неподготовленному пользователю практически невозможно.


Практическое применение данной технологии в недалеком будущем позволит известным брендам использовать индивидуальный голос для создания персонифицированных голосовых помощников, ассистентов. Именно они, голосовые роботы, станут не только полноправной частью привычного маркетинга и инструментом для продвижения товаров и услуг, но и будут подчеркивать инновационность бренда, а также являться его имиджей составляющей.

 


Возврат к списку