Аннотация:
В работе исследуется возможность формирования модели голоса заданного диктора на основе записей образцов его голоса с транскрипцией. В работе предлагается практический способ построения голосовой модели и результаты экспериментов ее применения к задаче конверсии голоса. Модель использует искусственную нейронную сеть, устроенную по принципу автоматического кодера, устанавливающую соответствие между пространством речевых параметров и пространством возможных фонетических состояний, унифицированным для произвольного голоса.
Образец цитирования:
И. С. Азаров, А. А. Петровский, “Формирование персональной модели голоса диктора с универсальным фонетическим пространством признаков на основе искусственной нейронной сети”, Тр. СПИИРАН, 36 (2014), 128–150