50321 | ИПУ РАН

Автор(ы):

Рахманенко И. А. (ТУСУР)

Мещеряков Р. В. (ИПУ РАН, Лаборатория 80)

Автор(ов):

Параметры публикации

Тип публикации:

Статья в журнале/сборнике

Название:

Анализ идентификационных признаков в речевых данных с помощью gmm-ubm системы верификации диктора

ISBN/ISSN:

2078-9181

DOI:

10.15622/sp.52.2

Наименование источника:

Труды СПИИРАН

Обозначение и номер тома:

№ 3 (52)

Город:

Санкт Петербург

Издательство:

ФГБУН Санкт-Петербургский институт информатики и автоматизации РАН

Год издания:

2017

Страницы:

32-50

Аннотация

Данная статья посвящена отбору и оценке речевых признаков, используемых в задаче автоматической текстонезависимой верификации диктора. Для решения поставленной задачи была использована система верификации диктора, основанная на модели Гауссовых смесей и универсальной фоновой модели (GMM-UBM система). Рассмотрены область применения и проблемы современных систем автоматической идентификации диктора. Произведен обзор современных методов идентификации диктора, основных речевых признаков, используемых при решении задачи идентификации диктора, а также рассмотрен процесс извлечения признаков, использованных далее. К рассмотренным признакам относятся мел-кепстральные коэффициенты (MFCC), пары линейного спектра (LSP), кепстральные коэффициенты перцептивного линейного предсказания (PLP), кратковременная энергия, формантные частоты, частота основного тона, вероятность вокализации (voicing probability), частота пересечения нуля (ZCR), джиттер и шиммер. Произведена экспериментальная оценка GMM-UBM системы с применением различных наборов речевых признаков на речевом корпусе, включающем в себя записи 50 дикторов. Признаки отобраны с помощью генетического алгоритма и алгоритма жадного добавления-удаления. Используя 256-компонентные Гауссовы смеси и полученный вектор из 28 признаков, была получена равная ошибка 1-го и 2-го рода (EER), составляющая 0,579 %. По сравнению со стандартным вектором, состоящим из 14 мел-кепстральных коэффициентов, ошибка EER была уменьшена на 42,1 %.

Библиографическая ссылка:

Рахманенко И.А., Мещеряков Р.В. Анализ идентификационных признаков в речевых данных с помощью gmm-ubm системы верификации диктора // Труды СПИИРАН. 2017. № 3 (52). С. 32-50.