Рассмотрена задача авторегрессионного моделирования речевого сигнала по данным дискретного преобразования Фурье в режиме скользящего окна наблюдений небольшой длительности (миллисекунды). Исследована проблема устойчивости формируемой авторегрессионной модели. Предложено для ее преодоления использовать в качестве опорного спектрального образца огибающую периодограммы Шустера. Разработан новый метод авторегрессионного моделирования, в котором детектирование спектральной огибающей осуществляется с использованием рециркулятора последовательности отсчетов в частотной области. Рассмотрен пример его практической реализации, поставлен и проведен натурный эксперимент. По результатам эксперимента сделаны выводы о достижении существенного выигрыша в отношении не только устойчивости, но и точности авторегрессионной модели речевого сигнала.
Отталкиваясь от определения основного тона речи диктора как минимальной частоты линейчатого спектра мощности вокализованных отрезков речевого сигнала, дана оценка потенциально достижимой точности ее измерения в условиях действии фоновых помех типа белого гауссова шума. На основе этой оценки разработан субоптимальный алгоритм измерения частоты основного тона по короткому фрейму речевого сигнала. Эффективность разработанного алгоритма подтверждена результатами проведенного эксперимента, в ходе которого использовалось авторское программное обеспечение.
Рассмотрена проблема искажений авторегрессионной модели голосового сигнала под действием аддитивного фонового шума в системах цифровой обработки речи со сжатием данных на основе линейного предсказания. В частотной области указанные искажения проявляются в ослаблении основных формант, отвечающих за разборчивость речи диктора. Для компенсации формантного ослабления предложено корректировать основные параметры авторегрессионной модели — коэффициенты линейного предсказания. Разработан регулярный метод их корректировки с использованием импульсной характеристики рекурсивного формирующего фильтра. При применении данного метода наряду с амплитудным усилением формант их частόты сохраняются неизменными как фактор узнаваемости голоса диктора. Эффективность метода исследована экспериментально с использованием авторского программного обеспечения. По результатам проведенного эксперимента сделаны выводы о существенном повышении относительного уровня формант в спектре мощности откорректированного голосового сигнала.
Индексирование
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации