Отталкиваясь от определения основного тона речи диктора как минимальной частоты линейчатого спектра мощности вокализованных отрезков речевого сигнала, дана оценка потенциально достижимой точности ее измерения в условиях действии фоновых помех типа белого гауссова шума. На основе этой оценки разработан субоптимальный алгоритм измерения частоты основного тона по короткому фрейму речевого сигнала. Эффективность разработанного алгоритма подтверждена результатами проведенного эксперимента, в ходе которого использовалось авторское программное обеспечение.
Рассмотрена проблема искажений авторегрессионной модели голосового сигнала под действием аддитивного фонового шума в системах цифровой обработки речи со сжатием данных на основе линейного предсказания. В частотной области указанные искажения проявляются в ослаблении основных формант, отвечающих за разборчивость речи диктора. Для компенсации формантного ослабления предложено корректировать основные параметры авторегрессионной модели — коэффициенты линейного предсказания. Разработан регулярный метод их корректировки с использованием импульсной характеристики рекурсивного формирующего фильтра. При применении данного метода наряду с амплитудным усилением формант их частόты сохраняются неизменными как фактор узнаваемости голоса диктора. Эффективность метода исследована экспериментально с использованием авторского программного обеспечения. По результатам проведенного эксперимента сделаны выводы о существенном повышении относительного уровня формант в спектре мощности откорректированного голосового сигнала.
Индексирование
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации