Метод преобразования речевого сигнала для улучшения разборчивости речи

Савченко В. В.; Савченко Л.В.

doi:10.7868/S3034590125080062

Код статьи

S3034590125080062-1

DOI

10.7868/S3034590125080062

Тип публикации

Статья

Статус публикации

Опубликовано

Авторы

Савченко В. В.

Аффилиация:
Редакция журнала “Радиотехника и электроника”
Национальный исследовательский университет “Высшая школа экономики”

Савченко Л.В.

Аффилиация:
Редакция журнала “Радиотехника и электроника”
Национальный исследовательский университет “Высшая школа экономики”

Том/ Выпуск

Том 70 / Номер выпуска 8

Страницы

753-760

Аннотация

Рассмотрена задача улучшения разборчивости речи в системах речевой связи. Указано на острую проблему узнаваемости голоса диктора при применении известных методов ее решения. Для преодоления указанной проблемы предложен новый метод преобразования речевого сигнала, основанный на авторегрессионной модели голосового тракта и на принципе избирательного по частоте усиления основных формант. Рассмотрен пример практической реализации нового метода на базе алгоритмов быстрого преобразования Фурье. Даны оценки вычислительных затрат и быстродействия. Поставлен и проведен натурный эксперимент. По его результатам установлен достигаемый при применении предложенного метода положительный эффект, а именно: повышение разборчивости речи контрольного диктора при сохранении достаточно высокой степени узнаваемости его голоса. Полученные результаты предназначены для использования при разработке новых и модернизации существующих систем речевой связи, включая мобильную связь и VoIP-системы.

Ключевые слова

теория сигналов речевой сигнал цифровая обработка речи голосовой тракт авторегрессионная модель речевая связь мобильная связь

Дата публикации

01.08.2025

Год выхода

2025

Всего подписок

Всего просмотров

Библиография

1. Rabiner L.R., Schafer R.W. // Foundations and Trends in Signal Processing. 2007. V. 1. № 1–2. P. 1. https://doi.org/10.1561/2000000001
2. Mehrish A., Majumder N., Bharadwaj R. et al. // Information Fusion. 2023. V. 99. Article No. 101869. https://doi.org/10.1016/j.inffus.2023.101869
3. Sankar M.S., Sathidevi P.S. // Circuits Systems Signal Process. 2023. V. 42. P. 3437. https://doi.org/10.1007/s00034-022-02277-z
4. Anselam A.S., Pillai S.S., Sreeni K.G. Advances Communication Systems and Networks. Selected Proceedings of ComNet2019/Eds. by J. Jayakumari, G. K. Karagiannidis, M. Ma, S. A. Hossain. Singapore: Springer, 2020. P. 625. https://doi.org/10.1007/978-981-15-3992-3_53
5. Togawa T., Otani T., Suzuki K., Taniguchi T. // APSIPA Trans. on Signal and Information Processing. 2015. V. 4. Article No. e14. https://doi.org/10.1017/ATSIP.2015.3
6. Narendra N.P., Alku P. // Speech Commun. 2019. V. 110. P. 47. https://doi.org/10.1016/j.specom.2019.04.003
7. O’Shaughnessy D. // IEEE Trans. 2024. V. HMS-54. № 1. P. 110. https://doi.org/10.1109/THMS.2023.3339663
8. Ngo Th., Kubo R., Akagi M. // Speech Commun. 2021. V. 135. P. 11. https://doi.org/10.1016/j.specom.2021.09.004
9. Zheng C., Zhang H., Liu W. et al. // Trends in Hearing. 2023. V. 27. Article No. 23312165231209913 https://doi.org/10.1177/23312165231209913
10. Jolad B., Khanai R. // Int. J. Speech Technology. 2023. V. 26. P. 287. https://doi.org/10.1007/s10772-023-10019-y
11. Kolbæk M., Tan Z.H., Jensen S.H., Jensen J. // IEEE/ACM Trans. 2020. V. ASLP-28. P. 825. https://doi.org/10.1109/TASLP.2020.2968738
12. Deng F., Bao Ch. // Speech Commun. 2016. V. 79. P. 30. https://doi.org/10.1016/j.specom.2016.02.006
13. Cавченко В.В., Савченко Л.В. // РЭ. 2021. Т. 66. № 11. C. 1100. https://doi.org/10.31857/S0033849421110085
14. Cавченко В.В., Савченко Л.В. // РЭ. 2024. Т. 69. № 4. С. 339. https://doi.org/10.31857/S0033849424040056
15. Gibson J. //Information. 2019. V. 10. № 5. P. 179. https://doi.org/10.3390/info10050179
16. Cавченко В.В., Савченко Л.В. // РЭ. 2023. Т. 68. № 7. С. 660. https://doi.org/10.31857/S0033849423060128
17. Ternström S. // Appl. Sciences. 2023. V. 13. № 6. P. 3514. https://doi.org/10.3390/app13063514
18. Cавченко В.В., Савченко Л.В. // Измерительная техника. 2024. № 5. С. 54. https://doi.org/10.32446/0368-1025it.2024-5-54-63
19. Ito M., Ohara K., Ito A., Yano M. // Proc. 11th Annual Conf. Int. Speech Commun. Association (INTERSPEECH 2010). Makuhari. 26–30 Sept. N.Y.: Curran Associates, Inc., 2011. V.4. P. 2494. https://doi.org/10.21437/Interspeech.2010–669
20. Cавченко А.В., Савченко В.В. // РЭ. 2022. T. 67. № 3. C. 286. https://doi.org/10.31857/S0033849422030135
21. Palaparthi A., Titze I.R. // Speech Commun. 2020. V. 123. P. 98. https://doi.org/10.1016/j.specom.2020.07.003
22. Cавченко В.В., Савченко Л.В. // Измерительная техника. 2024. № 2. C. 55. https://doi.org/10.32446/0368-1025it.2024-2-55-62
23. Tohyama M. Acoustic Signals and Hearing. A TimeEnvelope and Phase Spectral Approach. L.: Academic Press, 2020. P. 89. https://doi.org/10.1016/B978-0-12-816391-7.00013-9
24. Alku P., Kadiri S.R., Gowda D. // Computer Speech & Language. 2023. V. 81. Article No. 101515. https://doi.org/10.1016/j.csl.2023.101515
25. Kathiresan Th., Maurer D., Suter H., Dellwo V. // J. Acoust. Soc. Amer. 2018. V. 143. № 3. P. 1919. https://doi.org/10.1121/1.5036258
26. Tokuda I.T. Oxford Research Encyclopedia of Linguistics. Oxford: Univ. Press, 2021. P. oxfordre.com/linguistics/view/10.1093/acrefore/9780199384655.001.0001/acrefore-9780199384655-e-894
27. Kim H.S. Linear Predictive Coding is All-Pole Resonance Modeling. Stanford Univ. Center for Computer Research in Music and Acoustics, 2023. 7 p. ccrma.stanford.edu/~hskim08/lpc/lpc.pdf
28. Jesus L., Castilho S., Ferreira A., Costa M.C. // J. Phonetics. 2023. V. 97. Article No. 101223. https://doi.org/10.1016/j.wocn.2023.101223
29. Gustafsson Ph.U., Laukka P., Lindholm T. // Speech Commun. 2023. V. 146. P. 82. https://doi.org/10.1016/j.specom.2022.12.001
30. Savchenko V.V. // Radioelectronics and Communications Systems. 2021. V. 64. № 11. P. 592. https://doi.org/10.3103/S0735272721110030
31. Corey R.M., Kozat S.S., Singer A.C. Signal Processing and Machine Learning Theory/Ed. by P.S.R. Diniz. L.: Academic Press. 2024. P. 689. https://doi.org/10.1016/B978-0-32-391772-8.00017-X
32. Marple S.L.Jr. Digital Spectral Analysis with Applications. Mineola: Dover Publications. 2019.
33. Kuhn K., Kersken V., Reuter B. et al.// ACM Trans. on Accessible Computing. 2024. V. 16. № 4. Article No. 25 https://doi.org/doi.org/10.1145/3636513
34. Palani S. Principles of Digital Signal Processing. Cham: Springer 2022. https://doi.org/10.1007/978-3-030-96322-4
35. Cавченко В.В. // Измерительная техника. 2023. № 10. С. 63. https://doi.org/10.32446/0368-1025it.2023-10-63-69
36. Cавченко В.В., Савченко А.В. // РЭ. 2020. Т. 65. № 11. С. 1101. https://doi.org/10.31857/S0033849420110157
37. Omer D.S., Hussein M.A. & Mina L.M. // J. Engineering. 2020. V. 26. № 10. P. 135. https://doi.org/10.31026/j.eng.2020.10.10
38. Esra A.J.S., Sukhi Y. // Computer Speech & Language. 2024. V. 84. Article No. 101554. https://doi.org/10.1016/j.csl.2023.101554

ГОСТ	Савченко В. , Савченко Л. Метод преобразования речевого сигнала для улучшения разборчивости речи // Радиотехника и электроника. – 2025. – T. 70. – Номер выпуска 8 C. 753-760 . URL: https://radiotechras.ru/s3034590125080062-1/?version_id=117684. DOI: 10.7868/S3034590125080062
MLA	Savchenko, V. V, Savchenko, L.V "Method for Converting Speech Signal to Improve Speech Intelligibility." Journal of Communications Technology and Electronics. 70.8 (2025).:753-760. DOI: 10.7868/S3034590125080062
APA	Savchenko V., Savchenko L. (2025). Method for Converting Speech Signal to Improve Speech Intelligibility. Journal of Communications Technology and Electronics. vol. 70, no. 8, pp.753-760 DOI: 10.7868/S3034590125080062

ОФНРадиотехника и электроника Journal of Communications Technology and Electronics

Метод преобразования речевого сигнала для улучшения разборчивости речи

Вы можете

Библиография

Индексирование

ОФНРадиотехника и электроника Journal of Communications Technology and Electronics

Метод преобразования речевого сигнала для улучшения разборчивости речи

Вы можете

Библиография

Индексирование

Войти через