Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/44054
Назва: Метод та алгоритм підвищення точності розпізнавання звукових сигналів у закритому середовищі
Інші назви: Method and algorithm for improving the accuracy of sound signal recognition in a closed environment
Автори: Сторож, Сергій Ігорович
Storozh, Serhii
Приналежність: Тернопільський національний технічний університет імені Івана Пулюя, факультет прикладних інформаційних технологій та електроінженерії, м. Тернопіль, Україна
Бібліографічний опис: Сторож С. І. Метод та алгоритм підвищення точності розпізнавання звукових сигналів у закритому середовищі : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „172 — телекомунікації та радіотехніка“ / С. І. Сторож. — Тернопіль: ТНТУ, 2023. — 86 с.
Дата публікації: гру-2023
Дата подання: гру-2023
Дата внесення: 29-гру-2023
Видавництво: Тернопільський національний технічний університет імені Івана Пулюя
Країна (код): UA
Місце видання, проведення: Тернопільський національний технічний університет імені Івана Пулюя, кафедра радіотехнічних систем, м. Тернопіль, Україна
Науковий керівник: Дунець, Василь Любомирович
Dunets, Vasyl
Члени комітету: Хвостівський, Микола Орестович
Khvostivskyy, Mykola
УДК: 621.396.621.2
Теми: 172
телекомунікації та радіотехніка
звукові сигнали
точність
розпізнавання
реверберація
середовище
програмне забезпечення
sound signals
quality
recognition
reverberation
premises
software
Короткий огляд (реферат): У рамках даної кваліфікаційної роботи вдосконалено підходи до покращення точності виявлення акустичних сигналів у ЗС, а також метод моделювання реверберації. Ці техніки ґрунтуються на застосуванні МСВ, використовуючи модель, яка базується на концепції Полака і методі Дебніха. Вдосконалений підхід для покращення точності розпізнавання мовних сигналів реалізо- вано у формі програмного забезпечення. У першому розділі розглянуто труднощі пов’язані із визначенням акустичних сигналів у ЗС, досліджено прямий звук та компоненти реверберації, проаналізовано методи вимірю- вання часу реверберації, розглянуто типи оцінки критичної відстані і акустичні особливо- сті ЗС залежно від частотного діапазону. У другому розділі кваліфікаційної роботи представлено конфігурації існуючих генерато- рів акустичних сигналів, обладнаних ефектами реверберації, надано висновки моделюва- ння імпульсних характеристик з метою порівняння із фактичними параметрами ЗС. У третьому кваліфікаційної роботи на основі аналізу вже існуючих методів для подолан- ня ефектів реверберації та вдосконалення точності виявлення акустичних сигналів у ЗС, визначено, що найоптимальнішим для застосування є МСВ. Проведено аналіз підходів, які дозволяють оцінити спектр пізньої реверберації для МСВ. Враховуючи переваги та недоліки, для застосування у досліджені був обраний метод Деб- ніха (МСВ).
This qualification work develops approaches to improve the accuracy of sound signal recogni- tion in an enclosed environment, as well as methods for modeling reverberation in the environ- ment and creating artificial reverberation. These methods are based on the application of spectral subtraction, using a model based on the concept of Polak and the Debnich method. The developed approach to improving the accuracy of sound signal recognition was imple- mented in the form of a computer program. In the first chapter of qualification work considered the difficulties associated with the deter- mination of sound signals in a closed environment, described the study of direct sound and reve- rberation components, analyzed the methods of measuring the reverberation time, considered methods for estimating the critical distance and acoustic features of the environment depending on the frequency range. In the second chapter of the qualification work presented configurations of existing sound signal generators equipped with reverberation effects, carried out the analysis of their structures the results of modeling their impulse characteristics are presented in order to compare them with real environmental parameters. In the third chapter of qualification work, based on the analysis of existing methods for over- coming reverberation effects and improving the accuracy of audio signal recognition in a closed environment, it was concluded that most optimal method for use is the spectral subtraction met- hod. An analysis of approaches that make it possible to estimate the late reverberation spectrum for the spectral subtraction algorithm was carried out. Taking into account the advantages and disad- vantages, the Debnich method (spectral subtraction filter) was chosen for use in the work.
Зміст: ВСТУП 9 РОЗДІЛ 1. АНАЛІТИЧНА ЧАСТИНА .11 1.1 Прямий звук та компоненти реверберації 11 1.2 Час реверберації 13 1.3 Критична відстань 16 1.4 Аналіз акустики середовища в залежності від діапазону частот 16 1.5 Висновок до розділу 1 18 РОЗДІЛ 2. ОСНОВНА ЧАСТИНА 19 2.1 Хвильове моделювання 19 2.2 Траєкторія променів 20 2.3 Метод уявних джерел 21 2.4 Статистична модель середовища 23 2.5 Вибір методу моделювання 26 2.6 Штучна генерація реверберації 27 2.6.1 Структури на базі всепропускаючих та гребінчастих фільтрів .. 28 2.6.2 Мережі зворотніх ліній затримок 30 2.6.3 Порівняння отриманих результатів 32 2.7 Метод підвищення точності розпізнавання звукових сигналів у закритому середовищі 34 2.7.1. Приглушення реверберації 35 2.7.2. Спектральне віднімання 36 2.7.3. Спектральне віднімання 38 2.7.4. Просторова обробка 39 2.7.5. Гомоморфна деконволюція 40 2.7.6. Метод спектрального віднімання для подолання реверберації звукового сигналу 42 2.8. Висновок до розділу 2 53 РОЗДІЛ 3. НАУКОВО-ДОСЛІДНА ЧАСТИНА 54 3.1. МОДЕЛЮВАННЯ ГАРМОНІЧНОГО СИГНАЛУ 54 3.2. Моделювання з використанням звучання акорду на гітарі 56 3.3. Моделювання мовного сигналу 57 3.4. Аналіз роботи алгоритму в залежності від вхідних параметрів 58 3.5. Висновок до розділу 4 61 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 62 4.1. Питання щодо охорони праці 62 4.2. Питання щодо безпеки в надзвичайних ситуаціях 64 4.3. Висновок до розділу 4 70 ВИСНОВКИ 71 ПЕРЕЛІК ДЖЕРЕЛ 72
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/44054
Власник авторського права: ©Сторож Сергій Ігорович, 2023
Перелік літератури: 1. F.Everest. The Master Handbook of Acoustics. McGraw-Hill, 1994.
2. Encyclopaedia Britannica Online. Acoustics. 2007.
3. P. A. Naylor and N. D. Gaubitch, Speech Dereverberation. Berlin, Germany: Springer, 2010.
4. E.A.P Habets, “Single- and multi-microphone speech dereverberation using spectral enhancement,” Ph.D. dissertation, T. U. Eindhoven, 2007.
5. Kuttruff, H.: room acoustics, 4 edn. Taylor & Francis (2000).
6. Savioja, L., Rinne, T.J., Takala, T.: Simulation of room acoustics with a 3-D finite difference mesh. In: Proc. Int. Computer Music Conf., pp. 463–466. Denmark (1994).
7. Kleiner, M., Dalenb.ack, B., Svensson, P.: Auralization – an overview. J. Acoust. Soc. Am. 41(11), 861–875 (1993).
8. Wen, J.Y.C., Gaubitch, N.D., Habets, E.A.P., Myatt, T., Naylor, P.A.: Evaluation of speech dereverberation algorithms using the MARDY database. In: Proc. Int. Workshop Acoust. Echo Noise Control (IWAENC). Paris, France (2006).
9. Kuttruff, K.H., Schroeder, M.R.: On frequency response curves in rooms. comparison of experimental, theoretical, and monte carlo results for the average frequency spacing between maxima. J. Acoust. Soc. Am. 34(1), 76 – 80 (1962).
10. Savioja, L.:Modeling techniques for virtual acoustics. Doctoral dissertation, Helsinki University of Technology, Espoo, Finland (1999).
11. Kleiner, M., Dalenb.ack, B., Svensson, P.: Auralization – an overview. J. Acoust. Soc. Am. 41(11), 861–875 (1993).
12. Savioja, L., Backman, J., J.arvinen, A., Takala, T.:Waveguide mesh method for low-frequency simulation of room acoustics. In: Proc. of the 15th Int. Congr. Acoust. (ICA‟95), vol. 2, pp. 1–4. Trondheim, Norway (1995).
13. Krokstad, A., Strom, S., Sorsdal, S.: Calculating the acoustical room response by the use of a ray tracing technique. J. Sound Vib. 8, 118–125 (1968).
14. Kulowski, A.: Error investigation for the ray tracing technique. Appl. Acoust. 15(4), 263–274 (1982).
15. Allen, J.B., Berkley, D.A.: Image method for efficiently simulating small-room acoustics. J. Acoust. Soc. Am. 65(4), 943–950 (1979).
16. Peterson, P.M.: Simulating the response of multiple microphones to a single acoustic source in a reverberant room. J. Acoust. Soc. Am. 80(5), 1527–1529 (1986).
17. Nelson, P.A., Elliott, S.J.: Active control of sound. Academic, London (1993).
18. Polack, J.D.: La transmission de l‟.energie sonore dans les salles. Th`ese de doctorat d‟etat, Universit.e du Maine, Le Mans (1988).
19. Gustafsson, T., Rao, B.D., Trivedi, M.: Source localization in reverberant environments: modeling and statistical analysis. IEEE Trans. Speech Audio Process. 11(6), 791803 (2003).
20. Reichardt, W., Lehmann, U.: Raumeindruck als oberbegriff von rumlichkeit und halligkeit, erluterungen des raumeindrucksmasses. Acustica 40, 174–183 (1978).
21. Polack, J.D.: Playing billiards in the concert hall: the mathematical foundations of geometrical room acoustics. Appl. Acoust. 38(2), 235–244 (1993).
22. Pietrzyk, A.: Computer modeling of the sound field in small rooms. In: Proc. of the 15th AES Int. Conf. on Audio, Acoustics and Small Spaces, vol. 2, pp. 24–31. Copenhagen, Denmark (1998).
23. Gardner, W.G. 1998. Chapter 3. Reverberation Algorithms, in Kahrs, M. And Brandenburg, K. Editors. Applications of Digital Signal Processing to Audio and Acoustics. Kluwer Academic Publishers.
24. Schroeder. M. R., Logan, B. F. 1961. Colorless Artificial Reverberation. J. Audio Engineering Society. Vol. 9, No. 3.
25. E.A.P Habets, “Single- and multi-microphone speech dereverberation using spectral enhancement,” Ph.D. dissertation, T. U. Eindhoven, 2007.
26. J. Hardwick, C.D. Yoo, and J.S. Lim, “Speech enhancement using the dual excitation speech model,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), 1993, pp. 367–370.
27. C.D. Yoo, “Speech enhancement based on the generalized dual excitation model with adaptive analysis window,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), 1995, vol. 1, pp. 832–835.
28. H. Attias and L. Deng, “Speech Denoising and Dereverberation Using Probabilistic Models,” Advances in Neural Inform. Process. Syst., vol. 13, pp. 758–764, 2001.
29. J.R. Deller, J.G. Proakis, and J.H.L. Hansen, Discrete-Time Processing of Speech Signals. New York: MacMillan, 1993.
30. M. Tonelli, M.G. Jafari, and M.E. Davies, “A multi-channel Maximum Likelihood approach to de-reverberation,” in Proc. European Signal Process. Conf. (EUSIPCO), Florence, Italy, Sept. 2006.
31. B. Yegnanarayana, “Speech enhancement using excitation source information,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), 2002, vol. 1, pp. 541–544.
32. H. Wang and F. Itakura, “An implementation of multi-microphone dereverberation approach as a preprocessor to the word recognition system,” J. Acoust. Soc. Jap., vol. 13, no. 5, pp. 285–293, 1992.
33. A. Oppenheim, R. Schafer, T. Stockham, “Nonlinear filtering of multiplied and convolved signals”, IEEE Trans. Audio and Electroacoustics, Vol. AU-16, No. 3, 1968.
34. M. Wu and D. L. Wang, “A two-stage algorithm for one microphone reverberant speech enhancement,” IEEE Trans. Audio, Speech, Lang. Process., vol. 14, no. 3, pp. 774–784, May 2006.
35. P. Krishnamoorthy and S. R. M. Prasanna, “Reverberant speech enhancement by temporal and spectral processing,” IEEE Trans. Audio, Speech, Lang. Process., vol. 17, no. 2, pp. 137–148, Feb. 2009.
36. S. Mosayyebpour, M. Esmaeili, T. A. Gulliver, “Single-Microphone Early and Late Reverberation Suppression in Noisy Speech,” IEEE Trans. Audio, Speech, Lang. Process., vol. 21, no. 2, pp. 322–335, Feb. 2013.
37. E. A. P. Habets, N. Gaubitch, and P. A. Naylor, “Temporal selective dereverberation of noisy speech using one microphone,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), Apr. 2008, pp. 4577–4580.
38. J. S. Erkelens and R. Heusdens, “Single-microphone late-reverberation suppression in noisy speech by exploiting long-term correlation in the DFT domain,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), Apr. 2009, pp. 3997–4000.
39. N.D. Gaubitch, P.A. Naylor, and D. Ward, “On the use of linear prediction for dereverberation of speech,” in Proc. of the Int. Workshop Acoust. Echo Noise Control (IWAENC), Kyoto, Japan, 2003, pp. 99–102.
40. N.D. Gaubitch, D.B. Ward, and P.A. Naylor, “Statistical analysis of the autoregressive modeling of reverberant speech,” J. Acoust. Soc. Am., vol. 120, pp. 4031–4039, Dec. 2006.
41. D. Gesbert and P. Duhamel, “Robust blind identification and equalization based on multi-step predictors,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), 1997, vol. 26, no. 5, pp. 3621–3624.
42. Khvostivska L., Khvostivskyi M., Dunets V., Dediv I. Matematychne, alhorytmichne ta prohramne zabezpechennia synfaznoho vyiavlennia radiosyhnaliv v elektronnykh komunikatsiinykh merezhakh iz zavadamy [Mathematical, algorithmic and software support of synphase detection of radio signals in electronic communication networks with noises]. Scientific Journal of TNTU (Tern.), vol. 111, no 3, pp. 48-57 [in Ukrainian].
43. Хвостівський М.О., Дунець В.Л., Дедів І.Ю. Методичні рекомендації з оформлення кваліфікаційних робіт магістра за спеціальністю 172 Телекомунікації та радіотехніка. Тернопіль: ТНТУ імені Івана Пулюя, 2020. 21 с.
Тип вмісту: Master Thesis
Розташовується у зібраннях:172 — телекомунікації та радіотехніка

Файли цього матеріалу:
Файл Опис РозмірФормат 
Сторож_С_І_robota.pdf2,84 MBAdobe PDFПереглянути/відкрити
Сторож_С_І_Авторська_Довідка.doc57 kBMicrosoft WordПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора