Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/30082
Назва: Метод підвищення роздільної здатності голосових сигналів для керування кліматом в закритих приміщенях
Інші назви: A method of increasing the resolution of voice signals for indoor climate control
Автори: Поліщук, Максим Ігорович
Polishchuk, Maxym
Приналежність: Тернопільський національний технічний університету імені Івана Пулюя
Бібліографічний опис: Поліщук М. І. Метод підвищення роздільної здатності голосових сигналів для керування кліматом в закритих приміщенях : дипломна робота магістра за спеціальністю „172 — Телекомунікації та радіотехніка“/ М. І.Поліщук. —Тернопіль: ТНТУ, 2019р. — 123 с.
Дата публікації: 20-гру-2019
Дата внесення: 21-гру-2019
Науковий керівник: Дунець, Василь Любомирович
Члени комітету: Хвостівський, Микола Орестович
УДК: УДК 004.056
Теми: 172
Телекомунікації та радіотехніка
розпізнавання
нейронні мережі
виявлення
достовірність
програмне забезпечення
recognition
neural networks
detection
authenticity
software
Короткий огляд (реферат): Дипломну роботу магістра присвячено покращення точності розпізнавання голосу в пристроях призначених для керування кліматом. Використтано нейронні мережі, які в останні роки неодноразово показували суттєві результати в процесах прогнозування, класифікації, розпізнавання образів, рукописного тексту та мовлення, у задачах розпізнавання мови.
The Master's thesis is dedicated to improving the accuracy of voice recognition in climate-controlled devices. We have used neural networks, which in recent years have repeatedly shown significant results in the processes of forecasting, classification, pattern recognition, handwriting and speech, in language recognition tasks.
Зміст: ВСТУП 8 РОЗДІЛ 1. ГОЛОСОВЕ КЕРУВАННЯ 10 1.1 Керування з підтримкою голосу 10 1.2 Поняття, призначення і види голосового управління 13 1.2.1 Поняття голосового управління 13 1.2.2 Призначення приладів визначення мови 15 1.2.3 Вигляду голосового управління 16 1.3 Архітектура і симптоми приладів голосового управління 17 1.3.1 Архітектура приладів визначення мови 17 1.3.2 Симптому в пристроях визначення мови 18 1.3.3 Параметра властивості мови і головні думки 22 1.4 Синтез мови в голосовому управлінні 23 1.5 Оцифрування звуку 26 1.6 Тест ринку систем голосового управління 29 1.7 Завдання управління кліматом 33 1.8 Тест останніх досліджень і підсумків 34 1.9 Висновок до розділу 1 39 РОЗДІЛ 2. АЛГОРИТМ РОЗПІЗНАВАННЯ МОВИ ЗА ДОПОМОГОЮ НЕЙРОННИХ МЕРЕЖ 41 2.1 Алгоритм роботи нейронної мережі для задач розпізнавання мови 41 2.1.1 Визначення мови з підтримкою нейтонної мережі 41 2.1.2 Обробка отриманих оцифрованих даних 44 2.1.3 Визначення букв з коротких звуків 47 2.2 Розробка алгоритму для опрацювання голоса 51 2.2.1. Короткий опис розробки методу опрацювання 51 2.2.2. Спектральний тест сигналу 55 2.2.3. Створення з підтримкою бібліотеки FANN нейронної мережі 7 для визначення команд 62 2.3 Висновок до розділу 2 67 РОЗДІЛ 3. ДОСЛІДНИЦЬКА ЧАСТИНА 69 3.1 Огляд шляхів проектування 69 3.2. Вибір складових 72 3.3. Середовище для проведення експериментів 79 3.4. Висновки до розділу 3 81 РОЗДІЛ 4. СПЕЦІАЛЬНА ЧАСТИНА 82 4.1 Програмне середовище "Мatlab simulink" 82 4.2 Висновки до розділу 4 85 РОЗДІЛ 5. ОБГРУНТУВАННЯ ЕКОНОМІЧНОЇ ЕФЕКТИВНОСТІ 86 5.1 Науково-технічна актуальність науково-дослідної роботи 86 5.2 Розрахунок витрат на проведення науково-дослідної роботи 91 5.3 Висновки до розділу 5 95 РОЗДІЛ 6. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 96 6.1 Охорона праці 96 6.2 Безпека в надзвичайних ситуаціях 103 6.3 Висновки до розділу 108 РОЗДІЛ 7. ЕКОЛОГІЯ 109 7.1 Вплив електромагнітного випромінювання на навколишнє середовище 109 7.2 Наслідки впливу електромагнітного випромін 110 7.3 Висновки до розділу 7 114 ВИСНОВКИ 115 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 116 ДОДАТКИ 121
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/30082
Власник авторського права: © Поліщук М.І., кафедра радіотехнічних систем, 2019р.
Перелік літератури: 1. Ардуїно [Електронний ресурс] // Arduino.ru. – 2015. – Режим доступудо ресурсу: http://arduino.ru/. 2. Перспективи на ринку систем голосового управління [Електронний ресурс] // Хабрахарбр. – 2016. – Режим доступу до ресурсу: https: //habrahabr.ru/post/232613/. 3. Розпізнавання мови. [Електронний ресурс] // Вікіпедія. – 2007. – Режим доступу до ресурсу: https://ru.wikipedia.org/wiki/Распознавание_речи. 4. Голосове управління [Електронний ресурс] // Вікіпедія. – 2007. – Режим доступу до ресурсу: https://ru.wikipedia.org/wiki/Голосовое_управление. 5. Уллі С. Программирование микроконтроллерных плат Arduino/Freeduino / Соммер Уллі. – Петербург, 2012. 6. Ревич Ю. Цікава електроніка / Юрій Ревич. – Петербург, 2015. 7. Карвинен Т. Робимо сенсори. Проекти сенсорних пристроїв на базі Arduino і Raspberry Pi / Т. Карвинен, К. Карвинен, В. Валтокарі., 2015. 8. Петрін В. О. Проекти з використанням контролера Arduino. 2 изд. / Віктор Олександрович Петрін.. 9. Голосове управління Arduino засобами Processing і Google Speech API [Електронний ресурс]. – 13. – Режим доступу до ресурсу: https://habrahabr.ru/post/236673/. 10. Голосове управління вимикачами на Arduino [Електронний ресурс]. – 30. Режим доступу до ресурсу: http://compcar.ru/forum/showthread.php?t=8016. 11. Перетворення Лапласа [Електронний ресурс] // Вікіпедія – Режим доступу до ресурсу: https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B5%D0%BE%D0% B1%D1%80%D0%B0%D0%B7%D0%BE%D0%B2%D0%B0%D0%BD%D0%B 8%D0%B5_%D0%9B%D0%B0%D0%BF%D0%BB%D0%B0%D1%81%D0%B 0 12. Частота дискретизації [Електронний ресурс] // ВІкіпедія – Режим доступу до ресурсу 117 :https://uk.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D1%82%D0 %BE%D1%82%D0%B0_%D0%B4%D0%B8%D1%81%D0%BA%D1%80%D0 %B5%D1%82%D0%B8%D0%B7%D0%B0%D1%86%D1%96%D1%97. 13. Навіщо потрібні Powerline адаптери [Електронний ресурс] // Lantorg. – 2017. – Режим доступу до ресурсу: https://lantorg.com/article/zachem-nuzhnypowerline-adaptery. 14. Інтернет з розетки: загальні принципи роботи технології і огляд Powerline-адаптера TP-LINK TL-PA6010 [Електронний ресурс] // 3dNews. – 2014. – Режим доступу до ресурсу: https://3dnews.ru/821880. 15. Домашній міні-клімат-контроль своїми руками [Електронний ресурс]. – 2013. – Режим доступу до ресурсу: https://geektimes.ru/post/258012/. 16. Система "Розумний будинок" для заміського будинку на Arduino Mega2560, HC-05, SIM900, DHT11,3-х DS18B20, RTC-DS1302 [Електронний ресурс] // Arduino.ru. – 2015. – Режим доступу до ресурсу: http://arduino.ru/forum/proekty/sistema-umnyi-dom-dlya-zagorodnogo-doma-naarduino-mega2560-hc-05-sim900dht113-kh-ds18. 17. Фролов А. В. Синтез и распознавание речи. Современные решения. [Електронний ресурс] / А. В. Фролов, Г. В. Фролов. – 2003. – Режим доступу до ресурсу: http://www.frolov-lib.ru/books/hi/index.html. 18. Квитко М.В. Распознаваниеречи с помощью глубокихрекуррентных нейронныхсетей [Електронний ресурс]/ Квитко М.В. // IASA –2016 р. –223 стр. –Режим доступу: http://sait.kpi.ua/media/filer_public/73/32/7332a68e-e93b-4c57-a3c8- 66f11ee074cd/sait2016ebook.pdf 19. Голосове управління Arduino засобами Processing і Google Speech API [Електронний ресурс]. – 13. – Режим доступу до ресурсу: https://habrahabr.ru/post/236673/. 20. Мясищев А. А. Управление голосом с помощью Android и Arduino [Електронний ресурс] / А. А. Мясищев. – 2015. – Режим доступу до ресурсу: http://khnu.km.ua/root/kaf/ksm/my_syte_g/. 118 21. Mohri M. Speech recognition with weighted finite-state transducers. In Springer Handbook of Speech Processing / M. Mohri, M. Pereira, F. Riley. // Springer Berlin Heidelberg. – 2008. – С. 559–584. 22. Hinton, G., Deng, L., Yu, D., Dahl, G. E., Mohamed, A. R., Jaitly, N. et al. (2012). Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups. Signal Processing Magazine, IEEE, 29(6), 82-97. 23. Jurafsky D., Martin J.H. (2008) Speech and language processing, 2nd edition. Prentice Hall. 24. Голосове керування [Електронний ресурс] // Wikipedia. – 2007. – Режим доступу до ресурсу: https://ru.wikipedia.org/wiki/Голосовое_управление. 25. Дискретное преобразование Фурье. Википедия. [Electronic resource]. – Mode of access: https://ru.wikipedia.org/wiki/Дискретное_преобразование_Фурье. 26. Fast Artificial Neural Network Library(FANN). [Electronic resource]. - Mode of access: http://leenissen.dk/fann/wp/. 27. Audacity. Википедия. [Electronic resource]. Mode of access: https://ru.wikipedia.org/wiki/Audacity. 28. Arduino. Официальный сайт. [Electronic resource]. - Mode of access: http://arduino.cc , 2015. 29. Круглов В. Искусственные нейронные сети / В. Круглов, В. Борисов. – Горячая Линия – Телеком, 2001. 30. Холоденко А.Б., ―О построении статистических языковых моделей для систем распознавания русской речи‖ // Интеллектуальные системы, 2002. Т.6. Вип. 1-4. С. 381-394. 31. MIT Lectures 2003. http://ocw.mit.edu/courses/electrical-engineeringandcomputer-science/6-345-automatic-speech-recognition-spring2003/downloadcourse-materials/ 32. Фант. Г. Акустическая теория речеобразования. «Наука». Москва 1964. 4. Picone J. Fundamentals of speech recognition: a short course.1996. http://speech.tifr.res.in/tutorials/fundamentalOfASR_picone96.pdf 119 33. Алдошина И. Основы психоакустики. http://giga.kadva.ru/files/edu/AldoshinaPsychoacoustics.pdf 34. Слуховая система. серия "Основы современной физиологии". "Наука", Ленинград, 1990. 35. Seneff S. ―Pitch and Spectral Analysis of Speech Based on an Auditory Synchrony Model‖, Technical Report 504, January 1985 8. Hermansky H. (1997): ―Should recognizers have ears?‖, In RSR-1997, 1-10. 36. Маркел Дж.Д., Грей А.Х., Линейное предсказание речи, Москва,"Связь", 1980. 37. Hermansky H., Morgan N., "RASTA Processing of Speech", in IEEE Transaction on Speech and Audio Processing, Vol. 2, No. 4, pp. 587-589, October 1994. 38. Карпов А.А., Кипяткова И.С., Методология оценивания работы систем автоматического распознавания речи // Известия вузов. Приборостроение, Т. 55, № 11, 2012, С. 38-43. 39. Левенштейн В.И., Двоичные коды с исправлением выпадений, вставок и замещений символов. Доклады Академий Наук СССР, 1965, 163.4:845- 848. 40. Kurimo M., Creutz M., Varjokallio M., Arsoy E., Saraclar M., Unsupervised segmentation of words into morphemes - Morpho challenge 2005 41. Application to automatic speech recognition. In Proc. INTERSPEECH-2006, Pittsburgh, USA, 2006, pp. 1021-1024. 42. Schlippe T., Ochs S., Schultz T., Grapheme-to-Phoneme Model Generation for Indo-European Languages. In Proc. ICASSP-2012, Kyoto, Japan, 2012. 43. Huang C., Chang E., Zhou J., Lee K. Accent modeling based on pronunciation dictionary adaptation for large vocabulary Mandarin speech recognition. In Proc. INTERSPEECH-2000, Beijing, China, 2000, pp. 818-821 44. Hannemann M., ―Combinations of Confidence Measures for the Detection of Out-of-Vocabulary Segments in Large Vocabulary Continuous Speech Using Differently Constrained Recognizers‖, Otto-von-Guericke-Universitat Magdeburg, 21. April 2008. 120 45. Bourlard H., Wellekens C.J., ―Links between Markov models and multilayer perceptrons‖, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 12 , No. 12, 1990, pp. 1167-1178. 46. Bourlard H., Hermansky H., Morgan N., ―Towards increasing speech recognition error rates‖, Speech Communication, Vol. 18, 1996, p.p. 205–231. 47. Hornik K., Stinchcombe M., White H., ―Multilayer feedforwardnetworks are universal approximators‖, Neural Netw. Vol. 2(5), 1989, pp. 359–366. 48. Hinton G., Deng L., Yu D., Dahl G., Mohamed A., Jaitly N., Senior A., Vanhoucke V., Nguyen P., Sainath T., Kingsbury B., ―Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups‖, IEEE Signal Process. Mag., Vol. 29, No. 6, Nov. 2012, pp. 82–97. 55. Dong Yu, Li Deng, ―Automatic Speech Recognition. A Deep Learning Approach‖, Springer- Verlag, London. 2015, 321 p. 49. Чистович Л.А. и др., «Руководство по физиологии. Физиология речи. Восприятие речи человеком», «Наука», Ленинград, 1976. 50. Hermansky H., Ellis D., Sharma S., ―Tandem connectionist feature extraction for conventional HMM systems‖, Proc. ICASSP-2000, Istanbul. 2000. V. 3. pp. 1635– 1638. 51. Eng, L., Chen, J., ―Sequence classification using high-level features extracted from deep neural networks.‖ In: Proceedings of the International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2014, pp. 6894-6898. 52. Hochreiter S., Schmidhuber J., ―Long short-term memory.‖ Neural Computation, V. 9(8), 1997, pp. 1735–1780. 53. Pascanu R., Mikolov T., Bengio Y., ―On the difficulty of training recurrent neural networks‖, Cornell University Library, arXiv:1211.5063 [cs.LG], 2013.
Тип вмісту: Master Thesis
Розташовується у зібраннях:172 — телекомунікації та радіотехніка

Файли цього матеріалу:
Файл Опис РозмірФормат 
Zapuska_Polischuk.pdfДипломна робота4,27 MBAdobe PDFПереглянути/відкрити
aref_Polischuk.pdfАвтореферат139,01 kBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора