Använd denna länk för att citera eller länka till detta dokument:
http://elartu.tntu.edu.ua/handle/lib/51436| Title: | Спосіб розпізнавання голосових команд керування промисловими електромеханічними пристроями |
| Other Titles: | Method for voice commands recognizing for controlling industrial electromechanical devices |
| Authors: | Федунь, Андрій Михайлович Fedun, Andriy |
| Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя, факультет прикладних інформаційних технологій та електроінженерії, м. Тернопіль, Україна |
| Bibliographic description (Ukraine): | Федунь А.М. Спосіб розпізнавання голосових команд керування промисловими електромеханічними пристроями: кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „172 — електронні комунікації та радіотехніка“ / А.М. Федунь. — Тернопіль: ТНТУ, 2025. — 83 с. |
| Issue Date: | dec-2025 |
| Submitted date: | dec-2025 |
| Date of entry: | 27-jan-2026 |
| Publisher: | Тернопільський національний технічний університет імені Івана Пулюя |
| Country (code): | UA |
| Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя |
| Supervisor: | Яворський, Богдан Іванович Yavorsky, Bohdan |
| Committee members: | Дедів, Леонід Євгенович Dediv, Leonid |
| UDC: | 621.372.852.15 |
| Keywords: | 172 телекомунікації та радіотехніка команда керування інтерфейс голос command control interface voice |
| Page range: | 83 |
| Abstract: | В роботі розроблено спосіб ідентифікації голосових команд керування промисловими електромеханічними пристроями. В способі розпізнавання використано метод опрацювання голосових сигналів, що являють собою записані з допомогою мікрофона команди, після чого виконується обробка сигналу та виділення інформативних ознак, за якими здійснюється розпізнавання. Основними етапами методу є: запис мовного сигналу та підготовка даних для аналізу; адаптивна фільтрація з метою зменшення впливу шумів; визначення часових меж (тривалості) команд методом ковзного вікна; фонемна сегментація команд на основі аналізу частоти основного тону. Частота основного тону оцінювалась методом формантного аналізу, а її наявність у кожному ковзному вікні фіксувалась через порогову функцію. Послідовність інтервалів із наявною/відсутю частоти основного тону, а також загальна тривалість команди запропоновано використати як критерії для ідентифікації команди та подальшого формування відповідного сигналу керування. The paper developed a method for voice commands recognizing for controlling industrial electromechanical devices. The recognition method uses a method for processing voice signals, which are commands recorded using a microphone, after which the signal is processed and informative features are extracted, by which recognition is carried out. The main stages of the method are: recording a speech signal and preparing data for analysis; adaptive filtering to reduce the impact of noise; determining the time limits (duration) of commands using the sliding window method; phonemic segmentation of commands based on the analysis of the fundamental tone frequency. The fundamental tone frequency was estimated using the formant analysis method, and its presence in each sliding window was recorded using a threshold function. The sequence of intervals with the presence/absence of the fundamental tone frequency, as well as the total duration of the command are proposed to be used as criteria for identifying the command and further forming the corresponding control signal. |
| Content: | ВСТУП 8 РОЗДІЛ 1. АНАЛІТИЧНА ЧАСТИНА 10 1.1 Аналіз проблеми голосовиго керування промисловим обладнанням 10 1.2 Задача керування промисловими верстатами за допомогою голосового інтерфейсу 13 1.3 Обробка природної мови (NLP) 14 1.4 Інтерфейси людина–машина та голосовий інтерфейс 15 1.5 Голосові інтерфейси у виробництві 18 1.6 Архітектура голосового інтерфейсу 19 1.7 Концептуальна структура 20 1.8 Приклад реалізації голосового інтерфейсу 23 1.9 Переваги та недоліки голосових інтерфейсів для керування промисловим обладнанням 25 1.10 Висновки до розділу 1 28 РОЗДІЛ 2. ОСНОВНА ЧАСТИНА 29 2.1 Оцінка ефективності голосового керування промисловим обладнанням 29 2.2 Поняття голосової команди та задача розпізнавання 36 2.3 Загальна структура системи розпізнавання команд 36 2.4 Методи та ознаки для розпізнавання голосових команд у системах керування 37 2.5 Підходи до розпізнавання команд при голосовому керуванні 38 2.6 Висновки до розділу2 41 РОЗДІЛ 3. НАУКОВО-ДОСЛІДНА ЧАСТИНА 43 3.1 Принцип роботи пропонованого способу 43 3.2 Експериментальні результати 47 56 3.3 Висновки до розділу 3 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 57 4.1 Охорона праці 57 4.2 Безпека в надзвичайних ситуаціях 58 4.3 Висновки до розділу 65 ВИСНОВКИ 66 ПЕРЕЛІК ПОСИЛАНЬ 68 ДОДАТКИ |
| URI: | http://elartu.tntu.edu.ua/handle/lib/51436 |
| Copyright owner: | © Федунь Андрій Михайлович, 2025 |
| References (Ukraine): | 1. Liu, C., Zheng, P., Xun, X., 2023. ’Digitalisation and servitisation of machine tools in the era of Industry 4.0: a review’. In: International Journal of Production Research,61, 4069-4101. 2. Chao L., Hrishikesh V., Yuqian L., Xun X., 2019. ’Cyber-Physical Machine Tools Platform using OPC UA and MTConnect’. In: Journal of Manufacturing Systems 51, 61–74. 3. Reshamwala, A., Mishra, D., Pawar, P., 2013. ’REVIEW ON NATURAL LANGUAGE PROCESSING’. In: IRACST – Engineering Science and Technology: An International Journal (ESTIJ) 3, 113–116 4. Nadkarni, P. M., Ohno-Machado, L., Chapman, W., 2011. Natural language processing: an introduction. In: Journal of the American Medical Informatics Association,18, 544–551. 5. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, Aidan N., Kaiser, Ł., Polosukhin, I., 2017. ’Attention is All you Need’. In: Advances in Neural Information Processing Systems 3. 6. Devlin, J., Chang, M., Lee, K., Toutanova, K., 2018. ’ BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding’. In: ArXiv 7. Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., Neelakantan, A., Shyam, P., Sastry, G., Askell, A., Agarwal, S., Krueger, G., Henighan, T., Child, R., Ramesh, A., Ziegler, D. M., Wu, J., Winter, C., Hesse, C., Amodei, D., 2020. ’Language Models are Few-Shot Learners’. In:ArXiv 8. Krupitzer, C., MuЁller, S., Lesch, V., M., Edinger, J., Lemken, A., SchaЁfer, D., Kounev, S., Becker, C.,2020. ’A Survey on Human Machine Interaction in Industry 4.0.’ In:ArXiv 9. Mertes J., Lindenschmitt D., Amirrezai M., Tashakor N.,…,2022. ’Evaluation of 5G-capable framework for highly mobile, scalable human-machine interfaces in cyber-physical production systems’. In: Journal of Manufacturing Systems. 10. Benzeghiba M., De Mori R., Deroo O., Dupont S., Erbes T., Jouvet D., Fissore L., Laface P., Mertins A., Ris C., Rose R., Tyagi V., Wellekens C. ’Automatic speech recognition and speech variability: A review’. In: Speech Communication. 49, 763–786 11. Valle, R., Shih, K., Prenger, R.,Catanzaro, B.,2020. Flowtron: An Autoregressive Flow-based Generative Network for Text-to-Speech Synthesis. In:ArXiv. 12. Gayathri, N., Sundar M., Sargurunathan R., Sudharsan R., Sajith A., 2022. Design of Voice Controlled Multifunctional Computer Numerical Control (CNC) Machine, In: International Conference on Inventive Computation Technologies (ICICT), 657–663. 13. Fedosov, Y., Katridi, A., 2018. Concept of Implementing Computer Voice Control for CNC machines Using Natural Language Processing. In: Manufacturing Letters, 15,89–92. 14. M. Ya. Afanasev et al., “A concept for integration of voice assistant and modular cyber-physical production system," in Proc. IEEE 17th Int. Conf. Ind. Informat. (INDIN), Helsinki, Finland, vol. 1, Jul. 2019, pp. 27-32. 15. V Priyadarshana et al., “Voice controlled robot manipulator for industrial applications," in Proc. IEEE 13th Annu. Inf. Technol., Electron. Mobile Commun. Conf. (IEMCON), Vancouver, BC, Canada Oct. 2022, pp. 0160-0165. 16. S. S. Yadav, P. Kumar, S. Kumar, and S. Singh, “Google assistant controlled home automation with voice recognition," in Proc. 3rd Int. Conf. Adv. Comput., Commun. Control Netw. (ICACN), Noida, India, Dec. 2021, pp. 1039-1044. 17. F. Longo and A. Padovano, “Voice-enabled assistants of the operator 4.0 in the social smart factory: Prospective role and challenges for an advanced human machine interaction," Manuf. Lett., vol. 26, pp. 12-16, Oct. 2020. 18. M. Ya. Afanasev et al., “A concept for integration of voice assistant and modular cyber-physical production system," in Proc. IEEE 17th Int. Conf. Ind. Informat. (INDIN), Helsinki, Finland, vol. 1, Jul. 2019, pp. 27-32. 19. D. Hirschfeld and K. Rottmayr, Voice Control—Ready for Automation: Warum Sprachinteraktion in Zukunft Grafische Bedienkonzepte Erweitern Oder Sogar ablösen Wird, voice INTER connect, Dresden, Germany, Spectra GmbH & Co. KG, Reutlingen, Germany, Aug. 2020. [Online]. 20. J. F. Kelley, “An empirical methodology for writing user-friendly natural language computer applications," in Proc. SIGCHI Conf. Human Factors Comput. Syst., Boston, MA, USA, 1983, pp. 193-196. 21. C. Spille, B. Kollmeier, and B. T. Meyer, “Comparing human and automatic speech recognition in simple and complex acoustic scenes," Comput. Speech Lang., vol. 52, pp. 123-140, Nov. 2018, doi: 10.1016/j.csl.2018.04.003. 22. J. Lazar, J. H. Feng, and H. Hochheiser, Research Methods in Human Computer Interaction. Cambridge, MA, USA: Elsevier Morgan Kauf-mann Publishers, 2017, pp. 33-67. 23. V Peddinti, D. Povey, and S. Khudanpur, “A time delay neural network architecture for efficient modeling of long temporal contexts," in Proc. Interspeech, Sep. 2015, pp. 3214-3218. 24. S. Ganapathy and V Peddinti, “3-D CNN models for far-field multi-channel speech recognition," in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), Calgary, AB, Canada, Apr. 2018, pp. 5499-5503. 25. D. Povey et al., “Purely sequence-trained neural networks for ASR based on lattice-free MMI," in Proc. Interspeech, Sep. 2016, pp. 2751-2755. 26. Dozorskyi V., Dediv I., Sverstiuk S., Nykytyuk V., Karnaukhov A. The Method of Commands Identification to Voice Control of the Electric Wheelchair. Proceedings of the 1st International Workshop on Computer Information Technologies in Industry 4.0 (CITI 2023). CEUR Workshop Proceedings. Ternopil, Ukraine, June 14-16, 2023. P.233-240. ISSN 1613-0073. 27. Khvostivska L., Khvostivskyi M., Dediv I., Yatskiv V., Palaniza Y. Method, Algorithm and Computer Tool for Synphase Detection of Radio Signals in Telecommunication Networks with Noises. Proceedings of the 1st International Workshop on Computer Information Technologies in Industry 4.0 (CITI 2023). CEUR Workshop Proceedings. Ternopil, Ukraine, June 14-16, 2023. P.173-180. ISSN 1613 0073. 28. Khvostivska L., Khvostivskyi M., Dunets V., Dediv I. Mathematical, algorithmic and software support of synphase detection of radio signals in electronic communication networks with noises. Scientific Journal of TNTU (Tern.), vol 111, no 3, 2023. pp. 48–57. 29. Основи технології радіоелектронних апаратів : навчальний посібник / Р. А. Ткачук, В. Г. Дозорський, Л. Є. Дедів, І. Ю. Дедів. - Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2017. - 336 с. 30. Dozorskyi V., Dediv L., Kovalyk S., Dozorska O., Dediv I. (2024) Design of the endoskeleton of a biocontrolled hand prosthesis. Scientific Journal of TNTU (Tern.), vol. 115, no 3, pp. 100-111. 31. Дедів І. Ю. Метод автентифікації користувачів за параметрами голосових сигналів / І. Ю. Дедів, М. М. Кузик // Збірник тез доповідей Ⅵ Міжнародної науково-технічної конференції молодих учених та студентів „Актуальні задачі сучасних технологій“, 16-17 листопада 2017 року. Т.: ТНТУ, 2017. Том 2. С. 47. 32. Методичні рекомендації до виконання, оформлення та захисту кваліфікаційних робіт для здобувачів другого (магістерського) рівня вищої освіти за спеціальністю 172 «Електронні комунікації та радіотехніка» галузі знань 17 «Електроніка, автоматизація та електронні комунікації»/уклад.: Дунець В.Л., Хвостівська Л.В., Дедів І.Ю. Тернопіль: ТНТУ, 2024. 56 с. 33. Математичне та комп’ютерне моделювання електрокардіосиґналів у системах голтерівського моніторинґу / Л.Є. Дедів, А.С. Сверстюк, І.Ю. Дедів, М.О. Хвостівський, В.Г. Дозорський, Є.Б. Яворська. – Львів: Видавництво «Магнолія - 2006», 2021. – 120 с. ISBN 978-617-574-218-1. 34. Математичне моделювання, методи та програмне забезпечення опрацювання дихальних шумів у комп'ютерних аускультативних діагностичних системах / І.Ю. Дедів, А.С. Сверстюк, Л.Є. Дедів, В.Г. Дозорський, М.О. Хвостівський. – Львів: Видавництво «Магнолія - 2006», 2021. – 126 с. ISBN 978 617-574-219-8. 35. Методичні рекомендації з оформлення кваліфікаційних робіт бакалавра за спеціальністю 172 «Телекомунікації та радіотехніка» уклад.: Дунець В.Л., Хвостівський М.О. Дедів І.Ю. Тернопіль: ТНТУ імені Івана Пулюя, 2021 р. – 72с. 36. Дозорський В.Г., Дозорська О.Ф., Дедів Л.Є., Дедів І.Ю., Паньків І.М., Яворська Є.Б. Структура системи відбору біосигналів для задачі відновлення комунікативної функції людини. Вісник Хмельницького національного університету: технічні науки. – Хмельницький: редакція журналу "Вісник Хмельницького національного університету". – 2019. - №2(271) – с. 183-186. 37. Dozorska O., Yavorska E., Dozorskyi V., Pankiv I., Dediv L. Dediv I. The Method of Indirect Restoration of Human Communicative Function. Proc. of the 15th International Conference on the Experience of Designing and Application of CAD Systems (CADSM), CADSM'2019, (pp. 19–22). Polyana-Svalyava (Zakarpattya), UKRAINE 978-1-7281-0053-1/19. 38. Дозорська О.Ф., Яворська Є.Б., Дозорський В.Г., Дедів Л.Є., Дедів І.Ю. Метод виявлення ознак основного тону в структурі електроміографічних сигналів для задачі компенсації порушеної комунікативної функції людини», Вісник НТУУ "КПІ". Серія Радіотехніка, Радіоапаратобудування, (81), с. 56-64. doi: 10.20535/RADAP.2020.81.56-64. 39. Khvostivska L., Khvostivskyy M., Dunetc V., Dediv I.. Mathematical and Algorithmic Support of Detection Useful Radiosignals in Telecommunication Networks. 2nd International Workshop on Information Technologies: Theoretical and Applied Problems, ITTAP 2022. CEUR Workshop Proceedings. Ternopil 22- 24 November 2022. Vol 3309, P. 314-318. ISSN 1613-0073. 40. Гевко О.В., Дозорський В.Г., Дедів Л.Є., Дедів І.Ю., Дозорська О.Ф. Структурний синтез вібромасажної апаратури. Перспективні технології та прилади, № 20, Луцьк, 2022. – с. 23-31. 41. Dozorskyi V., Dediv I., Sverstiuk S., Nykytyuk V., Karnaukhov A. The Method of Commands Identification to Voice Control of the Electric Wheelchair. Proceedings of the 1st International Workshop on Computer Information Technologies in Industry 4.0 (CITI 2023). CEUR Workshop Proceedings. Ternopil, Ukraine, June 14-16, 2023. P.233-240. ISSN 1613-0073. 42. Khvostivska L., Khvostivskyi M., Dediv I., Yatskiv V., Palaniza Y. Method, Algorithm and Computer Tool for Synphase Detection of Radio Signals in Telecommunication Networks with Noises. Proceedings of the 1st International Workshop on Computer Information Technologies in Industry 4.0 (CITI 2023). CEUR Workshop Proceedings. Ternopil, Ukraine, June 14-16, 2023. P.173-180. ISSN 1613 0073. 43. Khvostivska L., Khvostivskyi M., Dunets V., Dediv I. Mathematical, algorithmic and software support of synphase detection of radio signals in electronic communication networks with noises. Scientific Journal of TNTU (Tern.), vol 111, no 3, 2023. pp. 48–57. 44. Основи технології радіоелектронних апаратів : навчальний посібник / Р. А. Ткачук, В. Г. Дозорський, Л. Є. Дедів, І. Ю. Дедів. - Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2017. - 336 с. 45. Dozorskyi V., Dediv L., Kovalyk S., Dozorska O., Dediv I. (2024) Design of the endoskeleton of a biocontrolled hand prosthesis. Scientific Journal of TNTU (Tern.), vol. 115, no 3, pp. 100-111. 46. Техноекологія та цивільна безпека. Частина «Цивільна безпека». Навчальний посібник / В.С. Стручок, – Тернопіль: ТНТУ ім. І.Пулюя, 2022. – 150 с. 47. Стручок В.С. Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної бо та заочної (дистанційної) форм навчання / В.С.Стручок. — Тернопіль: ФОП Паляниця В. А., 2022. — 156 с. 48. Паляниця Ю., Дунець В., Дедів І., Хвостівська Л., Сверстюк А. Розвиток концепції Smart Systems та Mobility as a Service: тенденції останнього десятиліття. Вісник Хмельницького національного університету. Серія: Технічні наук. Том 349. № 2. 2025. С. 549-560. 49. Хвостівський М.О., Хвостівська Л.В., Дедів І.Ю., Дедів Л.Є. Інтелектуальна система прогнозування трафіку комп’ютерних мереж на основі синфазної обробки даних. Вісник Херсонського національного технічного університету: технічні науки. – Херсон: редакція журналу " Вісник Херсонського національного технічного університету ". – 2025. - №3(94) Т.2 – с. 497-503. |
| Content type: | Master Thesis |
| Ebben a gyűjteményben: | 172 — телекомунікації та радіотехніка, Електронні комунікації та радіотехніка |
Fájlok a dokumentumban:
| Fájl | Leírás | Méret | Formátum | |
|---|---|---|---|---|
| Федунь_А_М_РАм-61.pdf | 3,15 MB | Adobe PDF | Megtekintés/Megnyitás |
Minden dokumentum, ami a DSpace rendszerben szerepel, szerzői jogokkal védett. Minden jog fenntartva!
Administrativa verktyg