Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/38283
Назва: Побудова нейронної мережі для розпізнавання мови
Інші назви: A neural network development for speech recognition
Автори: Мартинюк, Володимир Любомирович
Martyniuk, Volodymyr Liubomyrovych
Приналежність: ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна
Бібліографічний опис: Мартинюк В. Л. Побудова нейронної мережі для розпізнавання мови : кваліфікаційна робота освітнього рівня „Бакалавр“ „122 — комп’ютерні науки“ / В. Л. Мартинюк. — Тернопіль : ТНТУ, 2022. — 44 с.
Дата публікації: 23-чер-2022
Дата подання: 4-чер-2022
Дата внесення: 28-чер-2022
Країна (код): UA
Місце видання, проведення: ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Науковий керівник: Приймак, Микола Володимирович
Члени комітету: Бойко, Ігор Володимирович
УДК: 004.9
Теми: нейронна мережа
neural network
розпізнавання мови
speech recognition
згорткова нейронна мережа
convolutional neural network
рекурентна нейронна мережа
recurrent neural network
марковська модель
markov model
machine learning
Короткий огляд (реферат): Дипломна робота присв’ячена розробці нейронної мережі розпізнавання мови. В першому розділі дипломної роботи розглянуто сучасні дослідження, коротка історія розвитку розпізнавання мови, основна теорія нейронної мережі. В другому розділі дипломної роботи розглянуто архітектуру нейронної мережі, обрано інструменти для реалізації нейронної мережі, проведено попередню обробку даних, описано процес навчання, приведено результати роботи. Мета роботи: розробка нейронної мережі розпізнавання мови. Thesis is devoted to neural network development for speech recognition. The first section of the qualification work deals with modern research, a brief history of the development of speech recognition, the basic theory of the neural network. In the second section of the qualification work the architecture of the neural network is considered, the tools for the implementation of the neural network are selected, preliminary data processing is carried out, the learning process is described, the results of the work are given. Object of research: processes of data collection and processing on COVID-19. Purpose: neural network development for speech recognition.
Зміст: ВСТУП 8 РОЗДІЛ 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ЗА ТЕМОЮ РОБОТИ 9 1.1 Історія розвитку методів розпізнавання мови 9 1.2 Класифікація нейронних мереж 10 1.2.1 Приховані Марковські моделі 10 1.2.2 Рекурентні нейронні мережі 11 1.2.3 Довга короткострокова пам’ять 12 1.3 Згорткові нейроні мережі 13 1.4 Connectionist Temporal Classification 15 1.5 Пакетна нормалізація 18 1.6 Висновок до першого розділу 19 РОЗДІЛ 2. ПРОЕКТУВАННЯ ТА НАВЧАННЯ НЕЙРОННОЇ МЕРЕЖІ 20 2.1 Архітектура 20 2.2 Інструменти 22 2.2.1 Python 22 2.2.2 Pandas 23 2.2.3 NumPy 23 2.2.4 LibROSA 23 2.2.5 Tensorflow 24 2.3 Навчальна вибірка 24 2.4 Попередня обробка даних 25 2.4.1 Семплювання 25 2.4.2 Спектрограма 26 2.4.3 Аугментація 27 2.5 Процес навчання 27 2.6 Результати 28 2.7 Висновок до другого розділу 29 РОЗДІЛ 3. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 30 3.1 Оцінка дії шуму і його нормування 30 3.2 Долікарська допомога при вивихах 33 3.3 Висновок до третього розділу 35 ВИСНОВКИ 36 ПЕРЕЛІК ДЖЕРЕЛ 37 ДОДАТКИ
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/38283
Власник авторського права: © Мартинюк Володимир Любомирович, 2022
Перелік літератури: 1. Speech Recognition with Deep Recurrent Neural Networks [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1303.5778/. 2. George Saon, Hong-Kwang J. Kuo, Steven Rennie and Michael Picheny. The IBM 2020 English Conversational Telephone Speech Recognition System [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1811.02058/. 3. W. Xiong, J. Droppo, X. Huang, F. Seide, M. Seltzer, A. Stolcke, D. Yu and G. Zweig. Achieving Human Parity in Conversational Speech Recognition [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1610.05256/. 4. M. Habiba, B. A. Pearlmutter. Continuous Convolutional Neural Networks: Coupled Neural PDE and ODE [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2111.00343/. 5. J. Wu. Introduction to Convolutional Neural Networks [Електронний ресурс] // Режим доступу: https://cs.nju.edu.cn/wujx/paper/CNN.pdf/. 6. A study on data augmentation of reverberant speech for robust speech recognition [Електронний ресурс] // Режим доступу: https://ieeexplore.ieee.org/abstract/document/7953152/. 7. Listen, Attend and Spell [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1508.01211/. 8. Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model & Levenshtein Distance [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1805.08701/. 9. Levenshtein Transformer [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1905.11006/. 10. Exponential convergence rates for Batch Normalization: The power of length-direction decoupling in non-convex optimization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1805.10694/. 11. A Mean Field Theory of Batch Normalization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1902.08129/. 12. Long short-term memory [Електронний ресурс] // Режим доступу: https://en.wikipedia.org/wiki/Long_short-term_memory/. 13. Conditional Image Generation with PixelCNN Decoders [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1606.05328/. 14. Python For Artificial Intelligence [Електронний ресурс] // Режим доступу: https://wiki.python.org/moin/PythonForArtificialIntelligence/. 15. Pandas [Електронний ресурс] // Режим доступу: https://pandas.pydata.org/docs/. 16. Numpy [Електронний ресурс] // Режим доступу: https://numpy.org/doc/stable/. 17. LibROSA [Електронний ресурс] // Режим доступу: https://librosa.org/doc/latest/index.html/. 18. Tensorflow [Електронний ресурс] // Режим доступу: https://www.tensorflow.org/ 19. Mozilla Common Voice Datasets [Електронний ресурс] // Режим доступу: https://commonvoice.mozilla.org/en/datasets 20. How to Listen? Rethinking Visual Sound Localization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2204.05156/. 21. Spectograms [Електронний ресурс] // Режим доступу: https://ccrma.stanford.edu/~jos/mdft/Spectrograms.html 22. Speech Augmentation Based Unsupervised Learning for Keyword Spotting [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2205.14329/. 23. Запорожець О.І. Основи охорони праці / О. І. Запорожець, О. С. Протоєрейський, Г. М. Франчук, І. М. Боровик. – Київ: Основа, 2020. – 264 с. 24. Наказ Міністерства охорони здоров’я України “Про затвердження Державних санітарних норм допустимих рівнів шуму в приміщеннях житлових та громадських будинків і на території житлової забудови” від 22.02.2019 № 281-33252 // Міністерство юстиції України. 2019. 25. Третьяков О. В. Охорона праці 2020 / О. В. Третьяков, В. В. Зацарний, В. Л. Безсонний. – Київ: Основа, 2020. – 361 с. 26. Жидецький В. Ц. Основи охорони праці / В. Ц. Жидецький. — Львів: Афіша, 2018. — 349 с. 27. Долікарська допомога при вивихах [Електронний ресурс] // Режим доступу: https://moz.gov.ua/article/health/travmuvannja-vidi-persha-dopomoga-ta-poradi/.
Тип вмісту: Bachelor Thesis
Розташовується у зібраннях:122 — Компʼютерні науки (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
2022_KRB_SNs-42_Martyniuk_VL_v1.1.pdf672,54 kBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора