Por favor use este identificador para citas ou ligazóns a este item: http://elartu.tntu.edu.ua/handle/lib/38283
Título: Побудова нейронної мережі для розпізнавання мови
Outros títulos: A neural network development for speech recognition
Authors: Мартинюк, Володимир Любомирович
Martyniuk, Volodymyr Liubomyrovych
Affiliation: ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна
Bibliographic description (Ukraine): Мартинюк В. Л. Побудова нейронної мережі для розпізнавання мови : кваліфікаційна робота освітнього рівня „Бакалавр“ „122 — комп’ютерні науки“ / В. Л. Мартинюк. — Тернопіль : ТНТУ, 2022. — 44 с.
Data de edición: 23-Jun-2022
Submitted date: 4-Jun-2022
Date of entry: 28-Jun-2022
Country (code): UA
Place of the edition/event: ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Supervisor: Приймак, Микола Володимирович
Committee members: Бойко, Ігор Володимирович
UDC: 004.9
Palabras chave: нейронна мережа
neural network
розпізнавання мови
speech recognition
згорткова нейронна мережа
convolutional neural network
рекурентна нейронна мережа
recurrent neural network
марковська модель
markov model
machine learning
Resumo: Дипломна робота присв’ячена розробці нейронної мережі розпізнавання мови. В першому розділі дипломної роботи розглянуто сучасні дослідження, коротка історія розвитку розпізнавання мови, основна теорія нейронної мережі. В другому розділі дипломної роботи розглянуто архітектуру нейронної мережі, обрано інструменти для реалізації нейронної мережі, проведено попередню обробку даних, описано процес навчання, приведено результати роботи. Мета роботи: розробка нейронної мережі розпізнавання мови. Thesis is devoted to neural network development for speech recognition. The first section of the qualification work deals with modern research, a brief history of the development of speech recognition, the basic theory of the neural network. In the second section of the qualification work the architecture of the neural network is considered, the tools for the implementation of the neural network are selected, preliminary data processing is carried out, the learning process is described, the results of the work are given. Object of research: processes of data collection and processing on COVID-19. Purpose: neural network development for speech recognition.
Content: ВСТУП 8 РОЗДІЛ 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ЗА ТЕМОЮ РОБОТИ 9 1.1 Історія розвитку методів розпізнавання мови 9 1.2 Класифікація нейронних мереж 10 1.2.1 Приховані Марковські моделі 10 1.2.2 Рекурентні нейронні мережі 11 1.2.3 Довга короткострокова пам’ять 12 1.3 Згорткові нейроні мережі 13 1.4 Connectionist Temporal Classification 15 1.5 Пакетна нормалізація 18 1.6 Висновок до першого розділу 19 РОЗДІЛ 2. ПРОЕКТУВАННЯ ТА НАВЧАННЯ НЕЙРОННОЇ МЕРЕЖІ 20 2.1 Архітектура 20 2.2 Інструменти 22 2.2.1 Python 22 2.2.2 Pandas 23 2.2.3 NumPy 23 2.2.4 LibROSA 23 2.2.5 Tensorflow 24 2.3 Навчальна вибірка 24 2.4 Попередня обробка даних 25 2.4.1 Семплювання 25 2.4.2 Спектрограма 26 2.4.3 Аугментація 27 2.5 Процес навчання 27 2.6 Результати 28 2.7 Висновок до другого розділу 29 РОЗДІЛ 3. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 30 3.1 Оцінка дії шуму і його нормування 30 3.2 Долікарська допомога при вивихах 33 3.3 Висновок до третього розділу 35 ВИСНОВКИ 36 ПЕРЕЛІК ДЖЕРЕЛ 37 ДОДАТКИ
URI: http://elartu.tntu.edu.ua/handle/lib/38283
Copyright owner: © Мартинюк Володимир Любомирович, 2022
References (Ukraine): 1. Speech Recognition with Deep Recurrent Neural Networks [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1303.5778/. 2. George Saon, Hong-Kwang J. Kuo, Steven Rennie and Michael Picheny. The IBM 2020 English Conversational Telephone Speech Recognition System [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1811.02058/. 3. W. Xiong, J. Droppo, X. Huang, F. Seide, M. Seltzer, A. Stolcke, D. Yu and G. Zweig. Achieving Human Parity in Conversational Speech Recognition [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1610.05256/. 4. M. Habiba, B. A. Pearlmutter. Continuous Convolutional Neural Networks: Coupled Neural PDE and ODE [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2111.00343/. 5. J. Wu. Introduction to Convolutional Neural Networks [Електронний ресурс] // Режим доступу: https://cs.nju.edu.cn/wujx/paper/CNN.pdf/. 6. A study on data augmentation of reverberant speech for robust speech recognition [Електронний ресурс] // Режим доступу: https://ieeexplore.ieee.org/abstract/document/7953152/. 7. Listen, Attend and Spell [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1508.01211/. 8. Normalization of Transliterated Words in Code-Mixed Data Using Seq2Seq Model & Levenshtein Distance [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1805.08701/. 9. Levenshtein Transformer [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1905.11006/. 10. Exponential convergence rates for Batch Normalization: The power of length-direction decoupling in non-convex optimization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1805.10694/. 11. A Mean Field Theory of Batch Normalization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1902.08129/. 12. Long short-term memory [Електронний ресурс] // Режим доступу: https://en.wikipedia.org/wiki/Long_short-term_memory/. 13. Conditional Image Generation with PixelCNN Decoders [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/1606.05328/. 14. Python For Artificial Intelligence [Електронний ресурс] // Режим доступу: https://wiki.python.org/moin/PythonForArtificialIntelligence/. 15. Pandas [Електронний ресурс] // Режим доступу: https://pandas.pydata.org/docs/. 16. Numpy [Електронний ресурс] // Режим доступу: https://numpy.org/doc/stable/. 17. LibROSA [Електронний ресурс] // Режим доступу: https://librosa.org/doc/latest/index.html/. 18. Tensorflow [Електронний ресурс] // Режим доступу: https://www.tensorflow.org/ 19. Mozilla Common Voice Datasets [Електронний ресурс] // Режим доступу: https://commonvoice.mozilla.org/en/datasets 20. How to Listen? Rethinking Visual Sound Localization [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2204.05156/. 21. Spectograms [Електронний ресурс] // Режим доступу: https://ccrma.stanford.edu/~jos/mdft/Spectrograms.html 22. Speech Augmentation Based Unsupervised Learning for Keyword Spotting [Електронний ресурс] // Режим доступу: https://arxiv.org/abs/2205.14329/. 23. Запорожець О.І. Основи охорони праці / О. І. Запорожець, О. С. Протоєрейський, Г. М. Франчук, І. М. Боровик. – Київ: Основа, 2020. – 264 с. 24. Наказ Міністерства охорони здоров’я України “Про затвердження Державних санітарних норм допустимих рівнів шуму в приміщеннях житлових та громадських будинків і на території житлової забудови” від 22.02.2019 № 281-33252 // Міністерство юстиції України. 2019. 25. Третьяков О. В. Охорона праці 2020 / О. В. Третьяков, В. В. Зацарний, В. Л. Безсонний. – Київ: Основа, 2020. – 361 с. 26. Жидецький В. Ц. Основи охорони праці / В. Ц. Жидецький. — Львів: Афіша, 2018. — 349 с. 27. Долікарська допомога при вивихах [Електронний ресурс] // Режим доступу: https://moz.gov.ua/article/health/travmuvannja-vidi-persha-dopomoga-ta-poradi/.
Content type: Bachelor Thesis
Aparece nas Coleccións122 — Компʼютерні науки (бакалаври)

Arquivos neste item
Arquivo Descrición TamañoFormato 
2022_KRB_SNs-42_Martyniuk_VL_v1.1.pdf672,54 kBAdobe PDFVer/abrir


Todos os documentos en Dspace estan protexidos por copyright, con todos os dereitos reservados

Ferramentas administrativas