Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/36502
Назва: Метод розпізнавання голосових сигналів для керування комп’ютерними системами вимірювань
Інші назви: Method of recognition of voice signals for control of computer systems radiometric
Автори: Андрейчук, Богдан Валерійович
Andreichuk, Bogdan
Приналежність: ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна
Бібліографічний опис: Андрейчук Б. В. Метод розпізнавання голосових сигналів для керування комп’ютерними системами : кваліфікаційна робота магістра за спеціальністю „172 — телекомунікації та радіотехніка“ / Б. В. Андрейчук. – Тернопіль : ТНТУ, 2021. – 95 c.
Дата публікації: гру-2021
Дата подання: гру-2021
Дата внесення: 19-гру-2021
Видавництво: ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра біотехнічних систем, м. Тернопіль, Україна
Країна (код): UA
Місце видання, проведення: ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра біотехнічних систем, м. Тернопіль, Україна
Науковий керівник: Дунець, Василь Любомирович
Dunets Vasyl, Vasyl
Члени комітету: Хвостівський, Микола Орестович
Khvostivskyi, Mykola
УДК: 519.218:612.78
Теми: 172
телекомунікації та радіотехніка
мовний сигнал
спектральний аналіз
перетворення Фур’є
вейвлет аналіз
кепстральний аналіз
евклідова відстань
інформативні ознаки
speech signal
spectral analysis
fouret's transformation
wavelet analysis
capstral analysis
informative sings
Короткий огляд (реферат): В кваліфікаційній роботі здійснено порівняльний аналіз застосування різних вимірювань близькості та векторних ознак, який показав, що найбільш придатними для завдань розпізнавання векторами ознак можна вважати: мел-кепстральні коефіцієнти та розподіл інформаційних інтервалів мовного сигналу для керування комп’ютерними системами.
In the qualification work, a comparative analysis of the use of different measurements of proximity and vector features, which showed that the most suitable for recognition tasks vector features can be considered: mel-keppstral coefficients and distribution of information intervals of speech signal to control computer systems.
Зміст: ВСТУП 8 РОЗДІ 1. ОСНОВНА ЧАСТИНА 11 1.1. Сучасний стан напряму розпізнавання мовних сигналів 11 1.2. Особливості мовлення та сприйняття мови людиною 16 1.2.1. Мовний апарат 17 1.2.2. Сприйняття мовного сигналу людиною 20 1.3 Методи цифрової обробки сигналів у задачах розпізнавання мовних сигналів 26 1.3.1. Спектральний аналіз 26 1.3.2. Віконний аналіз у базисі Фур'є 27 1.3.3. Вейвлет аналіз 27 1.3.4. Кепстральний аналіз 29 1.4 Субсмуговий підхід до обробки мовних сигналів 32 1.5 Висновки до розділу 1 33 РОЗДІЛ 2. ОСНОВНА ЧАСТИНА 34 2.1. Акустико-фонетичний підхід до розпізнавання мовних сигналів 34 2.2. Обчислювальні аспекти субсмугового аналізу мовних сигналів у задачах ідентифікації 37 2.3. Дослідження просторів ознак у задачах розпізнавання мовних сигналів 43 2.3.1. Декомпозиція сигналу банком фільтрів 43 2.3.2. Розподіл миттєвих енергій відрізка МС 45 2.3.3. Розподіл часток енергії відрізка МС 47 2.3.4. Розподіл інформаційних інтервалів відрізка МС 49 2.3.5. Частота переходів через нуль 52 2.3.6. Ширина частотної області, що займає сигнал 55 2.3.7. Мел-кепстральні коефіцієнти мовного сигналу 60 2.4. Заходи близькості у задачах розпізнавання мовних сигналів 63 2.4.1. Євклідова відстань 63 2.4.2. Середньоквадратичне відхилення 63 2.4.3. Відстань Махаланобіса 64 2.4.4. Кореляція послідовностей 64 2.4.5. Динамічна трансформація тимчасової шкали 65 2.5. Висновки до розділу 2 67 РОЗДІЛ 3. НАУКОВО-ДОСЛІДНА ЧАСТИНА 68 3.1. Методика оцінки методів розпізнавання мовних сигналів 68 3.2 Дослідження підходів до розпізнавання мовних сигналів 72 3.3. Висновки до розділу 3 80 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 81 4.1. Охорона праці 81 4.2. Безпека в надзвичайних ситуаціях 84 4.3. Висновки до розділу 4 86 ВИСНОВКИ 87 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 88 Додаток А. Копія тези конференції 93
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/36502
Власник авторського права: © Андрейчук Богдан Валерійович, 2021
Перелік літератури: 1. Аграновский, А.В. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов [Текст]/ А.В. Аграновский, Д.А. Леднов – М.: Радио и связь, 2004. – 164 с.
2. Алдошина, И.А. Слуховые модели восприятия линейных и нелинейных искажений в музыке и речи. Часть1 [Текст] / И.А. Алдошина // Информационно-технический журнал «Звукорежиссер». - 2006. - №3. – С.38-44.
3. Ананьев, Б. Г. Теория ощущений. — Л., 1961. — С. 579. — 928 с.
4. Вапник, В. Н. Теория распознавания образов [Текст] / Вапник В. Н., Червоненкис А. Я. / М.: Наука, 1974
5. Винцюк, Т.К., Анализ, распознавание и интерпретация речевых сигналов [Текст]/ Винцюк Т.К. - Киев: Наук.думка, 1987. - 264с.
6. Воеводин, В.В. Матрицы и вычисления [Текст] / В.В. Воеводин, Ю.А. Кузнецов. – М.: Наука, 1984. – 318 с.
7. Воронцов К.В. Математические методы обучения по прецедентам [Текст]/ материалы лекций МФТИ – М., 2008
8. Герасимов, А.В. Применение метода модифицированного линейного предсказания к задачам выделения акустических признаков речевых сигналов [Текст] / А.В.Герасимов, О.А. Морозов, В.Р. Фидельман // Радиотехника и Электроника. – 2005. – том 50. №10. – С. 1287-1292.
9. Гребнов, С.В. Аналитический обзор методов распознавания речи в системах голосового управления [Текст]/ С.В. Гребнов // Вестник ИГЭУ. – 2009. – Вып.3. – С.83-85.
10. Гривен, В.Г. Введение в Вейвлет преобразование / АВТЭКС, СанктПетербург, 2009, С. 302
11. Губочкин, И.В. Разработка алгоритмов анализа и распознавания речи на основе адаптивной кластерной модели и критерия минимального информационного рассогласования [Текст]: автореф. дис. канд. техн наук / И.В. Губочкин – Нижний Новгород: НГЛУ, 2011. – 22с.
12. Гудонавичюс, Р.В. Распознавание речевых сигналов по их структурным свойствам [Текст]/Р.В. Гудонавичюс, П.П. Кемешис, А.Б. Читавичюс – Л.: «Энергия», 1977. – 64 с.
13. Деркач, М.Ф. Динамические спектры речевых сигналов [Текст]/ М.Ф. Деркач, Р.Я. Гумецкий, Б.М. Гура, М.Е. Чабан – Львов: Виша школа. Издво при Львов. ун-те, 1983. – 168 с.
14. Жиляков, Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным: моногр. [Текст] / Е.Г. Жиляков. – Белгород: Изд-во БелГУ, 2007. – 160 с.
15. Жиляков, Е.Г. Методы обработки речевых данных в информационно-телекоммуникационных системах на основе частотных представлений [Текст]/ Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко. – Белгород: Изд-во БелГУ, 2007. - 136 с.
16. Жиляков, Е.Г. Модели распределения энергии звуков русской речи на основе частотных представлений [Текст] / Е.Г. Жиляков, А.В. Болдышев, А.А. Фирсова// XXIII Международной научной конференции Математические методы в технике и технологиях – Саратов. – 2010. – С.236-239.
17. Жиляков, Е.Г. Частотный анализ речевых сигналов [Текст] / Е.Г. Жиляков, Е.И. Прохоренко // Научные ведомости Белгородского государственного университета. Сер. Информатика и прикладная математика – 2006. – №2(31), выпуск 3. – С.201-208.
18. Засыпкин, А.В. О дикторонезависимой системе голосового телефонного номеронабирателя [Текст] / А.В. Засыпкин, А.Т. Мицевич, М.В. Овецкий, В.Ю. Шелепов// Труды международной конференции “ЗнаниеДиалог-Решение”. – Ялта. – 1995. – С.427-430.
19. Кавальчук, А.Н. (2011), "Формула для перехода из области частот к шкале барков и обратно," А.Н. Кавальчук, Ал.А. Петровский // Информатика, 2011, 4(32), стр. 71-81
20. Каганов, А.Ш. Криминалистическая экспертиза звукозаписей. – М.: "Юрлитинформ", 2005. - 272с.
21. Кипяткова И.С. Автоматическая обработка разговорной русской 91 речи: монография / И.С. Кипяткова , А.Л. Ронжин, А.А. Карпов. СПИИРАН – СПб.: ГУАП, 2013. – 314 с.
22. Колерс, П.А. Распознавание образов. Исследование живых и автоматических распознающих систем [Текст]/ П.А. Колерс, Е.Д. Мюрей, пер. Л.И. Титомира – М.: «Мир», 1970. – 288 с.
23. Ле, Н.В. Распознавание речи на основе искусственных нейронных сетей [Текст] / Н.В. Ле, Д.П. Панченко // Технические науки в России и за рубежом: материалы междунар. заоч. науч. конф.– Москва. – 2011. – С.8-11.
24. Леонович, А.А. Современные технологии распознавания речи [Текст] /А.А. Леонович // Материалы конференции «Диалог: Компьютерная лингвистика и интеллектуальные технологии». – Звенигород. – 2005.
25. Ли, У.А. Методы автоматического распознавания речи. [Текст] В 2- х книгах. Кн.1. / Пер. с англ./Под ред. У.Ли. – М.; Мир, 1983. –328 с.
26. Ли, У.А., Методы автоматического распознавания речи. [Текст] В 2- х книгах. Кн.2. /Пер. с англ. Под ред. У.Ли. – М.; Мир, 1983. – 392 с.
27. Мазуренко, И.Л. Компьютерные системы распознавания речи [Текст] / И.Л. Мазуренко // Интеллектуальные системы. – Москва. – 1998. – т.3. вып. 1-2. – С.117-134.
28. Мазуренко, И.Л. Одна модель распознавания речи [Текст] / И.Л. Мазуренко // Компьютерные аспекты в научных исследованиях и учебном процессе. – Москва – 1996 – С.107-112.
29. Малла, С. Вэйвлеты в обработке сигналов [Текст] / М.: Мир, 2005. — 672 с.
30. Ниценко, А.В. Алгоритмы пофонемного распознавания слов наперед заданного словаря [Текст] / А.В. Ниценко, В.Ю. Шелепов // Искусственный интеллект. – 2004. – С.633-639.
31. Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ./Под ред. С. Я. Шаца. — М.: Связь, 1979. 416 с., ил.
32. Рабинер, Л. Теория и применение цифровой обработки сигналов [Текст] / Л.Рабинер, Б.Гоулд – М.: Мир, 1978. – 848с.
33. Рабинер, Л.Р. Цифровая обработка речевых сигналов [Текст] / Л.Р. 92 Рабинер, Р.Ф. Шафер – М.: Радио и связь, 1981. – 496 с
34. Сергиенко А.Б. Цифровая обработка сигналов. 2 – изд. – СПб.: Питер, 2006. – 608 с.
35. Сорокин, В.Н. Артикуляторно-ориентированная система распознавания речи [текст] / В.Н. Сорокин, А.Н. Ижнин, А.И. Цыплихин, Д.Н. Чепелев // Труды Международного семинара «Диалог - 2003». – 2003. С.657- 662.
36. Смоленцев, Н. К. Введение в теорию вейвлетов [Текст] /Ижевск: РХД, 2010. — 292 с.
37. Сорокин, В.Н. Сегментация и распознавание гласных [Текст] / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. – 2004. – Т.4, №2. – С. 202-220.
38. Сорокин, В.Н. Теория речеобразования [Текст] / В.Н. Сорокин – М.: Радио и связь, 1985. – 312 с.
39. Фланаган, Дж. Л. Анализ, синтез и восприятие речи [Текст]/ пер.с англ. А.А. Пирогова. – М.:Связь, 1968. – 397с.
40. Чистович, Л.А. Физиология речи. Восприятие речи человеком [Текст] /Л.А. Чистович, А.И. Венцов, М.П. Гранстрем и др. – М.: Наука, 1976. – 388 с.
41. Шелепов, В.Ю. К проблеме пофонемного распознавания [Текст] / В.Ю. Шелепов, А.В. Ниценко // Искусственный интеллект. – 2005. – №4. – С.662-668.
42. Шелухин, О.И. Цифровая обработка и передача речи [Текст] / О.И. Шелухин, Н.Ф.Лукьянцев; под ред. О.И. Шелухина. – М.: Радио и связь, 2000. – 456с.
43. Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. — Киев: Наукова думка, 2004.
44. Allen, J.B., "How Do Humans Process and Recognize Speech?," IEEE Trans. On Speech and Audio Processing, 1994, 2(4), pp. 567-577.
45. Al-Naymat Ghazi, Chawla Sanjay, Taheri Javid “Sparse DTW: A novel approach to speed up Dynamic Time Warping” Proc. of the 8th Australasian Data 93 Mining Conference (AusDM'09) p. 117-127; (2009)
46. Bishop, C. M. Pattern Recognition and Machine Learning. — Springer, Series: Information Science and Statistics, 2006. — 740 pp
48. Eamonn J. Keogh, Michael J. Pazzani Derivative Dynamic Time Warping, Section 1Proceedings of the sixth ACM SIGKDD, 2010
49. Giannakopoulos T. Introduction to Audio Analysis: A Matlab Approach 1 st Edition / Theodoros Giannakopoulos, Aggelos Pikrakis / Academic Press; 1 edition (April 21, 2014), p. 288
50. Huang X.D. Spoken Language Processing: A Guide to Theory, Algorithm and System Development [Text]/ Xuedong Huang, Alex Acero, HsiaoWuen Hon/ Prentice Hall PTC, New Jersey, 2001
51. Mahalanobis, Prasanta Chandra (1936). «On the generalised distance in statistics». Proceedings of the National Institute of Sciences of India 2 (1): 49–55.
52. Stevens, Stanley Smith; Volkmann; John; & Newman, Edwin B. (1937). "A scale for the measurement of the psychological magnitude pitch". Journal of the Acoustical Society of America 8 (3): 185–190.
Тип вмісту: Master Thesis
Розташовується у зібраннях:172 — телекомунікації та радіотехніка

Файли цього матеріалу:
Файл Опис РозмірФормат 
Dyplom_Andreychuk.pdf2,98 MBAdobe PDFПереглянути/відкрити
Авторська_довідка_Андрейчук_Б_В.doc47 kBMicrosoft WordПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора