Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://elartu.tntu.edu.ua/handle/lib/36678
Назва: | Метод розпізнавання нечітких символів з використанням нейронної мережі |
Інші назви: | Method of fuzzy character recognition using a neural network |
Автори: | Щіпський, Анатолій Володимирович Shchipsky, Anatoly |
Приналежність: | ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна |
Бібліографічний опис: | Щіпський А. В. Метод розпізнавання нечітких символів з використанням нейронної мережі : кваліфікаційна робота магістра за спеціальністю 172 Телекомунікації та радіотехніка / А. В. Щіпський. – Тернопіль : ТНТУ, 2021. – 73 c. |
Дата публікації: | гру-2021 |
Дата подання: | гру-2021 |
Дата внесення: | 19-гру-2021 |
Видавництво: | ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна |
Країна (код): | UA |
Місце видання, проведення: | ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна |
Науковий керівник: | Дунець, Василь Любомирович Dunets, Vasyl |
Члени комітету: | Хвостівський, Микола Орестович Khvostivskyi, Mykola |
УДК: | 621.394.623 |
Теми: | 172 телекомунікації та радіотехніка розпізнавання тексту локалізація тексту нейронні мережі text recognition text localization neural networks |
Короткий огляд (реферат): | В кваліфікаційній роботі запропоновано підхід до розпізнавання локалізованого тексту, що базується на поєднанні рекурентних, згорткових нейронних мереж (CRNN) та алгоритму CTC-loss. Ця архітектура нейронних мереж реалізована за допомогою мови програмування Python. Проведено експеримент на двох наборах даних, за результатами якого були побудовані графіки зміни протягом навчання функції втрат, відстані Левенштейна та точності розпізнавання на тренувальному та двох тестових наборах даних. The qualification paper proposes an approach to localized text recognition based on a combination of recurrent, convolutional neural networks (CRNN) and the CTC-loss algorithm. This neural network architecture is implemented using the Python programming language. An experiment was performed on two data sets, based on the results of which graphs of changes during training of the loss function, Levenstein distance and accuracy of recognition on the training and two test data sets were constructed. |
Зміст: | ВСТУП 7 РОЗДІ 1. ОСНОВНА ЧАСТИНА 9 1.1. Огляд методів розпізнавання нечітких символів на графічних стендах 9 1.2. Локалізація тексту 10 1.3 Розпізнавання тексту 13 1.4 Висновки до розділу 1 21 РОЗДІЛ 2. ОСНОВНА ЧАСТИНА 22 2.1. Підхід із застосуванням CRNN-архітектури нейронних мереж 22 2.2. Повнозв'язний шар 22 2.3. Згортковий шар 24 2.4. Шар субдискретизації 25 2.5. Шар нормалізації за міні-батчами 26 2.6. Рекурентний шар 27 2.7. CTC loss 33 2.8. Висновки до розділу 2 39 РОЗДІЛ 3. НАУКОВО-ДОСЛІДНА ЧАСТИНА 40 3.1. Метод розпізнавання нечітких символів 40 3.2 Експериментальні дослідження 41 3.3. Висновки до розділу 3 44 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 45 4.1. Охорона праці 45 4.2. Безпека в надзвичайних ситуаціях 47 4.3. Висновки до розділу 4 51 ВИСНОВКИ 52 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 53 ДОДАТКИ 58 |
URI (Уніфікований ідентифікатор ресурсу): | http://elartu.tntu.edu.ua/handle/lib/36678 |
Власник авторського права: | © Щіпський Анатолій Володимирович, 2021 |
Перелік літератури: | 1 Адрианов А.И. Локализация текста на изображениях сложных графических сцен // Современные проблемы науки и образования. – № 3. – 2013. 2 Y. Kunishige, F. Yaokai, S. Uchida. Scenery Character Detection with Environmental Context // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 1049 – 1053. 3 S. Uchida, Y. Shigeyoshi, Y. Kunishige, F. Yaokai. A Keypoint-Based Approach Toward Scenery Character Detection // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 819 – 823. 4 Y. Du, H. Ai, S. Lao. Dot Text Detection Based on FAST Points // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 435 – 439. 5 A. Coates, B. Carpenter, C. Case, S. Satheesh, B. Suresh, T. Wang, D. Wu, A. Ng. Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 440 – 445. 6 B. Epshtein, E. Ofek, Y. Wexler, Detecting Text in Natural Scenes with Stroke Width Transform // 23rd IEEE Conference on Computer Vision and Pattern Recognition (CVPR), vol.V. San Francisco, 2010. 7 Tong He, Weilin Huang, Yu Qiao, Jian Yao. Text-attentional convolutional neural network for scene text detection // IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016. 8 Pengyuan Lyu, Minghui Liao, Cong Yao, Wenhao Wu, Xiang Bai. Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes. Huazhong University of Science and Technology, 2018. 9 Bissacco, A., Cummins, M., Netzer, Y., Neven, H.: Photoocr: Reading text in uncontrolled conditions // Proc. ICCV, 2013. pp. 785–792. 10 Jaderberg, M., Vedaldi, A., Zisserman, A. Deep features for text spotting // 54 Proc. ECCV, 2014. pp. 512–528. 11 Jaderberg, M., Simonyan, K., Vedaldi, A., Zisserman, A.: Synthetic data and artificial neural networks for natural scene text recognition. CoRR, 2014. 12 Max Jaderberg, Karen Simonyan, Andrea Vedaldi, Andrew Zisserman. Reading Text in the Wild with Convolutional Neural Networks. // International Journal of Computer Vision. – Hingham, MA, USA, 2016. – pp. 1-20. 13 I. Goodfellow, Y. Bulatov, J. Ibarz, S. Arnoud, V.Shet. Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks // arXiv:1312.6082, 2014. 14 Shi, B., Bai, X., Yao, C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition // IEEE Trans. Pattern Anal. Mach. Intell. 39(11), 2017. pp. 2298–2304. 15 Alex Graves, Santiago Fernandez, Faustino Gomez, Jurgen Schmidhuber. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks. // ICML '06 Proceedings of the 23rd international conference on Machine learning. – Pittsburgh, Pennsylvania, 2006. – pp. 369-376. 16 S. Ghosh, E. Valveny, A. Bagdanov. Visual attention models for scene text recognition // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 2017. 17 F. Yin, Y. Wu, X. Zhang, C. Liu. Scene Text Recognition with Sliding Convolutional Character Models // arXiv:1709.01727, 2017. 18 Y. Wu, F. Yin, X. Zhang, L. Liu, C. Liu. SCAN: Sliding Convolutional Attention Network for Scene Text Recognition // ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2019. 19 P. Wang, L. Yang, H. Li, Y. Deng, C. Shen, Y. Zhang. A Simple and Robust Convolutional-Attention Network for Irregular Text Recognition // arXiv:1904.01375, 2019. 20 W. Liu, C. Chen, K. Wong. SAFE: Scale Aware Feature Encoder for Scene Text Recognition // Asian Conference on Computer Vision (ACCV), 2018. 21 S. Ioffe, C. Szegedy. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift // ICML'15 Proceedings of the 32nd International Conference on International Conference on Machine Learning, 2015. 22 Sheng Qian, Hua Liu, Cheng Liu, Si Wu, Hau San Wong. Adaptive activation functions in convolutional neural networks // Neurocomputing, Volume 272, 2018. – pp. 204-212. 16 Kohonen, T. (1988), Learning Vector Quantization, Neural Networks, 1 (suppl 1), 303. 23 S. Hochreiter, Jurgen Schmidhuber. Long short-term memory // Neural Computation, 1997. – pp. 1735–1780. 24 Baoguang Shi, Xiang Bai, Cong Yao. An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence. – University of Toronto, Canada, 2015. – pp. 99. 25 Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. [Электронный ресурс]: режим доступа - http://www.machinelearning.ru. 26 Многослойные нейронные сети [Электронный ресурс] : Материал из Википедии — свободной энциклопедии : Версия 89620593, сохранённая в 18:53 UTC 12 декабря 2017 / Авторы Википедии // Википедия, свободная энциклопедия. — Электрон. дан. — Сан-Франциско: Фонд Викимедиа, 2017. — Режим доступа: http://ru.wikipedia.org/?oldid=89620593 wikipedia.org 27 Bottou, Leon. (2011). From Machine Learning to Machine Reasoning. Computing Research Repository - CORR. 94. . 10.1007/s10994-013-5335-x. 28 Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика = Neural Computing. Theory and Practice. — М.: Мир, 1992. — 240 с. — ISBN 5-03- 002115-9. 29 Медведев В.С. Нейронные сети / В.С. Медведев, В.Г. Потемкин – М.: Диалог МИФИ, 2002. 30 Carlos Affonso, Andre Luis Debiasso Deep Learning for biological image classification – Expert Systems with Applications, Volume 85, 2017, pp. 114-122. 31 Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, “Going deeper with convolutions”. arXiv:1409.4842 56 2014 32 C. Szegedy, V. Vanhoucke, S. Ioffe, J. Shlens, Z. Wojna, “Rethinking the Inception Architecture for Computer Vision”. arXiv:1512.00567 2015 33 Статистическая обработка данных [Электронный ресурс] – Режим доступа: http://www.intuit.ru/studies/courses/3632/874/info. 34 Классические методы статистики:метод главных компонент[Электронный ресурс] – Режим доступа: http://ranalytics.blogspot.ru/2012/08/blog-post.html. 35 Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. [Электронный ресурс]– Режим доступа: http://www.machinelearning.ru/ 36 Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA / Реброва О.Ю. – Москва: Медиа Сфера, 2002. – 312 с. 37 Статистические методы построения эмпирических формул. / Львовский Е.Н. – Москва: Высшая школа, 19. 239 с. 38 Нейронная сеть Кохонена [Электронный ресурс] : Материал из Википедии — свободной энциклопедии : Версия 89620593, сохранённая в 18:53 UTC 12 декабря 2017 / Авторы Википедии // Википедия, свободная энциклопедия. — Электрон. дан. — Сан-Франциско: Фонд Викимедиа, 2017. — Режим доступа: http://ru.wikipedia.org/?oldid=89620593 wikipedia.org. 39 Kohonen, T. (1988), Learning Vector Quantization, Neural Networks, 1 (suppl 1), 303. 40 Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard and L. D. Jackel: Backpropagation Applied to Handwritten Zip Code Recognition, Neural Computation, 1(4):541-551, Winter 1989. 41 Jain, V. and Seung, S. H. (2008). Natural image denoising with convolutional networks. In NIPS’2008. 42 Graham, Benjamin (2014-12-18), "Fractional Max-Pooling", arΧiv:1412.6071 [cs.CV]. 43 Lee, H., Grosse, R., Ranganath, R., and Ng, A. Y. (2009a). Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In ICML’2009. 44 Zeiler, M., Krishnan, D., Taylor, G., and Fergus, R. (2010). Deconvolutional networks. In CVPR’2010. 45 Галушкин А. И. Синтез многослойных систем распознавания образов. — М.: Энергия, 1974. 46 Martinetz T. M., Berkovich S. G., Schulten K. J. Neural-gas network for vector quantization and its application to time-series prediction // IEEE Trans. on Neural Networks, 1993, No. 4. — P. 558—569. 47 Linda G. Shapiro and George C. Stockman (2001): «Computer Vision», pp 279—325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3. 48 Ивченко Г. И., Медведев Ю. И. Введение в математическую статистику. — М. : Издательство ЛКИ, 2010. — §2.2. Выборочные моменты: точная и асимптотическая теория. — ISBN 978-5-382-01013-7. 49 Гилл Ф., Мюррей У., Райт М. Практическая оптимизация = Practical Optimization. — М.: Мир, 1985. 50 Горбань А. Н. Обучение нейронных сетей. — М.: СП ПараГраф, 1990. 51 Masakazu Iwamura. Advances of Scene Text Datasets // Department of Computer Science and Intelligent Systems Graduate School of Engineering, Osaka Prefecture University, 2018. |
Тип вмісту: | Master Thesis |
Розташовується у зібраннях: | 172 — телекомунікації та радіотехніка |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
Dyplom_shchipskyy.pdf | 1,75 MB | Adobe PDF | Переглянути/відкрити | |
Авторська_довідка_Щіпський_А_В.doc | 48 kB | Microsoft Word | Переглянути/відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.
Інструменти адміністратора