Метод розпізнавання нечітких символів з використанням  нейронної мережі

Щіпський, Анатолій Володимирович; Shchipsky, Anatoly

Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız: http://elartu.tntu.edu.ua/handle/lib/36678

Başlık:	Метод розпізнавання нечітких символів з використанням нейронної мережі
Diğer Başlıklar:	Method of fuzzy character recognition using a neural network
Yazarlar:	Щіпський, Анатолій Володимирович Shchipsky, Anatoly
Affiliation:	ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна
Bibliographic description (Ukraine):	Щіпський А. В. Метод розпізнавання нечітких символів з використанням нейронної мережі : кваліфікаційна робота магістра за спеціальністю 172 Телекомунікації та радіотехніка / А. В. Щіпський. – Тернопіль : ТНТУ, 2021. – 73 c.
Yayın Tarihi:	Ara-2021
Submitted date:	Ara-2021
Date of entry:	19-Ara-2021
Yayıncı:	ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна
Country (code):	UA
Place of the edition/event:	ТНТУ ім. І. Пулюя, Факультет прикладних інформаційних технологій та електроінженерії, Кафедра радіотехнічних систем, м. Тернопіль, Україна
Supervisor:	Дунець, Василь Любомирович Dunets, Vasyl
Committee members:	Хвостівський, Микола Орестович Khvostivskyi, Mykola
UDC:	621.394.623
Anahtar kelimeler:	172 телекомунікації та радіотехніка розпізнавання тексту локалізація тексту нейронні мережі text recognition text localization neural networks
Özet:	В кваліфікаційній роботі запропоновано підхід до розпізнавання локалізованого тексту, що базується на поєднанні рекурентних, згорткових нейронних мереж (CRNN) та алгоритму CTC-loss. Ця архітектура нейронних мереж реалізована за допомогою мови програмування Python. Проведено експеримент на двох наборах даних, за результатами якого були побудовані графіки зміни протягом навчання функції втрат, відстані Левенштейна та точності розпізнавання на тренувальному та двох тестових наборах даних. The qualification paper proposes an approach to localized text recognition based on a combination of recurrent, convolutional neural networks (CRNN) and the CTC-loss algorithm. This neural network architecture is implemented using the Python programming language. An experiment was performed on two data sets, based on the results of which graphs of changes during training of the loss function, Levenstein distance and accuracy of recognition on the training and two test data sets were constructed.
Content:	ВСТУП 7 РОЗДІ 1. ОСНОВНА ЧАСТИНА 9 1.1. Огляд методів розпізнавання нечітких символів на графічних стендах 9 1.2. Локалізація тексту 10 1.3 Розпізнавання тексту 13 1.4 Висновки до розділу 1 21 РОЗДІЛ 2. ОСНОВНА ЧАСТИНА 22 2.1. Підхід із застосуванням CRNN-архітектури нейронних мереж 22 2.2. Повнозв'язний шар 22 2.3. Згортковий шар 24 2.4. Шар субдискретизації 25 2.5. Шар нормалізації за міні-батчами 26 2.6. Рекурентний шар 27 2.7. CTC loss 33 2.8. Висновки до розділу 2 39 РОЗДІЛ 3. НАУКОВО-ДОСЛІДНА ЧАСТИНА 40 3.1. Метод розпізнавання нечітких символів 40 3.2 Експериментальні дослідження 41 3.3. Висновки до розділу 3 44 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 45 4.1. Охорона праці 45 4.2. Безпека в надзвичайних ситуаціях 47 4.3. Висновки до розділу 4 51 ВИСНОВКИ 52 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 53 ДОДАТКИ 58
URI:	http://elartu.tntu.edu.ua/handle/lib/36678
Copyright owner:	© Щіпський Анатолій Володимирович, 2021
References (Ukraine):	1 Адрианов А.И. Локализация текста на изображениях сложных графических сцен // Современные проблемы науки и образования. – № 3. – 2013. 2 Y. Kunishige, F. Yaokai, S. Uchida. Scenery Character Detection with Environmental Context // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 1049 – 1053. 3 S. Uchida, Y. Shigeyoshi, Y. Kunishige, F. Yaokai. A Keypoint-Based Approach Toward Scenery Character Detection // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 819 – 823. 4 Y. Du, H. Ai, S. Lao. Dot Text Detection Based on FAST Points // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 435 – 439. 5 A. Coates, B. Carpenter, C. Case, S. Satheesh, B. Suresh, T. Wang, D. Wu, A. Ng. Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011. pp. 440 – 445. 6 B. Epshtein, E. Ofek, Y. Wexler, Detecting Text in Natural Scenes with Stroke Width Transform // 23rd IEEE Conference on Computer Vision and Pattern Recognition (CVPR), vol.V. San Francisco, 2010. 7 Tong He, Weilin Huang, Yu Qiao, Jian Yao. Text-attentional convolutional neural network for scene text detection // IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016. 8 Pengyuan Lyu, Minghui Liao, Cong Yao, Wenhao Wu, Xiang Bai. Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes. Huazhong University of Science and Technology, 2018. 9 Bissacco, A., Cummins, M., Netzer, Y., Neven, H.: Photoocr: Reading text in uncontrolled conditions // Proc. ICCV, 2013. pp. 785–792. 10 Jaderberg, M., Vedaldi, A., Zisserman, A. Deep features for text spotting // 54 Proc. ECCV, 2014. pp. 512–528. 11 Jaderberg, M., Simonyan, K., Vedaldi, A., Zisserman, A.: Synthetic data and artificial neural networks for natural scene text recognition. CoRR, 2014. 12 Max Jaderberg, Karen Simonyan, Andrea Vedaldi, Andrew Zisserman. Reading Text in the Wild with Convolutional Neural Networks. // International Journal of Computer Vision. – Hingham, MA, USA, 2016. – pp. 1-20. 13 I. Goodfellow, Y. Bulatov, J. Ibarz, S. Arnoud, V.Shet. Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks // arXiv:1312.6082, 2014. 14 Shi, B., Bai, X., Yao, C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition // IEEE Trans. Pattern Anal. Mach. Intell. 39(11), 2017. pp. 2298–2304. 15 Alex Graves, Santiago Fernandez, Faustino Gomez, Jurgen Schmidhuber. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks. // ICML '06 Proceedings of the 23rd international conference on Machine learning. – Pittsburgh, Pennsylvania, 2006. – pp. 369-376. 16 S. Ghosh, E. Valveny, A. Bagdanov. Visual attention models for scene text recognition // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 2017. 17 F. Yin, Y. Wu, X. Zhang, C. Liu. Scene Text Recognition with Sliding Convolutional Character Models // arXiv:1709.01727, 2017. 18 Y. Wu, F. Yin, X. Zhang, L. Liu, C. Liu. SCAN: Sliding Convolutional Attention Network for Scene Text Recognition // ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2019. 19 P. Wang, L. Yang, H. Li, Y. Deng, C. Shen, Y. Zhang. A Simple and Robust Convolutional-Attention Network for Irregular Text Recognition // arXiv:1904.01375, 2019. 20 W. Liu, C. Chen, K. Wong. SAFE: Scale Aware Feature Encoder for Scene Text Recognition // Asian Conference on Computer Vision (ACCV), 2018. 21 S. Ioffe, C. Szegedy. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift // ICML'15 Proceedings of the 32nd International Conference on International Conference on Machine Learning, 2015. 22 Sheng Qian, Hua Liu, Cheng Liu, Si Wu, Hau San Wong. Adaptive activation functions in convolutional neural networks // Neurocomputing, Volume 272, 2018. – pp. 204-212. 16 Kohonen, T. (1988), Learning Vector Quantization, Neural Networks, 1 (suppl 1), 303. 23 S. Hochreiter, Jurgen Schmidhuber. Long short-term memory // Neural Computation, 1997. – pp. 1735–1780. 24 Baoguang Shi, Xiang Bai, Cong Yao. An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence. – University of Toronto, Canada, 2015. – pp. 99. 25 Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. [Электронный ресурс]: режим доступа - http://www.machinelearning.ru. 26 Многослойные нейронные сети [Электронный ресурс] : Материал из Википедии — свободной энциклопедии : Версия 89620593, сохранённая в 18:53 UTC 12 декабря 2017 / Авторы Википедии // Википедия, свободная энциклопедия. — Электрон. дан. — Сан-Франциско: Фонд Викимедиа, 2017. — Режим доступа: http://ru.wikipedia.org/?oldid=89620593 wikipedia.org 27 Bottou, Leon. (2011). From Machine Learning to Machine Reasoning. Computing Research Repository - CORR. 94. . 10.1007/s10994-013-5335-x. 28 Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика = Neural Computing. Theory and Practice. — М.: Мир, 1992. — 240 с. — ISBN 5-03- 002115-9. 29 Медведев В.С. Нейронные сети / В.С. Медведев, В.Г. Потемкин – М.: Диалог МИФИ, 2002. 30 Carlos Affonso, Andre Luis Debiasso Deep Learning for biological image classification – Expert Systems with Applications, Volume 85, 2017, pp. 114-122. 31 Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, “Going deeper with convolutions”. arXiv:1409.4842 56 2014 32 C. Szegedy, V. Vanhoucke, S. Ioffe, J. Shlens, Z. Wojna, “Rethinking the Inception Architecture for Computer Vision”. arXiv:1512.00567 2015 33 Статистическая обработка данных [Электронный ресурс] – Режим доступа: http://www.intuit.ru/studies/courses/3632/874/info. 34 Классические методы статистики:метод главных компонент[Электронный ресурс] – Режим доступа: http://ranalytics.blogspot.ru/2012/08/blog-post.html. 35 Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. [Электронный ресурс]– Режим доступа: http://www.machinelearning.ru/ 36 Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA / Реброва О.Ю. – Москва: Медиа Сфера, 2002. – 312 с. 37 Статистические методы построения эмпирических формул. / Львовский Е.Н. – Москва: Высшая школа, 19. 239 с. 38 Нейронная сеть Кохонена [Электронный ресурс] : Материал из Википедии — свободной энциклопедии : Версия 89620593, сохранённая в 18:53 UTC 12 декабря 2017 / Авторы Википедии // Википедия, свободная энциклопедия. — Электрон. дан. — Сан-Франциско: Фонд Викимедиа, 2017. — Режим доступа: http://ru.wikipedia.org/?oldid=89620593 wikipedia.org. 39 Kohonen, T. (1988), Learning Vector Quantization, Neural Networks, 1 (suppl 1), 303. 40 Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard and L. D. Jackel: Backpropagation Applied to Handwritten Zip Code Recognition, Neural Computation, 1(4):541-551, Winter 1989. 41 Jain, V. and Seung, S. H. (2008). Natural image denoising with convolutional networks. In NIPS’2008. 42 Graham, Benjamin (2014-12-18), "Fractional Max-Pooling", arΧiv:1412.6071 [cs.CV]. 43 Lee, H., Grosse, R., Ranganath, R., and Ng, A. Y. (2009a). Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In ICML’2009. 44 Zeiler, M., Krishnan, D., Taylor, G., and Fergus, R. (2010). Deconvolutional networks. In CVPR’2010. 45 Галушкин А. И. Синтез многослойных систем распознавания образов. — М.: Энергия, 1974. 46 Martinetz T. M., Berkovich S. G., Schulten K. J. Neural-gas network for vector quantization and its application to time-series prediction // IEEE Trans. on Neural Networks, 1993, No. 4. — P. 558—569. 47 Linda G. Shapiro and George C. Stockman (2001): «Computer Vision», pp 279—325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3. 48 Ивченко Г. И., Медведев Ю. И. Введение в математическую статистику. — М. : Издательство ЛКИ, 2010. — §2.2. Выборочные моменты: точная и асимптотическая теория. — ISBN 978-5-382-01013-7. 49 Гилл Ф., Мюррей У., Райт М. Практическая оптимизация = Practical Optimization. — М.: Мир, 1985. 50 Горбань А. Н. Обучение нейронных сетей. — М.: СП ПараГраф, 1990. 51 Masakazu Iwamura. Advances of Scene Text Datasets // Department of Computer Science and Intelligent Systems Graduate School of Engineering, Osaka Prefecture University, 2018.
Content type:	Master Thesis
Koleksiyonlarda Görünür:	172 — телекомунікації та радіотехніка, Електронні комунікації та радіотехніка

Bu öğenin dosyaları:

Dosya	Açıklama	Boyut	Biçim
Dyplom_shchipskyy.pdf		1,75 MB	Adobe PDF	Göster/Aç
Авторська_довідка_Щіпський_А_В.doc		48 kB	Microsoft Word	Göster/Aç

Tüm Öğe Kaydını Göster İstatistikler

DSpace'deki bütün öğeler, aksi belirtilmedikçe, tüm hakları saklı tutulmak şartıyla telif hakkı ile korunmaktadır.

Yönetim Araçları