Please use this identifier to cite or link to this item:
http://elartu.tntu.edu.ua/handle/lib/50566| Title: | Система контролю якості сканів у Mayan EDMS з використанням OpenCV та машинного навчання |
| Other Titles: | Scan Quality Control System in Mayan EDMS Using OpenCV and Machine Learning |
| Authors: | Попсуй, Віталій Дмитрович Popsui, Vitalii |
| Bibliographic description (Ukraine): | Попсуй В.Д. Система контролю якості сканів у Mayan EDMS з використанням OpenCV та машинного навчання : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „121 — інженерія програмного забезпечення“ / В.Д. Попсуй — Тернопіль: ТНТУ, 2025. — 86 с. |
| Issue Date: | Des-2025 |
| Date of entry: | 23-Des-2025 |
| Publisher: | Тернопільський національний технічний університет імені Івана Пулюя |
| Country (code): | UA |
| Place of the edition/event: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
| Supervisor: | Бревус, Віталій Миколайович |
| UDC: | 004.932 |
| Keywords: | 121 інженерія програмного забезпечення Mayan EDMS контроль якості сканів OpenCV машинне навчання комп’ютерний зір електронний документообіг Python scan quality control machine learning computer vision electronic document management |
| Abstract: | Метою роботи є розроблення програмної системи автоматизованого
контролю якості сканованих документів, інтегрованої з Mayan EDMS, із
застосуванням методів комп’ютерного зору та машинного навчання.
Об’єктом дослідження є процеси обробки сканованих документів у
системах електронного документообігу.
Предметом дослідження є методи та програмні засоби оцінювання якості
сканів документів (різкість, шум, контрастність, кут нахилу, засвітлення) з
використанням OpenCV і моделей машинного навчання.
Методи дослідження включають аналіз існуючих EDMS-рішень,
проєктування багаторівневої архітектури, побудову UML-діаграм, застосування
алгоритмів комп’ютерного зору, інтеграцію ML-моделей, а також тестування та
верифікацію програмної системи.
У роботі реалізовано модуль контролю якості сканів, який автоматично
виявляє дефекти документів, обчислює метрики якості та зберігає результати
аналізу в Mayan EDMS із формуванням рекомендацій щодо повторного
сканування. Система розроблена мовою Python та інтегрована з Mayan EDMS
через REST API, що забезпечує модульність і масштабованість рішення. The aim of this thesis is to develop a software system for automated quality control of scanned documents integrated with Mayan EDMS using computer vision and machine learning techniques. The object of the study is the process of processing scanned documents in electronic document management systems. The subject of the study includes methods and software tools for evaluating scan quality parameters such as sharpness, noise level, contrast, skew angle, and illumination using OpenCV and machine learning models. The research methods involve analysis of existing EDMS solutions, design of a multi-layer system architecture, development of UML diagrams, application of computer vision algorithms, integration of machine learning models, as well as testing and verification of the developed system. The thesis presents an implemented scan quality control module that automatically detects document defects, calculates quality metrics, and stores analysis results in Mayan EDMS with recommendations for rescanning. The system is developed in Python and integrated with Mayan EDMS via a REST API, providing modularity and scalability. |
| Content: | ВСТУП.......................................................................................................................... 9 1 РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ .............................................................. 11 1.1 Аналіз вимог до програмної системи................................................................ 11 1.1.1 Аналіз предметної області............................................................................... 12 1.1.2 Визначення та постановка задачі.................................................................... 14 1.1.3 Опис ключових варіантів використання........................................................ 19 1.2 Проєктування програмної системи ................................................................... 22 1.2.1 Логіка структури системи ............................................................................... 25 1.2.2 Опис фізичної структури................................................................................. 29 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ...................... 31 2.1 Моделювання архітектури системи................................................................... 31 2.2 Вибір системи керування базами даних ........................................................... 34 2.3 Побудова схеми бази даних ............................................................................... 37 2.4 Конструювання програмної системи ................................................................ 30 2.4.1 Обґрунтування вибору технологій розробки ................................................ 41 2.4.2 Побудова UML-діаграм класів........................................................................ 42 2.4.3 Вибір мови програмування ............................................................................. 45 2.4.4 Обґрунтування вибору технологічного засобу реалізації веб-проєкту ...... 46 2.4.5 Механізм опрацювання даних та доступ до бази даних .............................. 46 2.4.6 Обґрунтування вибору середовища розробки............................................... 48 2.4.7 Функціональні можливості графічного інтерфейсу користувача ............... 49 3 ТЕСТУВАННЯ, ВПРОВАДЖЕННЯ ТА ПІДТРИМКА .................................... 52 3.1 Тестування програмної системи ........................................................................ 52 3.1.1 Види та план тестування ................................................................................. 57 3.1.2 Розробка тестових сценаріїв ........................................................................... 60 3.2 Розгортання програмної системи та системні вимоги .................................... 63 3.3 Верифікація програмної системи ...................................................................... 65 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ ......... 66 4.1 Охорона праці ...................................................................................................... 664.2 Стійкість роботи системи контролю до дії електромагнітного імпульсу ядерного вибуху та заходи захисту ......................................................................... 69 ВИСНОВКИ............................................................................................................... 76 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ................................................................. 79 ДОДАТКИ.................................................................................................................. 83 Додаток А. Тези конференції |
| URI: | http://elartu.tntu.edu.ua/handle/lib/50566 |
| Copyright owner: | @ Попсуй Віталій Дмитрович, 2025 |
| References (Ukraine): | 1.Mayan EDMS Official Documentation. Document management system architecture and API. URL: https://docs.mayan-edms.com 2.OpenCV Documentation. Image processing and computer vision algorithms. URL: https://docs.opencv.org 3.Gonzalez R., Woods R. Digital Image Processing. – 4th ed. – Pearson, 2018. – 1168 p. 4.Jain A. Fundamentals of Digital Image Processing. – Prentice Hall, 2014. – 598 p. 5.Szeliski R. Computer Vision: Algorithms and Applications. – Springer, 2022. – 1010 p. 8.Scikit-learn Developers. Machine Learning in Python. URL: https://scikit-learn.org 10. Python Software Foundation. Python Language Reference. URL: https://docs.python.org/3 11. Flask Documentation. Web application framework for Python. URL: https://flask.palletsprojects.com 12. REST API Design Guidelines. Best practices for RESTful services. URL: https://restfulapi.net 17. PostgreSQL Official Documentation. Database architecture and data integrity. URL: https://www.postgresql.org/docs 20. Baird H. The State of the Art of Document Image Degradation Modeling // International Journal on Document Analysis and Recognition. – 2018. 24. Олянін Д., Цуприк Г., Говорущенко Т. Transformer neural networks in Industry 4.0 // CITI-2025 Proceedings. – Ternopil, 2025. 25. Tsupryk H., Olianin D. Data extraction using transformer neural networks // Information Technology: Computer Science, Software Engineering and Cyber Security. – 2025. – P. 125–130. 28. Методичні вказівки до виконання кваліфікаційної роботи магістра для здобувачів спеціальності 121 – Інженерія програмного забезпечення / укладачі:81 Михалик Д.М., Цуприк Г.Б., Бревус В.М., Мудрик І.Я. – Тернопіль: ТНТУ ім. І. Пулюя, 2024. – 44 с. 30. Likforman-Sulem L., Zahour A., Taconet B. Text line segmentation of historical documents // International Journal on Document Analysis and Recognition. – 2017 |
| Content type: | Master Thesis |
| Appears in Collections: | 121 — інженерія програмного забезпечення |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Full_КРМ_Попсуй оновлена.pdf | 923,26 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Admin Tools