Розробка архітектури базової нейронної мережі для сегментації меж та  границь на зображеннях

Мельник, Олександр Олександрович; Melnyk, Olexandr

Palun kasuta seda identifikaatorit viitamiseks ja linkimiseks: http://elartu.tntu.edu.ua/handle/lib/49054

Pealkiri:	Розробка архітектури базової нейронної мережі для сегментації меж та границь на зображеннях
Teised pealkirjad:	Development of a Basic Neural Network Architecture for Image Edge and Boundary Segmentation
Autor:	Мельник, Олександр Олександрович Melnyk, Olexandr
Affiliation:	ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Україна
Bibliographic description (Ukraine):	Мельник О. О. Розробка архітектури базової нейронної мережі для сегментації меж та границь на зображеннях : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 - інженерія програмного забезпечення / наук. кер. І. В. Бойко. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2025. 65 с.
Ilmumisaasta:	juu-2025
Submitted date:	9-juu-2025
Date of entry:	26-juu-2025
Kirjastaja:	Тернопільський національний технічний університет імені Івана Пулюя
Country (code):	UA
Place of the edition/event:	ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Supervisor:	Бойко, Ігор Володимирович
Committee members:	Лещишин, Юрій Зіновійович
UDC:	004.9
Märksõnad:	нейронна мережа сегментація зображень обробка зображень межі та границі комп’ютерний зір глибоке навчання архітектура моделі класифікація пікселів конволюційна нейронна мережа семантична сегментація
Number of pages:	65
Kokkuvõte:	Дана кваліфікаційна робота на здобуття освітнього ступеня бакалавра присвячена питанням обробки, сегментації та аналізу зображень за допомогою нейронних мереж. Виявлення контурів є фундаментальним завданням комп'ютерного зору, яке відіграє важливу роль у таких застосуваннях, як розпізнавання об'єктів, розуміння сцени та сегментація зображень. На відміну від сучасних методів, що використовують попередньо навчені ваги та складні налаштування гіперпараметрів, наша запропонована модель пропонує новий підхід, який усуває ці залежності, зберігаючи при цьому високу точність та ефективність. Однією з ключових переваг нашої моделі є її ефективність у навчанні. У той час як більшість моделей на основі глибокого навчання для виявлення контурів потребують приблизно 20 епох для збіжності, наша модель навчається з нуля та досягає збіжності лише за 9 епох. Це суттєве скорочення часу навчання не впливає на узагальнюючу здатність моделі, оскільки вона демонструє високу продуктивність у різноманітних і раніше невідомих сценах. Крім того, у дипломній роботі представлено ретельно відібраний набір даних, спеціально розроблений для завдання виявлення контурів. Цей набір є одним із найбільш якісних серед доступних, що дозволяє значно покращити узагальнення 5 алгоритмів, заснованих на навчанні. Унікальні характеристики цього набору даних забезпечують ефективну генералізацію моделей, що підвищує надійність та застосовність методів виявлення контурів. Таким чином, розвинений підхід пропонує більш ефективне та адаптивне рішення для виявлення контурів. Усунення залежності від попередньо навчених ваг та складних налаштувань гіперпараметрів, а також значне скорочення часу навчання дозволяє нам створити метод, який поєднує обчислювальну ефективність із високою узагальнюючою здатністю. Крім того, представлення спеціалізованого набору даних сприяє подальшому розвитку цієї галузі, забезпечуючи міцну основу для майбутніх досліджень у сфері виявлення контурів та суміжних напрямків. This qualification work for obtaining a Bachelor's degree is dedicated to the issues of image processing, segmentation, and analysis using neural network. Edge detection is a fundamental task in computer vision, playing a crucial role in applications such as object recognition, scene understanding, and image segmentation. Unlike state-of-the-art methods that rely on pretrained weights and complex hyperparameter tuning, our proposed model introduces a novel approach that eliminates these dependencies while maintaining high accuracy and efficiency. One of the key advantages of our model is its training efficiency. While most deep learning-based edge detection models require approximately 20 epochs to converge, our model is trained from scratch and achieves convergence in just 9 epochs. This significant reduction in training time does not compromise the generalization capability of the model, as it demonstrates high performance across diverse and previously unseen scenes. Furthermore, we present a highly curated dataset specifically designed for edge detection tasks. This dataset is among the most refined collections available, significantly enhancing the generalization capabilities of learning-based algorithms. The unique characteristics of this dataset ensure that models trained on it can effectively generalize to new environments, thereby improving the reliability and applicability of edge detection techniques. 7 Our approach provides a more efficient and adaptable solution for edge detection. By removing the dependency on pretrained weights and complex hyperparameter settings while significantly reducing training time, we offer a method that balances computational efficiency with strong generalization capability. Additionally, the introduction of our specialized dataset contributes to advancements in the field, providing a solid foundation for future research in edge detection and related domains. Beyond efficiency and accuracy, our model is designed to be versatile and scalable, allowing it to be seamlessly integrated into various real-world applications. Whether for medical imaging, autonomous navigation, or industrial inspection, our approach enables robust edge detection with minimal computational overhead. By eliminating the reliance on extensive pretraining, we make edge detection more accessible and adaptable to diverse conditions, ensuring that our method remains effective even in challenging environments. In conclusion, our work not only advances the state of edge detection technology but also sets a new standard for efficient model training and dataset curation. By addressing key challenges in the field, we pave the way for more reliable, generalizable, and computationally efficient edge detection techniques that can be readily applied across a wide range of domains.
Content:	ВСТУП 10 РОЗДІЛ 1. ДОСЛІДЖЕННЯ ТА АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ. АКТУАЛІЗАЦІЯ ТА ФОРМАЛЬНИЙ АНАЛІЗ ПРОБЛЕМИ 12 1.1. Значення візуальної обробки інформації в конкурентних нейронних мережах при обробці зображень 12 1.2. Поняття про краї, контури та межі в зображеннях та методи їх встановлення 16 1.3. Значення структури даних для графічної інформації 17 1.4. Існуючі суміжні розробки та підходи 20 РОЗДІЛ 2 РОЗРОБКА СТРУКТУРИ НЕЙРОМЕРЕЖІ ІЗ ФУНКЦІОНАЛОМ ДЛЯ ОПРАЦЮВАННЯ ЗОБРАЖЕНЬ ТА ВИЯВЛЕННЯ КРАЇВ ТА МЕЖ У НИХ 24 2.1. Розробка щільної екстремальної початкова мережа для виявлення країв у зображеннях 24 2.2. Розробка щільної екстремальної початкової мережі для виявлення країв у зображеннях 26 2.3. Покрокова розробка нейромережі USNet для збільшення роздільної здатності 27 2.4. Визначення функції втрат при роботі з розробленою нейронною мережею та її розрахунок 29 РОЗДІЛ 3 НАВЧАННЯ РОЗРОБЛЕНОЇ НЕЙРОННОЇ МЕРЕЖІ. ВХІДНІ ТРЕНУВАЛЬНІ ДАТАСЕТИ 31 3.1. Навчання нейронної мережі з використанням набору даних BIPED 31 3.2. Тестування із еталонними контрольними наборами даних 33 3.3. Аналіз отриманих результатів, верифікація та тестування 37 3.4. Оцінка та основні результати щодо верифікації. Налаштування архітектури розробленого програмного забезпечення 39 3.5. Виконання кількісного порівняння методів 44 3.6. Якісне порівняння методів 47 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 51 4.1. Принципи, способи та засоби захисту населення 51 4.2. Заходи, що запобігають впливу на людину агресивних та токсичних речовин, які використовуються в технологічному процесі 54 ВИСНОВКИ 58 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 60 ДОДАТКИ 64 Додаток А. Диск із кваліфікаційною роботою бакалавра 65
URI:	http://elartu.tntu.edu.ua/handle/lib/49054
Copyright owner:	© Мельник Олександр Олександрович, 2025
References (Ukraine):	1. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 2. Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer. 3. LeCun, Y., & Hinton, G. (2015). Deep Learning. Nature, 521(7553), 436-444 4. Schmidhuber, J. (2015). Deep Learning in Neural Networks: An Overview. Neural Networks, 61, 85–117. 5. Chollet, F. (2017). Deep Learning with Python. Manning. 6. Nielsen, M. (2015). Neural Networks and Deep Learning. Determination Press. 7. Aggarwal, C. C. (2018). Neural Networks and Deep Learning: A Textbook. Springer 8. Li, Y., & Zhang, L. (2018). Deep Learning for Image Processing Applications. Springer. 26 .Brock, A., Donahue, J., & Simonyan, K. (2019). Large Scale GAN Training for High Fidelity Natural Image Synthesis. ICLR. 29. Chollet, F. (2015). Keras: Deep Learning Library for Theano and TensorFlow. GitHub. 42. Дистанційний курс «Кваліфікаційні роботи бакалаврів» сайту дистанційного навчання ТНТУ [Електронний ресурс]. – Режим доступу: URL: https://dl.tntu.edu.ua/bounce.php?course=5329. 43. Стиценко Т.Є., Пронюк Г.В., Сердюк Н.М., Хондак І.І. «Безпека життєдіяльності»: навч. посібник / Т.Є Стиценко, Г.В. Пронюк, Н.М. Сердюк, І.І. Хондак. – Харкiв: ХНУРЕ, 2018. – 336 с. 39. Jaderberg, M., et al. (2015). Spatial Transformer Networks. NeurIPS.Xie, S., et al. (2017). Aggregated Residual Transformations for Deep Neural Networks. IEEE CVPR. 40. Han, S., et al. (2015). Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding. ICLR.
Content type:	Bachelor Thesis
Asub kollektsiooni(de)s:	121 — Інженерія програмного забезпечення (бакалаври)

Failid selles objektis:

Fail	Kirjeldus	Suurus	Formaat
dyplom_Melnyk_2025.pdf		10,33 MB	Adobe PDF	Vaata/Ava

Näita täiskirjet Vaata statistikat

Kõik teosed on Dspaces autoriõiguste kaitse all.

Admin vahendid