Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://elartu.tntu.edu.ua/handle/lib/49054
Назва: | Розробка архітектури базової нейронної мережі для сегментації меж та границь на зображеннях |
Інші назви: | Development of a Basic Neural Network Architecture for Image Edge and Boundary Segmentation |
Автори: | Мельник, Олександр Олександрович Melnyk, Olexandr |
Приналежність: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Україна |
Бібліографічний опис: | Мельник О. О. Розробка архітектури базової нейронної мережі для сегментації меж та границь на зображеннях : спец. 121 - інженерія програмного забезпечення / наук. кер. І. В. Бойко. Тернопіль: – Тернопільський національний технічний університет імені Івана Пулюя, 2025. 65 с. |
Дата публікації: | чер-2025 |
Дата подання: | 9-чер-2025 |
Дата внесення: | 26-чер-2025 |
Видавництво: | Тернопільський національний технічний університет імені Івана Пулюя |
Країна (код): | UA |
Місце видання, проведення: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
Науковий керівник: | Бойко, Ігор Володимирович |
Члени комітету: | Лещишин, Юрій Зіновійович |
УДК: | 004.9 |
Теми: | нейронна мережа сегментація зображень обробка зображень межі та границі комп’ютерний зір глибоке навчання архітектура моделі класифікація пікселів конволюційна нейронна мережа семантична сегментація |
Кількість сторінок: | 65 |
Короткий огляд (реферат): | Дана кваліфікаційна робота на здобуття освітнього ступеня бакалавра
присвячена питанням обробки, сегментації та аналізу зображень за допомогою
нейронних мереж. Виявлення контурів є фундаментальним завданням
комп'ютерного зору, яке відіграє важливу роль у таких застосуваннях, як
розпізнавання об'єктів, розуміння сцени та сегментація зображень. На відміну від
сучасних методів, що використовують попередньо навчені ваги та складні
налаштування гіперпараметрів, наша запропонована модель пропонує новий
підхід, який усуває ці залежності, зберігаючи при цьому високу точність та
ефективність.
Однією з ключових переваг нашої моделі є її ефективність у навчанні. У той
час як більшість моделей на основі глибокого навчання для виявлення контурів
потребують приблизно 20 епох для збіжності, наша модель навчається з нуля та
досягає збіжності лише за 9 епох. Це суттєве скорочення часу навчання не впливає
на узагальнюючу здатність моделі, оскільки вона демонструє високу
продуктивність у різноманітних і раніше невідомих сценах.
Крім того, у дипломній роботі представлено ретельно відібраний набір даних,
спеціально розроблений для завдання виявлення контурів. Цей набір є одним із
найбільш якісних серед доступних, що дозволяє значно покращити узагальнення
5
алгоритмів, заснованих на навчанні. Унікальні характеристики цього набору даних
забезпечують ефективну генералізацію моделей, що підвищує надійність та
застосовність методів виявлення контурів.
Таким чином, розвинений підхід пропонує більш ефективне та адаптивне
рішення для виявлення контурів. Усунення залежності від попередньо навчених ваг
та складних налаштувань гіперпараметрів, а також значне скорочення часу
навчання дозволяє нам створити метод, який поєднує обчислювальну ефективність
із високою узагальнюючою здатністю. Крім того, представлення спеціалізованого
набору даних сприяє подальшому розвитку цієї галузі, забезпечуючи міцну основу
для майбутніх досліджень у сфері виявлення контурів та суміжних напрямків. This qualification work for obtaining a Bachelor's degree is dedicated to the issues of image processing, segmentation, and analysis using neural network. Edge detection is a fundamental task in computer vision, playing a crucial role in applications such as object recognition, scene understanding, and image segmentation. Unlike state-of-the-art methods that rely on pretrained weights and complex hyperparameter tuning, our proposed model introduces a novel approach that eliminates these dependencies while maintaining high accuracy and efficiency. One of the key advantages of our model is its training efficiency. While most deep learning-based edge detection models require approximately 20 epochs to converge, our model is trained from scratch and achieves convergence in just 9 epochs. This significant reduction in training time does not compromise the generalization capability of the model, as it demonstrates high performance across diverse and previously unseen scenes. Furthermore, we present a highly curated dataset specifically designed for edge detection tasks. This dataset is among the most refined collections available, significantly enhancing the generalization capabilities of learning-based algorithms. The unique characteristics of this dataset ensure that models trained on it can effectively generalize to new environments, thereby improving the reliability and applicability of edge detection techniques. 7 Our approach provides a more efficient and adaptable solution for edge detection. By removing the dependency on pretrained weights and complex hyperparameter settings while significantly reducing training time, we offer a method that balances computational efficiency with strong generalization capability. Additionally, the introduction of our specialized dataset contributes to advancements in the field, providing a solid foundation for future research in edge detection and related domains. Beyond efficiency and accuracy, our model is designed to be versatile and scalable, allowing it to be seamlessly integrated into various real-world applications. Whether for medical imaging, autonomous navigation, or industrial inspection, our approach enables robust edge detection with minimal computational overhead. By eliminating the reliance on extensive pretraining, we make edge detection more accessible and adaptable to diverse conditions, ensuring that our method remains effective even in challenging environments. In conclusion, our work not only advances the state of edge detection technology but also sets a new standard for efficient model training and dataset curation. By addressing key challenges in the field, we pave the way for more reliable, generalizable, and computationally efficient edge detection techniques that can be readily applied across a wide range of domains. |
Зміст: | ВСТУП ........................................................................................................................... 10 РОЗДІЛ 1. ДОСЛІДЖЕННЯ ТА АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ. АКТУАЛІЗАЦІЯ ТА ФОРМАЛЬНИЙ АНАЛІЗ ПРОБЛЕМИ ................................ 12 1.1. Значення візуальної обробки інформації в конкурентних нейронних мережах при обробці зображень. ............................................................................. 12 1.2. Поняття про краї, контури та межі в зображеннях та методи їх встановлення. ............................................................................................................. 16 1.3. Значення структури даних для графічної інформації. .................................. 17 1.4. Існуючі суміжні розробки та підходи. ........................................................... 20 РОЗДІЛ 2 РОЗРОБКА СТРУКТУРИ НЕЙРОМЕРЕЖІ ІЗ ФУНКЦІОНАЛОМ ДЛЯ ОПРАЦЮВАННЯ ЗОБРАЖЕНЬ ТА ВИЯВЛЕННЯ КРАЇВ ТА МЕЖ У НИХ. .... 24 2.1. Розробка щільної екстремальної початкова мережа для виявлення країв у зображеннях. .............................................................................................................. 24 2.2. Розробка щільної екстремальної початкової мережі для виявлення країв у зображеннях. .............................................................................................................. 26 2.3. Покрокова розробка нейромережі USNet для збільшення роздільної здатності. .................................................................................................................... 27 2.4. Визначення функції втрат при роботі з розробленою нейронною мережею та її розрахунок. ............................................................................................................. 29 РОЗДІЛ 3 НАВЧАННЯ РОЗРОБЛЕНОЇ НЕЙРОННОЇ МЕРЕЖІ. ВХІДНІ ТРЕНУВАЛЬНІ ДАТАСЕТИ. ..................................................................................... 31 3.1. Навчання нейронної мережі з використанням набору даних BIPED. ......... 31 3.2. Тестування із еталонними контрольними наборами даних. ........................ 33 3.3. Аналіз отриманих результів, верифікація та тестування. ............................ 37 9 3.4. Оцінка та основні результати щодо верифікації. Налаштування архітектури розробленого програмного забезпечення .......................................... 39 3.5. Виконання кількісного порівняння методів .................................................. 44 3.6. Якісне порівняння методів .............................................................................. 47 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ ........... 51 4.1. Принципи, способи та засоби захисту населення ........................................... 51 4.2. Заходи, що запобігають впливу на людину агресивних та токсичних речовин, які використовуються в технологічному процесі. ................................. 54 ВИСНОВКИ .................................................................................................................. 58 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ..................................................................... 60 ДОДАТКИ ..................................................................................................................... 64 Додаток А. Диск із кваліфікаційною роботою бакалавра ........................................ 65 |
URI (Уніфікований ідентифікатор ресурсу): | http://elartu.tntu.edu.ua/handle/lib/49054 |
Власник авторського права: | © Мельник Олександр Олександрович, 2025 |
Перелік літератури: | 1. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 2. Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer. 3. LeCun, Y., & Hinton, G. (2015). Deep Learning. Nature, 521(7553), 436-444 4. Schmidhuber, J. (2015). Deep Learning in Neural Networks: An Overview. Neural Networks, 61, 85–117. 5. Chollet, F. (2017). Deep Learning with Python. Manning. 6. Nielsen, M. (2015). Neural Networks and Deep Learning. Determination Press. 7. Aggarwal, C. C. (2018). Neural Networks and Deep Learning: A Textbook. Springer 8. Li, Y., & Zhang, L. (2018). Deep Learning for Image Processing Applications. Springer. 26 .Brock, A., Donahue, J., & Simonyan, K. (2019). Large Scale GAN Training for High Fidelity Natural Image Synthesis. ICLR. 29. Chollet, F. (2015). Keras: Deep Learning Library for Theano and TensorFlow. GitHub. 42. Дистанційний курс «Кваліфікаційні роботи бакалаврів» сайту дистанційного навчання ТНТУ [Електронний ресурс]. – Режим доступу: URL: https://dl.tntu.edu.ua/bounce.php?course=5329. 43. Стиценко Т.Є., Пронюк Г.В., Сердюк Н.М., Хондак І.І. «Безпека життєдіяльності»: навч. посібник / Т.Є Стиценко, Г.В. Пронюк, Н.М. Сердюк, І.І. Хондак. – Харкiв: ХНУРЕ, 2018. – 336 с. 39. Jaderberg, M., et al. (2015). Spatial Transformer Networks. NeurIPS.Xie, S., et al. (2017). Aggregated Residual Transformations for Deep Neural Networks. IEEE CVPR. 40. Han, S., et al. (2015). Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding. ICLR. |
Тип вмісту: | Bachelor Thesis |
Розташовується у зібраннях: | 121 — Інженерія програмного забезпечення (бакалаври) |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
dyplom_Melnyk_2025.pdf | 10,33 MB | Adobe PDF | Переглянути/відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.
Інструменти адміністратора