Використання генеративної моделі stable diffusion для аугментації даних і поліпшення якості сегментації зображень

Ляпандра, Максим Степанович; Liapandra, Maksym

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://elartu.tntu.edu.ua/handle/lib/52884

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Карнаухов, Андрій Костянтинович	-
dc.contributor.advisor	Karnaukhov, Andrii	-
dc.contributor.author	Ляпандра, Максим Степанович	-
dc.contributor.author	Liapandra, Maksym	-
dc.date.accessioned	2026-06-29T16:37:54Z	-
dc.date.available	2026-06-29T16:37:54Z	-
dc.date.issued	2026-06-27	-
dc.date.submitted	2026-06-13	-
dc.identifier.uri	http://elartu.tntu.edu.ua/handle/lib/52884	-
dc.description	Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 27.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя	uk_UA
dc.description.abstract	У першому розділі розглянуті основні методи сегментації зображень, а також різні підходи до аугментації зображень. Висвітлена дифузійна модель генерації зображень Stable Diffusion, показаний принцип її роботи та основні компоненти. описані її переваги в порівнянні з іншими моделями. У другому розділі наведена структура експериментів, описана підготовка моделі для завдання семантичної сегментації. Для вирішення задачі семантичної сегментації обрано повнозгорткову нейронну мережу U-Net. Оцінка ефективності моделей здійснюється за допомогою метрик IoU та Accuracy. Розглянуто та реалізовано спосіб розширення обмеженої тренувальної вибірки із використанням функції «Inpaint», яка дозволяє виділяти маскою окремі частини зображення та змінювати їх з урахуванням текстового запиту. За допомогою даного методу обмежена тренувальна вибірка була збільшена зі 100 зображень до 1100. У третьому розділі проведені експерименти з навчанням моделі U-Net на різних тренувальних вибірках та проведено порівняння результатів, а також надано рекомендації використанню Stable Diffusion та змальовано можливості покращення експериментів. У четвертому розділі описані важливі питання безпеки життєдіяльності та основ охорони праці.	uk_UA
dc.description.abstract	The first section discusses the main methods of image segmentation, as well as various approaches to image augmentation. The diffusion model of image generation Stable Diffusion is highlighted, the principle of its operation and main components are shown. Its advantages compared to other models are described. The second section presents the structure of the experiments, describes the preparation of the model for the semantic segmentation task. The fully convolutional neural network U-Net was chosen to solve the semantic segmentation task. The effectiveness of the models is assessed using the IoU and Accuracy metrics. A method for expanding the limited training sample using the “Inpaint” function is considered and implemented, which allows you to select individual parts of the image with a mask and change them taking into account the text query. Using this method, the limited training sample was increased from 100 images to 1100. In the third section, experiments were conducted with training the U-Net model on different training samples and a comparison of the results was made, as well as recommendations for using Stable Diffusion and possibilities for improving the experiments were outlined. In chapter 4, important issues of life safety and the basics of labor protection are described..	uk_UA
dc.description.tableofcontents	ВСТУП 8 РОЗДІЛ 1 ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ 10 1.1 Підходи до розв'язання задач сегментації зображень 10 1.1.1 Поняття сегментації 10 1.1.2 Традиційні методи сегментації зображень 11 1.1.3 Методи сегментації зображень, що ґрунтуються на глибокому навчанні 12 1.2 Огляд методів аугментації зображень 16 1.2.1 Поняття аугментації 16 1.2.2 Класичні методи аугментації зображень 17 1.2.3 Аугментація зображень методами глибокого навчання 17 1.2.4 Фреймворки для аугментації даних 20 1.3 Опис, переваги та компоненти Stable Diffusion 21 РОЗДІЛ 2. РОЗРОБКА СТРУКТУРИ ЕКСПЕРИМЕНТІВ, ПІДГОТОВКА МОДЕЛІ СЕГМЕНТАЦІЇ ТА НАБОРУ ДАНИХ 23 2.1 Структура експериментів, що проводяться 23 2.2 Підготовка моделі семантичної сегментації 24 2.3 Встановлення Stable Diffusion Web UI та доступ до моделі 27 2.4 Опис та підготовка набору даних 27 2.4.1 Опис набору даних 27 2.4.2 Підготовка набору даних 29 2.5 Опис стеку ключових технологій, що використовуються 29 2.6 Опис та реалізація алгоритму генерації зображень 30 РОЗДІЛ 3. ПРОВЕДЕННЯ ЕКСПЕРИМЕНТІВ ДЛЯ ОЦІНКИ ЕФЕКТИВНОСТІ ГЕНЕРАТИВНОЇ АУГМЕНТАЦІЇ ДАНИХ 34 3.1 Навчання моделі на повному наборі даних 34 3.2 Навчання моделі на обмеженому наборі даних 35 3.3 Навчання моделі на обмеженому наборі даних, об'єднаному із синтетичними даними 36 3.4 Порівняння результатів 41 3.5 Рекомендації щодо використання Stable Diffusion та можливості покращення експериментів 47 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 49 4.1 Класифікація шкідливих та небезпечних виробничих факторів 49 4.2 Вплив вібрації на людину 51 ВИСНОВКИ 55 ПЕРЕЛІК ДЖЕРЕЛ 57	uk_UA
dc.format.extent	60	-
dc.language.iso	uk	uk_UA
dc.publisher	Тернопільський національний технічний університет імені ім. І. Пулюя	uk_UA
dc.subject	122	uk_UA
dc.subject	комп’ютерні науки	uk_UA
dc.subject	аугментація даних	uk_UA
dc.subject	дифузійна модель	uk_UA
dc.subject	згорткові нейронні мережі	uk_UA
dc.subject	комп'ютерний зір	uk_UA
dc.subject	семантична сегментація	uk_UA
dc.subject	data augmentation	uk_UA
dc.subject	diffusion model	uk_UA
dc.subject	convolutional neural networks	uk_UA
dc.subject	computer vision	uk_UA
dc.subject	semantic segmentation	uk_UA
dc.title	Використання генеративної моделі stable diffusion для аугментації даних і поліпшення якості сегментації зображень	uk_UA
dc.title.alternative	Using the Stable Diffusion Generative Model for Data Augmentation and Improving Image Segmentation Quality	uk_UA
dc.type	Bachelor Thesis	uk_UA
dc.rights.holder	© Ляпандра Максим Степанович, 2026	uk_UA
dc.coverage.placename	Тернопіль	uk_UA
dc.subject.udc	004.93	uk_UA
dc.relation.references	1. Yeromina, N. & Koltun, Yu & Bespalyi, A. & Shmatko, Yu. (2024). Аналіз сучасних методів сегментації зображень в інтересах навігації мобільних роботів. Системи управління, навігації та зв’язку. Збірник наукових праць. 2. C. 82-86.	uk_UA
dc.relation.references	2. Goodfellow, I., Bengio, Y., & Courville, A. “Deep Learning.” MIT Press, 2016. 788 p.	uk_UA
dc.relation.references	3. TENSORFLOW І МАШИННЕ НАВЧАННЯ. [Електронний ресурс] – Режим доступу: https://foxminded.ua/tensorflow-shcho-tse/ (дата звертання: 03.05.2026).	uk_UA
dc.relation.references	4. Long J. Fully Convolutional Networks for Semantic Segmentation / J. Long, E. Shelhamer, T. Darrell // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. № 4. Vol. 39. P. 640–651.	uk_UA
dc.relation.references	5. Ronneberger O. U-Net: Convolutional Networks for Biomedical Image Segmentation / O. Ronneberger, Ph. Fischer, T. Brox // International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI-2015). – 2015. Vol. 39. P. 234–241.	uk_UA
dc.relation.references	6. Badrinarayanan V. SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation / V. Badrinarayanan, A. Kendall, R. Cipolla // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. № 13. 57 Vol. 39. P. 1–14.	uk_UA
dc.relation.references	7. Khalifa N. A comprehensive survey of recent trends in deep learning for digital images augmentation / N. Khalifa, M. Loey, S. Mirjalili // Artificial Intelligence Review. An International Science and Engineering Journal. 2022. № 55. P. 2351–2377.	uk_UA
dc.relation.references	8. Методичні вказівки до виконання кваліфікаційної роботи ор Бакалавр для студентів спеціальності 122 – Комп’ютерні науки, всіх форм навчання / укладачі: Готович В.А., Дуда О.М. Никитюк В.В. – Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2024. – 43 с.	uk_UA
dc.relation.references	9. Alomar K. Data Augmentation in Classification and Segmentation: A Survey and New Strategies / K. Alomar, H.I. Aysel, X. Cai // Image Segmentation Techniques: Current Status and Future Directions. 2023. № 9 (2).	uk_UA
dc.relation.references	10. Lytvynenko, I., Lupenko, S., Nazarevych, O., Shymchuk, G., & Hotovych, V. (2021). Mathematical model of gas consumption process in the form of cyclic random process. 2021 IEEE 16th International Conference on Computer Sciences and Information	uk_UA
dc.relation.references	11. Як працюють моделі для генерації зображень. [Електронний ресурс] – Режим доступу: https://dou.ua/forums/topic/53934/ (дата звертання: 03.05.2026).	uk_UA
dc.relation.references	12. Tanaka F. Data augmentation using gans / F. Tanaka, C. Aranha [Електронний ресурс] – Режим доступу: https://arxiv.org/abs/1904.09135 (дата звертання: 03.05.2026).	uk_UA
dc.relation.references	13. Yamaguchi S. Effective data augmentation with multi-domain learning gans / S. Yamaguchi, S. Kanai, T. Eda // Proceedings of the AAAI Conference on Artificial Intelligence. 2020. № 34 (04). P. 6566–6574.	uk_UA
dc.relation.references	14. Lytvynenko I. V. Method of segmentation of determined cyclic signals for the problems related to their processing and modeling. Scientific journal of the Ternopil National Technical University. No. 4 (88). 2017. ISSN: 2522-4433. Р. 153–169. https://doi.org/10.33108/visnyk_tntu2017.04.153	uk_UA
dc.relation.references	15. Sohl-Dickstein J. Deep unsupervised learning using nonequilibrium thermodynamics / J. Sohl-Dickstein, E. Weiss, N. Maheswaranathan // Proceedings of the 32nd International Conference on Machine Learning. 2015. Vol. 37. P. 2256–2265.	uk_UA
dc.relation.references	16. Ho J. Denoising Diffusion Probabilistic Models / J. Ho, A. Jain, P. Abbeel // Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 1–25.	uk_UA
dc.relation.references	17. He R. Is synthetic data from generative models ready for image recognition? / R. He, S. Sun, X. Yu, C. Xue, W. Zhang, P. Torr, S. Bai, X. Qi // Conference paper at 11th International Conference on Learning Representations. 2023. P. 1–24.	uk_UA
dc.relation.references	18. Trabucco B. Effective data augmentation with diffusion models / B. Trabucco, K. Doherty, M. Gurinas, R. Salakhutdinov [Електронний ресурс] – Режим доступу: https://arxiv.org/pdf/2302.07944.pdf (дата звертання: 04.05.2026).	uk_UA
dc.relation.references	19. Магія за пікселями: Пояснення дифузійних моделей для генерації AI-арту. [Електронний ресурс] – Режим доступу: https://sider.ai/uk/blog/ai-tools/the-magic-behind-the-pixels-diffusion-models-explained-for-ai-art-generation (дата звертання: 05.05.2026).	uk_UA
dc.relation.references	20. Leung K. Top Python libraries for Image Augmentation in Computer Vision [Електронний ресурс] – Режим доступу: https://towardsdatascience.com/top-python-libraries-for-image-augmentation-incomputer-vision-2566bed0533e (дата звертання: 05.05.2026).	uk_UA
dc.relation.references	21. Albumentations: A Python library for advanced Image Augmentation strategies [Електронний ресурс] – Режим доступу: https://medium.com/mlearning-ai/albumentations-a-python-library-for-advancedimage-augmentation-strategies-752bff3a3da0 (дата звертання: 05.05.2026).	uk_UA
dc.relation.references	22. Stable Diffusion Public Release [[Електронний ресурс] – Режим доступу: https://stability.ai/blog/stablediffusion-public-release (дата звертання: 07.05.2026).	uk_UA
dc.relation.references	23. Як використовувати стабільну дифузійну нейронну мережу [Електронний ресурс] – Режим доступу: https://alexhost.com/uk/faq/how-to-use-the-stable-diffusion-neural-network/ (дата звертання: 07.05.2026).	uk_UA
dc.relation.references	24. He K. Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification / K. He, X. Zhang, S. Ren, J. Sun // Conference paper at IEEE International Conference on Computer Vision (ICCV). 2015. P. 1–11.	uk_UA
dc.relation.references	25. Salehi S.S.M. Tversky loss function for image segmentation using 3D fully convolutional deep networks / S.S.M. Salehi, D. Erdogmus, A. Gholipour // Machine Learning in Medical Imaging. Proceedings of 8th International Workshop MLMI 2017. 2017. P. 379–387.	uk_UA
dc.relation.references	26. Loshchilov I. Decoupled Weight Decay Regularization / I. Loshchilov, F. Hutter // Conference paper at 7th International Conference on Learning Representations. 2019. P.1–8.	uk_UA
dc.relation.references	27. Stable-diffusion-webui [Електронний ресурс] – Режим доступу: https://github.com/AUTOMATIC1111/stable-diffusion-webui (дата звертання: 08.05.2026).	uk_UA
dc.relation.references	28. API guide [Електронний ресурс] – Режим доступу: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/API (дата звертання: 08.05.2026).	uk_UA
dc.relation.references	29. Stable Diffusion with Diffusers [Електронний ресурс] – Режим доступу: https://huggingface.co/blog/stable_diffusion (дата звертання: 09.05.2026).	uk_UA
dc.relation.references	30. Stable Diffusion v1-5 Model Card [Електронний ресурс] – Режим доступу: https://huggingface.co/runwayml/stable-diffusion-v1-5 (дата звертання: 09.05.2026).	uk_UA
dc.relation.references	31. Stable-Diffusion-Inpainting [Електронний ресурс] – Режим доступу: https://huggingface.co/runwayml/stable-diffusion-inpainting (дата звертання: 09.05.2026).	uk_UA
dc.relation.references	32. Wah C. The Caltech-UCSD Birds-200-2011 Dataset / C. Wah, S. Branson, P. Welinder, P. Perona, S. Belongie // Caltech Vision Lab. 2011. P. 1–8.	uk_UA
dc.relation.references	33. Caltech-UCSD Birds-200-2011 (CUB-200-2011) [Електронний ресурс] – Режим доступу: https://www.vision.caltech.edu/datasets/cub_200_2011/ (дата звертання: 10.05.2026).	uk_UA
dc.relation.references	34. CUB-200-2011 Segmentations [Електронний ресурс] – Режим доступу: https://data.caltech.edu/records/w9d68-gec53 (дата звертання: 10.05.2026).	uk_UA
dc.relation.references	35. Pytorch [Електронний ресурс] – Режим доступу: https://github.com/pytorch/vision (дата звертання: 10.05.2026).	uk_UA
dc.relation.references	36. Segmentation_models.pytorch [Електронний ресурс] – Режим доступу: https://github.com/qubvel/segmentation_models.pytorch/tree/master (дата звертання: 10.05.2026).	uk_UA
dc.relation.references	37. TensorBoard: набір інструментів для візуалізації TensorFlow [Електронний ресурс] – Режим доступу: https://www.tensorflow.org/ (дата звертання: 11.05.2026).	uk_UA
dc.relation.references	38. Improving Deep Learning Models with Data Augmentation [Електронний ресурс] – Режим доступу: https://medium.com/@ShortHills_Tech/improving-deep-learning-models-withdata-augmentation-d4e3d0a9301b (дата звертання: 11.05.2026).	uk_UA
dc.relation.references	39. Lupenko, S. A., Lytvynenko, I. V., Sverstiuk, A., Shelestovskyi, B., & Horkunenko, A. (2021). Software for Statistical Processing and Modeling of a Set of Synchronously Registered Cardio Signals of Different Physical Nature. CMIS, 194-205.	uk_UA
dc.relation.references	40. Bodnarchuk, I., Skorenkyy, Y., Kramar, T., Duda, O., & Nykytyuk, V. (2022). Use of Analytical Hierarchy Process in Scenarios Design for a Digital Museum with XR components. ITTAP, 414–425	uk_UA
dc.relation.references	41. Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2026).	uk_UA
dc.relation.references	42. Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної та заочної (дистанційної) форм навчання / укл.: Стручок В. С. Тернопіль: ФОП Паляниця В. А., 2022. 156 с.	uk_UA
dc.contributor.affiliation	Тернопільський національний технічний університет імені ім. І. Пулюя	uk_UA
dc.coverage.country	UA	uk_UA
dc.identifier.citation2015	Ляпандра М. С. Використання генеративної моделі stable diffusion для аугментації даних і поліпшення якості сегментації зображень : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. А. К. Карнаухов. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 60 с.	uk_UA
Vyskytuje se v kolekcích:	122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
2026_KRB_SN-41_Liapandra_MS.pdf	Дипломна робота	1,53 MB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

Nástroje administrátora