Розробка програмної системи для апскейлінгу відеопотоку з використанням методів глибокого навчання та часової узгодженості кадрів

Духній, Владислав Іванович

Använd denna länk för att citera eller länka till detta dokument: http://elartu.tntu.edu.ua/handle/lib/52599

Titel:	Розробка програмної системи для апскейлінгу відеопотоку з використанням методів глибокого навчання та часової узгодженості кадрів
Övriga titlar:	Development of a software system for upscaling video streams using deep learning methods and temporal frame alignment
Författare:	Духній, Владислав Іванович
Affiliation:	ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Україна
Bibliographic reference (2015):	Духній В. І. Розробка програмної системи для апскейлінгу відеопотоку з використанням методів глибокого навчання та часової узгодженості кадрів : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 – інженерія програмного забезпечення / наук. кер. Ю. М. Стоянов. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 67 с.
Utgivningsdatum:	jun-2026
Submitted date:	jun-2026
Date of entry:	23-jun-2026
Utgivare:	Тернопільський національний технічний університет імені Івана Пулюя
Country (code):	UA
Place of the edition/event:	ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Supervisor:	Стоянов, Юрій Миколайович
Committee members:	Загородна, Наталія Володимирівна
UDC:	004.9
Nyckelord:	інженерія програмного забезпечення глибоке навчання супер роздільність апскейлінг відео генеративно-змагальна мережа Real-ESRGAN часова узгодженість кадрів оптичний потік відновлення облич обробка зображень software engineering deep learning super-resolution video upscaling generative adversarial network temporal frame consistency optical flow face restoration image processing
Number of pages:	67
Sammanfattning:	Метою роботи є проєктування та розробка програмної системи, яка підвищує роздільну здатність зображень і відеопотоку методами глибокого навчання та зменшує міжкадрове мерехтіння за рахунок забезпечення часової узгодженості кадрів. У першому розділі проаналізовано предметну область підвищення роздільної здатності, розглянуто еволюцію методів глибокого навчання для суперроздільності та проблему часової узгодженості у відео, виконано огляд програмних аналогів, визначено акторів і варіанти використання, сформульовано вимоги до системи та критерії успішності. У другому розділі обґрунтовано вибір процесу й засобів розробки, спроєктовано архітектуру системи та місце в ній компонентів глибокого навчання, описано структури даних, об'єктно-орієнтовану модель і веб-інтерфейс взаємодії. У третьому розділі описано реалізацію та інтеграцію переднавчених моделей, реалізацію модуля часової узгодженості на основі оптичного потоку, наведено результати функціонального й навантажувального тестування, оцінювання якості за метриками та розгортання системи. У четвертому розділі розглянуто питання безпеки життєдіяльності та основ охорони праці, пов'язані з робочим місцем розробника програмного забезпечення. Об'єктом дослідження є процес підвищення роздільної здатності зображень та відеопотоку засобами глибокого навчання. Предметом дослідження є методи, моделі та програмні засоби апскейлінгу відео на основі генеративно-змагальних мереж із забезпеченням часової узгодженості кадрів. Методи дослідження: аналіз програмних аналогів, проєктування архітектури програмного забезпечення, методи глибокого навчання для суперроздільності, оцінювання оптичного потоку для часової стабілізації, експериментальне оцінювання якості за метриками PSNR, SSIM і LPIPS, модульне та інтеграційне тестування. The purpose of the work is to design and develop a software system that increases the resolution of images and video streams with deep learning methods and reduces inter-frame flicker by enforcing temporal frame consistency. The first chapter analyses the problem domain of resolution enhancement, reviews the evolution of deep learning methods for super-resolution and the temporal consistency problem in video, surveys software analogues, defines actors and use cases, and states the system requirements and success criteria. The second chapter justifies the development process and toolset, designs the system architecture and the place of the deep learning components within it, and describes the data structures, the object-oriented model and the web interaction interface. The third chapter describes the implementation and integration of the pretrained models, the optical-flow-based temporal consistency module, the results of functional and load testing, the quality evaluation against metrics, and the system deployment. The fourth chapter addresses life safety and occupational health issues related to a software developer's workplace. The object of the study is the process of increasing the resolution of images and video streams by deep learning methods. The subject of the study is the methods, models and software tools for video upscaling based on generative adversarial networks with temporal frame consistency. Research methods: analysis of software analogues, software architecture design, deep learning methods forsuper-resolution, optical flow estimation for temporal stabilisation, experimental quality evaluation using the PSNR, SSIM and LPIPS metrics, unit and integration testing
Content:	ЗМІСТ ВСТУП............................................................................................................................ 11 1 АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ТА ВИМОГ ДО ПРОГРАМНОЇ СИСТЕМИ13 1.1 АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ................................................................................. 13 1.2 ОГЛЯД ІСНУЮЧИХ РІШЕНЬ...................................................................................... 15 1.3 АНАЛІЗ ТА ПІДГОТОВКА ДАНИХ................................................................................ 17 1.4 ВИЗНАЧЕННЯ АКТОРІВ ТА ВАРІАНТІВ ВИКОРИСТАННЯ............................................... 18 1.5 ПОСТАНОВКА ЗАВДАННЯ ТА ВИМОГИ ДО СИСТЕМИ.................................................... 20 1.6 ВИСНОВКИ ДО ПЕРШОГО РОЗДІЛУ........................................................................... 21 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ........................... 23 2.1 ВИБІР ПРОЦЕСУ РОЗРОБКИ.....................................................................................23 2.2 ПРОЄКТУВАННЯ АРХІТЕКТУРИ СИСТЕМИ.................................................................. 24 2.3 ПРОЄКТУВАННЯ СТРУКТУР ДАНИХ........................................................................... 26 2.4 ПОБУДОВА UML-ДІАГРАМИ КЛАСІВ........................................................................ 28 2.5 ВИБІР МОВИ ТА СЕРЕДОВИЩА РОЗРОБКИ................................................................ 29 2.6 РЕАЛІЗАЦІЯ ОСНОВНИХ КЛАСІВ ТА МЕТОДІВ..............................................................30 2.7 РОЗРОБКА ІНТЕРФЕЙСУ КОРИСТУВАЧА..................................................................... 36 2.8 ВИСНОВКИ ДО ДРУГОГО РОЗДІЛУ.............................................................................40 3 ТЕСТУВАННЯ, ВПРОВАДЖЕННЯ ТА ПІДТРИМКА ПРОГРАМНОЇ СИСТЕМИ......................................................................................................................41 3.1 ВИДИ ТА ПЛАН ТЕСТУВАННЯ....................................................................................41 3.2 МОДУЛЬНЕ ТЕСТУВАННЯ......................................................................................... 43 3.3 ФУНКЦІОНАЛЬНЕ ТЕСТУВАННЯ................................................................................ 45 3.4 ОЦІНЮВАННЯ ЕФЕКТИВНОСТІ ТА ВЕРИФІКАЦІЯ........................................................46 3.4.1 ЯКІСТЬ ВІДНОВЛЕННЯ ЗОБРАЖЕНЬ.................................................................. 46 3.4.2 ЕФЕКТИВНІСТЬ МОДУЛЯ ЧАСОВОЇ УЗГОДЖЕНОСТІ.............................................48 3.4.3 ПРОДУКТИВНІСТЬ І ВИКОРИСТАННЯ ПАМ'ЯТІ....................................................49 3.5 ІНСТРУКЦІЯ КОРИСТУВАЧА ТА РОЗГОРТАННЯ СИСТЕМИ............................................. 513.6 ВИСНОВКИ ДО ТРЕТЬОГО РОЗДІЛУ........................................................................... 53 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ..........................54 4.1 РИЗИК ЯК КІЛЬКІСНА ОЦІНКА НЕБЕЗПЕК...................................................................54 4.2 ГІГІЄНІЧНІ ВИМОГИ ДО ОРГАНІЗАЦІЇ ТА ОБЛАДНАННЯ РОБОЧИХ МІСЦЬ З ВІДЕОДИСПЛЕЙНИМИ ТЕРМІНАЛАМИ.............................................................................. 55 4.3 ВИСНОВКИ ДО ЧЕТВЕРТОГО РОЗДІЛУ....................................................................... 59 ВИСНОВКИ................................................................................................................... 60 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ...................................................................... 61 ДОДАТОК А...................................................................................................................65 ДОДАТОК Б................................................................................................................... 67
URI:	http://elartu.tntu.edu.ua/handle/lib/52599
Copyright owner:	© Духній Владислав Іванович, 2026
References (Ukraine):	1. Wang x. et al. ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks. Proc. European Conf. on Computer Vision (ECCV) Workshops. 2018. 2. Wang x., xie L., Dong C., Shan Y. Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data. Proc. IEEE/CVF ICCV Workshops. 2021. P. 1905-1914. 3. Wang x., Li Y., Zhang H., Shan Y. Towards Real-World Blind Face Restoration with Generative Facial Prior (GFPGAN). Proc. IEEE/CVF CVPR. 2021. 4. Liang J. et al. SwinIR: Image Restoration Using Swin Transformer. Proc. IEEE/CVF ICCV Workshops. 2021. 5. Chan K. C. K. et al. BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond. Proc. IEEE/CVF CVPR. 2021. 6. Chan K. C. K. et al. BasicVSR++: Improving Video Super-Resolution with Enhanced Propagation and Alignment. Proc. IEEE/CVF CVPR. 2022. 7. Lai W.-S. et al. Learning Blind Video Temporal Consistency. Proc. European Conf. on Computer Vision (ECCV). 2018. 8. Li J., Pei Z., Zeng T. A Systematic Survey of Deep Learning-Based Single-Image Super-Resolution. ACM Computing Surveys. 2024. DOI:10.1145/3659100. 9. Chen H., He x., Qing L., Wu Y., Ren C., Sheriff R. E., Zhu C. Real-world single image super-resolution: A brief review. Information Fusion. 2022. Vol. 79. P. 124-145. 10. Liu H., Ruan Z., Zhao P. et al. Video super-resolution based on deep learning: a comprehensive survey. Artificial Intelligence Review. 2024. DOI: 10.1007/s10462-022-10147-y. 6 11. The scikit-image development team. Module skimage.metrics: structural_similarity (SSIM), peak_signal_noise_ratio (PSNR). scikit-image documentation. URL: https://scikit-image.org/docs/stable/api/skimage.metrics.html (дата звернення: 13.06.2026). 12. OpenCV team. Optical Flow: calcOpticalFlowFarneback. OpenCV documentation. URL: https://docs.opencv.org/4.x/d4/dee/tutorial_optical_flow.html (дата звернення: 13.06.2026). 13. Zhang R., Isola P., Efros A. A., Shechtman E., Wang O. The Unreasonable Effectiveness of Deep Features as a Perceptual Metric (LPIPS). Proc. IEEE/CVF CVPR. 2018. 14. Blau Y., Michaeli T. The Perception-Distortion Tradeoff. Proc. IEEE/CVF CVPR. 2018. P. 6228-6237. 15. Topaz Labs. Topaz Video AI video enhancement software. URL: https://www.topazlabs.com/topaz-video (дата звернення: 13.06.2026).
Content type:	Bachelor Thesis
Samling:	121 — Інженерія програмного забезпечення, F2 Інженерія програмного забезпечення (бакалаври)

Fulltext och övriga filer i denna post:

Fil	Beskrivning	Storlek	Format
dyplom_Dukhnii_V_2026.pdf		10,67 MB	Adobe PDF	Visa/Öppna

Visa fullständig post

Materialet i DSpace är upphovsrättsligt skyddat och får ej användas i kommersiellt syfte!

Administrativa verktyg