Link lub cytat.
http://elartu.tntu.edu.ua/handle/lib/50643| Tytuł: | Методи та програмно-апаратні засоби автоматизованої ідентифікації і сортування медіаконтенту |
| Inne tytuły: | Methods and hardware–software tools for automated identification and sorting of media content |
| Authors: | Музичук, Андрій Андрійович Muzychuk, Andrii |
| Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University |
| Bibliographic description (Ukraine): | Музичук А.А. Методи та програмно-апаратні засоби автоматизованої ідентифікації і сортування медіаконтенту : кваліфікаційна робота на здобуття ступеня магістр: спец. 123 — комп’ютерна інженерія / наук.кер. Н.Я. Шингера. — Тернопіль: ТНТУ, 2025. — 68 с. |
| Bibliographic description (International): | Muzychuk A. Methods and hardware–software tools for automated identification and sorting of media content : Master Thesis „123 — Computer Engineering“ / Andrii Muzychuk - Ternopil, TNTU, 2025 – 68 p. |
| Data wydania: | 19-gru-2025 |
| Data archiwizacji: | 26-cze-2025 |
| Date of entry: | 29-gru-2025 |
| Wydawca: | Тернопільський національний технічний університет імені Івана Пулюя |
| Kraj (kod): | UA |
| Place edycja: | Тернопільський національний технічний університет імені Івана Пулюя |
| Promotor: | Шингера, Наталія Ярославівна Shynhera, Natalya |
| Członkowie Komitetu: | Деркач, Марина Володимирівна Derkach, Maryna |
| UDC: | 004.93 |
| Słowa kluczowe: | 123 комп’ютерна інженерія комп’ютерна система медіаконтент комп’ютерний зір нейронна мережа YOLO Python H.265 класифікація відео. computer system media content computer vision neural network video classification |
| Strony: | 68 |
| Abstract: | Кваліфікаційна робота присвячена розробці методів та програмних засобів для автоматизованої ідентифікації та сортування відеоконтенту. У роботі проведено аналіз сучасних алгоритмів комп’ютерного зору та стандартів компресії відеоданих для довготривалого зберігання. Розроблено програму мовою Python із використанням бібліотек OpenCV та Ultralytics.
Основою системи ідентифікації обрано нейронну мережу архітектури YOLO11, яка забезпечує детекцію об'єктів у реальному часі. Реалізовано алгоритм логічного мапінгу для категоризації відео за змістом та підсистему автоматичного транскодування файлів у формати H.264/H.265 за допомогою FFmpeg. Результати роботи дозволяють автоматизувати процес впорядкування великих медіаархівів та суттєво зменшити обсяг займаного дискового простору без втрати візуальної якості. The qualification paper is devoted to the development of methods and software tools for the automated identification and sorting of video content. The paper analyzes modern computer vision algorithms and video data compression standards for long-term storage. A software system was developed using the Python programming language and the OpenCV and Ultralytics libraries. The YOLO11 neural network architecture was selected as the core of the identification system, ensuring real-time object detection. A logical mapping algorithm for content-based video categorization and a subsystem for automatic file transcoding into H.264/H.265 formats using FFmpeg have been implemented. The results of the study allow for automating the organization of large media archives and significantly reducing disk space usage without compromising visual quality. |
| Content: | ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ СУЧАСНИХ ТЕХНОЛОГІЙ І ПРАКТИК 12 1.1 Область застосувань технології 12 1.2 Сучасні системи комп’ютерного зору 15 1.3 Актуальні системи комп’ютерного зору 17 1.4 Принципи функціонування згорткових нейронних мереж у задачах автоматизованого аналізу зображень 18 1.5 Аналіз сучасних методів та стандартів компресії відеоданих для систем довготривалого зберігання 20 1.6 Особливості компресії відеопотоку для задач комп'ютерного зору та машинної ідентифікації об'єктів 22 1.7 Висновки до розділу 1 23 РОЗДІЛ 2 РОЗРОБКА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ДЛЯ АВТОМАТИЗОВАНОГО СОРТУВАННЯ МЕДІАКОНТЕНТУ 25 2.1 Загальна архітектура системи 25 2.2 Приклад використання та функціональні вимоги 27 2.3 Обґрунтування вибору моделі комп’ютерного зору для підсистеми ідентифікації відеоконтенту 28 2.4 Вибір мови програмування та середовища розробки 35 2.5 Опис алгоритму роботи програми 36 2.6 Розробка алгоритму прийняття рішень та логіки класифікації 38 2.7 Висновки до розділу 2 39 РОЗДІЛ 3 ПРАКТИЧНА РЕАЛІЗАЦІЯ СИСТЕМИ 41 3.1 Розгортання середовища розробки та його налаштування 41 3.2 Розгортання моделі YOLO11 та перевірка її працездатності 44 3.3 Програмна реалізація функціоналу ідентифікації відеоконтенту 46 3.4 Реалізація підсистеми транскодування та оптимізації зберігання відеоданих 51 3.5 Тестування та порівняльний аналіз ефективності роботи системи 53 3.6 Транскодування відео за допомогою розробленої системи 55 3.7 Висновки до Розділу 3 56 РОЗДІЛ 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 58 4.1 Охорона праці 58 4.2 Безпека в надзвичайних ситуаціях 58 ВИСНОВКИ 59 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 60 Додаток A Тези конференцій 63 |
| URI: | http://elartu.tntu.edu.ua/handle/lib/50643 |
| Właściciel praw autorskich: | © Музичук Андрій Андрійович, 2025 © Muzychuk Andrii, 2025 |
| Wykaz piśmiennictwa: | Луцик Н.С., Луцків А.М., Осухівська Г.М., Тиш Є.В. ПрЛуцик Н.С., Луцків А.М., Осухівська Г.М., Тиш Є.В. Методичні рекомендації до виконання кваліфікаційної роботи магістра для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль. 2024. С. 44.ограма та методичні рекомендації з проходження практики за тематикою кваліфікаційної роботи для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль: ТНТУ. 2024. С. 45. Варавін А.В., Лещишин Ю.З., Чайковський А.В. Методичні вказівки до виконання курсового проєкту з дисципліни «Дослідження і проєктування комп’ютерних систем та мереж» для здобувачів другого (магістерського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль: ТНТУ, 2024. С. 32. А.А. Музичук. Оптимізація алгоритмів сортування відеоданих у хмарних системах передачі мультимедіа. Збірник тез доповідей XIV Міжнародної науково-технічної конференції молодих учених та студентів. 2025. С. 312 А.А. Музичук. Сучасні системи комп’ютерного зору в медіаіндустрії. Матеріали XIII науково-технічної конференції «інформаційні моделі, системи та технології». 2025. С. 68 Кривоносов В.Є. Аналіз ефективності алгоритмів виявлення об’єктів на зображеннях у реальному часі. Вісник НТУ «ХПІ». Серія: Системний аналіз, управління та інформаційні технології. 2022. № 1 (7). С. 45–50. Resolving machine learning tasks in distributed memory environment / H. Aboah, R. Ruwimbo, V. Sobol, A. Lutskiv // Proceedings of the scientific and technical conference "Information models, systems and technologies", 08-09 December 2021. Tern. : TNTU, 2021. — P. 133. Дзюбак Ю. Аналіз методів та засобів хостингу ресурсів з використанням віртуалізації / Ю. Дзюбак, Я. Коненко, Н. Луцик // Матеріали Ⅹ науково-технічної конференції „Інформаційні моделі, системи та технології“, 7–8 грудня 2022 року. Т. : ТНТУ, 2022. С. 137. Матушинець А. В. Комп’ютеризована система моніторингу і керування електрокоптильнею : кваліфікаційна робота на здобуття освітнього ступеня бакалавр: спец. 123 — комп’ютерна інженерія / наук. кер. Р. О. Жаровський. Тернопіль: ТНТУ, 2025. С. 70. Щур Т. Використання штучного інтелекту для систем розпізнавання в інтернеті речей / Т. Щур, Г. М. Осухівська // Тези Ⅴ міжнародної конференції „Цифрова економіка: інновації та сталий розвиток“, 28-29 листопада 2024 року. Т. : ТНТУ, 2024. — С. 131. Sullivan G.J., Ohm J.R., Han W.J., Wiegand T. Overview of the High Efficiency Video Coding (HEVC) Standard. IEEE Transactions on Circuits and Systems for Video Technology. 2012. Vol. 22. No. 12. P. 1649–1668. Emerging Standards for Machine-to-Machine Video Coding 2025 URL: https://arxiv.org/html/2512.10230v1 (дата звернення: 12.12.2025). Richardson I.E. The H.264 Advanced Video Compression Standard. 2nd Edition. Wiley. 2010. 348 p. Personalizing Visual Search with Multimodal Embeddings URL: https://developers.googleblog.com/see-the-similarity-personalizing-visual-search-with-multimodal-embeddings/ (дата звернення: 12.12.2025). LeCun Y., Bengio Y., Hinton G. Deep learning. Nature. 2015. Vol. 521. P. 436–444. Szeliski R. Computer Vision: Algorithms and Applications. 2nd Edition. Springer. 2022. 832 p. Grois D., Marpe D., Mulayoff A. Performance Comparison of H.265/MPEG-HEVC, VP9, and H.264/MPEG-AVC Encoders. 30th Picture Coding Symposium (PCS). 2013. P. 394–397. FFmpeg Documentation. URL: https://ffmpeg.org/documentation.html (дата звернення: 10.12.2025). Bradski G., Kaehler A. Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library. O'Reilly Media. 2017. 1000 p. Terven J., Cordova-Esparza D. A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS. Machine Learning and Knowledge Extraction. 2023. Vol. 5(4). P. 1680–1716. Jocher G., Chaurasia A., Qiu J. Ultralytics YOLOv8. 2023. URL: https://github.com/ultralytics/ultralytics (дата звернення: 12.12.2025). Wang C.-Y., Bochkovskiy A., Liao H.-Y.M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023. P. 7464–7475. Redmon J., Divvala S., Girshick R., Farhadi A. You Only Look Once: Unified, Real-Time Object Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 779–788. Мороз О.В., Степанченко О.М. Порівняльний аналіз сучасних методів розпізнавання об’єктів на відеозображеннях. Штучний інтелект. 2020. № 3. С. 12–19. Lutz M. Learning Python. 5th Edition. O'Reilly Media. 2013. 1600 p. Schoch T. CustomTkinter UI-Library Documentation. URL: https://github.com/TomSchimansky/CustomTkinter (дата звернення: 12.12.2025). |
| Typ zawartości: | Master Thesis |
| Występuje w kolekcjach: | 123 — комп’ютерна інженерія |
Pliki tej pozycji:
| Plik | Opis | Wielkość | Format | |
|---|---|---|---|---|
| Andrii_Muzychuk.pdf | 2,91 MB | Adobe PDF | Przeglądanie/Otwarcie |
Pozycje DSpace są chronione prawami autorskimi
Narzędzia administratora