Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/49009
Повний запис метаданих
Поле DCЗначенняМова
dc.contributor.advisorБойко, Ігор Володимирович-
dc.contributor.authorВонсович, Олександр Петрович-
dc.contributor.authorVonsovych, Oleksandr-
dc.date.accessioned2025-06-23T12:29:05Z-
dc.date.available2025-06-23T12:29:05Z-
dc.date.issued2025-06-23-
dc.date.submitted2025-06-09-
dc.identifier.citationВонсович О. П. Програмна система для автоматичної сегментації динамічних фрагментів у відеозаписах за допомогою методів машинного навчання : спец. 121 - інженерія програмного забезпечення / наук. кер. І. В. Бойко. Тернопіль: – Тернопільський національний технічний університет імені Івана Пулюя, 2025. 85 с.uk_UA
dc.identifier.urihttp://elartu.tntu.edu.ua/handle/lib/49009-
dc.description.abstractКваліфікаційна робота бакалавра, виконана Вонсович Олександром Петровичем, студентом групи СП-41 Тернопільського національного технічного університету, присвячена розробці програми для автоматичної сегментації динамічних фрагментів у відеозаписах за допомогою методів машинного навчання. Обсяг роботи становить 85 сторінок, містить 19 рисунків, 2 додатки та список використаних джерел з 22 позицій. Метою дослідження є створення інструменту, який дозволяє автоматично виявляти та сегментувати динамічні моменти у відео з використанням сучасних архітектур нейронних мереж. У процесі роботи було сформовано датасет з відеофрагментів, виконано його фрагментацію та балансування. Для розв'язання поставленої задачі реалізовано та порівняно дві моделі: тривимірну згорткову нейронну мережу (3D CNN) та трансформер-архітектуру Timesformer. Оцінку якості моделей проведено за допомогою метрик класифікації, серед яких confusion matrix, macro precision, macro recall, macro F1 score, balanced accuracy, ROC-AUC та precision-recall curve. Додатково здійснено візуальний аналіз результатів сегментації на тестових відео. За результатами порівняння встановлено, що трансформер-модель продемонструвала вищу точність класифікації, здатність адаптивно розпізнавати динамічні рухи навіть поза межами навчального набору даних, та потенціал для подальшого донавчання. Отримані результати засвідчують доцільність подальшого розвитку системи шляхом розширення навчального датасету, оптимізації моделей та реалізації зручного графічного інтерфейсу для інтерактивного завантаження і обробки відеофайлів.uk_UA
dc.description.abstractThe bachelor’s qualification thesis, completed by Vonsovych Oleksandr Petrovych, a student of group SP-41 at Ternopil National Technical University, is dedicated to the development of a program for the automatic segmentation of dynamic fragments in video recordings using machine learning methods. The volume of the work comprises 85 pages, includes 19 figures, 2 appendices, and a list of references containing 22 sources. The aim of the research is to create a tool that enables the automatic detection and segmentation of dynamic moments in video content by employing modern neural network architectures. In the course of the study, a dataset of video fragments was compiled, followed by its segmentation and balancing. To address the task, two models were implemented and compared: a three-dimensional convolutional neural network (3D CNN) and a transformer-based architecture, Timesformer. The quality of the models was evaluated using classification metrics, including the confusion matrix, macro precision, macro recall, macro F1 score, balanced accuracy, ROC-AUC, and the precision-recall curve. Additionally, a visual analysis of segmentation results on test videos was conducted. The comparative results demonstrated that the transformer model achieved higher classification accuracy, an ability to adaptively recognize dynamic movements even beyond the boundaries of the training dataset, and promising potential for further fine-tuning. The obtained results confirm the feasibility of further system development through the expansion of the training dataset, optimization of the models, and the implementation of a convenient graphical interface for interactive uploading and processing of video files.uk_UA
dc.description.tableofcontentsАНОТАЦІЯ 4 ABSTRACT 5 ЗМІСТ 6 ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ 8 ВСТУП 9 1 АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ 12 1.1 Дослідження сучасних технологій класифікації 12 1.2 Обґрунтування напрямку дослідження 15 1.3 Методика вирішення задачі 16 2 РОЗРОБКА ПРОГРАМНОГО РШЕННЯ 18 2.1 Збір та підготовка тренувальних даних 18 2.1.1 Метод збору тренувальних даних 18 2.1.2 Фрагментація датасету 19 2.1.3 Балансування датасету 20 2.1.4 Характеристика фінальних тренувальних даних 23 2.2 Тренування моделей 25 2.2.1 Тренування 3D CNN 25 2.2.2 Тренування моделі трансформер-архітектури 29 2.3 Евалюація моделей 31 2.3.1 Метрики якості моделей 31 2.3.2 Метрики 3D CNN 33 2.3.3 Метрики Timesformer 38 2.4 Порівняння натренованих моделей з аналогами 42 2.4.1 Аналіз рішень у відкритому доступі 43 2.4.2 Тестування Twelve Labs Classification API 43 2.5 Обмеження та перспективи 45 3 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 47 3.1 Домедична допомога при переломах 47 3.2 Охорона праці при роботі за персональним комп’ютером 49 ВИСНОВКИ 52 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 54 ДОДАТКИ 57 ДОДАТОК A — Лістинг коду програмної системи 58 ДОДАТОК Б — Диск із кваліфікаційною роботою бакалавра 85uk_UA
dc.language.isoukuk_UA
dc.publisherТернопільський національний технічний університет імені Івана Пулюяuk_UA
dc.relation.urihttps://www.sciencedirect.com/science/article/pii/S0031320325004236uk_UA
dc.relation.urihttps://www.mdpi.com/2673-4591/59/1/3uk_UA
dc.relation.urihttps://arxiv.org/html/2410.04449v1uk_UA
dc.relation.urihttps://arxiv.org/abs/1711.10305uk_UA
dc.relation.urihttps://arxiv.org/abs/1412.0767uk_UA
dc.relation.urihttps://arxiv.org/abs/2305.00355uk_UA
dc.relation.urihttps://cloud.google.com/video-intelligenceuk_UA
dc.relation.urihttps://aws.amazon.com/rekognition/video-featuresuk_UA
dc.relation.urihttps://www.twelvelabs.io/blog/effortless-video-classifiers-with-twelve-labs-api-no-ml-training-requireduk_UA
dc.relation.urihttps://dl.tntu.edu.ua/content.php?cid=514586uk_UA
dc.relation.urihttps://dl.tntu.edu.ua/content.php?cid=299865uk_UA
dc.relation.urihttps://dl.tntu.edu.ua/content.php?cid=289193uk_UA
dc.relation.urihttps://zakon.rada.gov.ua/laws/show/z0356-22uk_UA
dc.relation.urihttps://dl.tntu.edu.ua/content.php?cid=289154uk_UA
dc.relation.urihttps://e-construction.gov.ua/laws_detail/3074958732556240833?doc_type=2uk_UA
dc.relation.urihttps://dl.tntu.edu.ua/bounce.php?course=5329uk_UA
dc.subjectвідеокласифікаціяuk_UA
dc.subjectvideo classificationuk_UA
dc.subjectмашинне навчанняuk_UA
dc.subjectmachine learninguk_UA
dc.subjectкомп’ютерний зірuk_UA
dc.subjectcomputer visionuk_UA
dc.subjectтрансформерuk_UA
dc.subjecttransformeruk_UA
dc.subjectсегментація відеоuk_UA
dc.subjectvideo segmentationuk_UA
dc.subjectаналіз динамікиuk_UA
dc.subjectmotion analysisuk_UA
dc.subject3d cnnuk_UA
dc.subjecttransformeruk_UA
dc.subjectfine-tuninguk_UA
dc.titleПрограмна система для автоматичної сегментації динамічних фрагментів у відеозаписах за допомогою методів машинного навчанняuk_UA
dc.title.alternativeSoftware system for automatic segmentation of dynamic fragments in video recordings using machine learning methodsuk_UA
dc.typeBachelor Thesisuk_UA
dc.rights.holder© Вонсович Олександр Петрович, 2025uk_UA
dc.contributor.committeeMemberГром'як, Роман Сильвестрович-
dc.coverage.placenameТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Українаuk_UA
dc.format.pages85-
dc.subject.udc004.9uk_UA
dc.relation.references1. Методи глибокого навчання для сегментації екземплярів відео: опитування. Science Direct [Електронний ресурс]. — Режим доступу: URL: https://www.sciencedirect.com/science/article/pii/S0031320325004236 (дата звернення 17.06.2025)uk_UA
dc.relation.references2. Комплексний огляд застосування 3D згорткових нейронних мереж у медичній візуалізації. MDPI [Електронний ресурс]. — Режим доступу: URL: https://www.mdpi.com/2673-4591/59/1/3 (дата звернення 17.06.2025)uk_UA
dc.relation.references3. Методи відеорезюмування: комплексний огляд. Arxiv [Електронний ресурс]. — Режим доступу: URL: https://arxiv.org/html/2410.04449v1 (дата звернення 17.06.2025)uk_UA
dc.relation.references10. Платформа Google Cloud Intelligence API. Google Cloud [Електронний ресурс]. — Режим доступу: URL: https://cloud.google.com/video-intelligence (дата звернення 19.06.2025)uk_UA
dc.relation.references11. Платформа Amazon Rekognition. Amazon Web Services [Електронний ресурс]. — Режим доступу: URL: https://aws.amazon.com/rekognition/video-features (дата звернення 19.06.2025)uk_UA
dc.relation.references12. Як використовувати Twelve Labs API. Twelve Labs [Електронний ресурс]. — Режим доступу: URL: https://www.twelvelabs.io/blog/effortless-video-classifiers-with-twelve-labs-api-no-ml-training-required (дата звернення 19.06.2025)uk_UA
dc.relation.references13. РЕКОМЕНДАЦІЇ ДО ВИКОНАННЯ КРБ. ATutor [Електронний ресурс]. — Режим доступу: URL: https://dl.tntu.edu.ua/content.php?cid=514586 (дата звернення: 15.06.2025)uk_UA
dc.relation.references14. Долікарська допомога при переломах. ATutor [Електронний ресурс]. — Режим доступу: URL: https://dl.tntu.edu.ua/content.php?cid=299865 (дата звернення: 15.06.2025)uk_UA
dc.relation.references15. Організація робочих місць. ATutor [Електронний ресурс]. — Режим доступу: URL: https://dl.tntu.edu.ua/content.php?cid=289193 (дата звернення: 15.06.2025)uk_UA
dc.relation.references16. Мелех Л.В. Безпека життєдіяльності та охорона праці: навч. посіб. Львів: ЛДУ внутрішніх справ, 2022. 219 сuk_UA
dc.relation.references17. В. Г. Грибан., А. Є. Фоменко, Д. Г. Казначеєв. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ ТА ОХОРОНА ПРАЦІ: підручник. Дніпро: Дніпроп. держ. ун-т внутр. справ, 2022. 388 с.uk_UA
dc.relation.references18. Про затвердження порядків надання домедичної допомоги особам при невідкладних станах: Наказ Міністерства охорони здоров’я України від 09.03.2022 № 441. — Режим доступу: URL: https://zakon.rada.gov.ua/laws/show/z0356-22 (дата звернення: 15.06.2025).uk_UA
dc.relation.references19. Вимоги нормативних документів до систем виробничого освітлення. ATutor. Режим доступу: URL: https://dl.tntu.edu.ua/content.php?cid=289154 (дата звернення: 16.06.2025)uk_UA
dc.relation.references20. ДБН В.2.5-28-2018 "Природне і штучне освітлення". Чинний від 01.03.2019. — Режим доступу: URL: https://e-construction.gov.ua/laws_detail/3074958732556240833?doc_type=2uk_UA
dc.relation.references21. Дистанційний курс «Кваліфікаційні роботи бакалаврів» сайту дистанційного навчання ТНТУ [Електронний ресурс]. — Режим доступу: URL: https://dl.tntu.edu.ua/bounce.php?course=5329 (дата звернення: 19.06.2025)uk_UA
dc.relation.references22. Методичні вказівки до виконання дипломної роботи освітнього рівня “бакалавр” студентами усіх форм навчання для напряму підготовки 121 – “Інженерія програмного забезпечення” / уклад. : Петрик М.Р., Михалик Д.М., Кінах Я.І., Гладьо С.В., Цуприк Г.Б. — Тернопіль : Вид-во ТНТУ імені Івана Пулюя, 2016. — 28 с.uk_UA
dc.relation.referencesen4. Qiu Zhaofan, Yao Ting, Mei Tao. Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks [Електронний ресурс]. — University of Science and Technology of China, Hefei, China; Microsoft Research, Beijing, China, 2017. — 9 с. — Режим доступу: URL: https://arxiv.org/abs/1711.10305 (дата звернення: 19.06.2025)uk_UA
dc.relation.referencesen5. Tran Du, Bourdev Lubomir, Fergus Rob, Torresani Lorenzo, Paluri Manohar. Learning Spatiotemporal Features with 3D Convolutional Networks [Електронний ресурс]. — Facebook AI Research; Dartmouth College, 2017. — 9 с. — Режим доступу: URL: https://arxiv.org/abs/1412.0767 (дата звернення: 19.06.2025)uk_UA
dc.relation.referencesen6. Arnab Anurag, Dehghani Mostafa, Heigold Georg, Sun Chen, Lucic Mario, Schmid Cordelia. ViViT: A Video Vision Transformer [Електронний ресурс]. — Google Research, 2021. — 11 с. — Режим доступу: URL: https://arxiv.org/abs/2103.15691 (дата звернення: 18.06.2025)uk_UA
dc.relation.referencesen7. Xu Yifang, Sun Yunzhuo, Li Yang, Shi Yilei, Zhu Xiaoxiang, Du Sidan. MH-DETR: Video Moment and Highlight Detection with Cross-modal Transformer [Електронний ресурс]. — 2023. — 10 с. — Режим доступу: URL: https://arxiv.org/abs/2305.00355 (дата звернення: 18.06.2025)uk_UA
dc.relation.referencesen8. Method and system for automatically generating video highlights : пат. CN109691124B Китай; заявл. 19.06.2017; опубл. 27.07.2021. — 13 с.uk_UA
dc.relation.referencesen9. Systems and methods for automating video editing : пат. US11769528B2 США; заявл. 02.03.2021; опубл. 26.09.2023. — 47 с.uk_UA
dc.contributor.affiliationТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Українаuk_UA
dc.coverage.countryUAuk_UA
Розташовується у зібраннях:121 — Інженерія програмного забезпечення (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
dyplom_Vonsovych_2025.pdf811,4 kBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора