Методи та моделі машинного навчання для виявлення аномалій у мережевому трафіку інформаційних систем

Ясінський, Олександр Олегович; Yasinskyi, Oleksandr

Моля, използвайте този идентификатор за цитиране или линк към този публикация: http://elartu.tntu.edu.ua/handle/lib/52154

Заглавие:	Методи та моделі машинного навчання для виявлення аномалій у мережевому трафіку інформаційних систем
Други Заглавия:	Methods and Machine Learning Models for Anomaly Detection in Network Traffic of Information Systems
Автори:	Ясінський, Олександр Олегович Yasinskyi, Oleksandr
Bibliographic description (Ukraine):	{ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с.
Bibliographic reference (2015):	Ясінський О. О. Методи та моделі машинного навчання для виявлення аномалій у мережевому трафіку інформаційних систем : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 - комп’ютерні науки / наук. кер. Г. І. Липак. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 77 с.
Дата на Публикуване:	28-Май-2026
Submitted date:	14-Май-2026
Date of entry:	6-Юни-2026
Издател:	Тернопільський національний технічний університет імені ім. І. Пулюя
Country (code):	UA
Place of the edition/event:	Тернопіль
Supervisor:	Липак, Галина Ігорівна Lypak, Halyna
UDC:	004.85
Ключови Думи:	122 комп’ютерні науки мережевий трафік виявлення аномалій машинне навчання інформаційна безпека класифікація кіберзагрози ансамблеві методи інтелектуальний аналіз даних network traffic anomaly detection machine learning information security classification cyber threats ensemble methods intelligent data analysis
Page range:	77
Резюме:	Кваліфікаційна робота присвячена методам виявлення аномалій у мережевому трафіку за допомогою машинного навчання. У першому розділі описано таксономію аномалій та проаналізовано загрози інформаційній безпеці. Висвітлено характеристики трафіку та розглянуто інтелектуальні підходи до аналізу даних. У другому розділі досліджено архітектуру систем IDS, SIEM та EDR. Подано математичну формалізацію підготовки даних та обґрунтовано вибір ансамблевих алгоритмів XGBoost і Random Forest. У третьому розділі описано створення моделей та вибір значущих ознак на основі датасету CSE-CIC-IDS2018. Проведено експериментальну оцінку ефективності моделей за допомогою метрик точності. This qualification work is dedicated to developing methods for detecting network traffic anomalies using machine learning. The first chapter describes the taxonomy of anomalies and analyzes information security threats. It highlights network traffic characteristics and reviews intelligent data analysis approaches. The second chapter investigates the architecture of IDS, SIEM, and EDR systems. It provides a mathematical formalization of data preparation and justifies the selection of ensemble algorithms, specifically XGBoost and Random Forest. The third chapter describes the model creation process and the selection of significant features based on the CSE-CIC-IDS2018 dataset. An experimental evaluation of model effectiveness was conducted using accuracy metrics.
Описание:	Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 28.05.2026р. на засіданні екзаменаційної комісії №33 у Тернопільському національному технічному університеті імені Івана Пулюя
Content:	Вступ 8 1 Аналіз предметної області 10 1.1 Обгрунтування актуальності проблеми 10 1.2 Огляд наукової літератури 11 1.3 Аналіз нормативної документації 12 1.4 Визначення та характеристики мережевого трафіку 13 1.5 Поняття та структурна класифікація аномалій 14 1.6 Загрози інформаційної безпеки у вигляді аномалій 19 1.7 Мережевий трафік як джерело даних для аналізу 21 1.8 Сучасні підходи із використанням машинного навчання 22 1.9 Висновок до першого розділу 23 2 АНАЛІЗ МЕТОДІВ, СИСТЕМ ТА МОДЕЛей ВИЯВЛЕННЯ АНОМАЛІЙ 24 2.1 Аналіз архітектури систем виявлення вторгнень 24 2.2 Характеристика ансамблевих алгоритмів машинного навчання 37 2.3 Порівняльна характеристика наборів даних 40 2.4 Математична формалізація процесів обробки, нормалізації та балансування даних 43 2.5 Стратегії вибору ознак, сегментації аномалій та вибір метрик ефективності 47 2.6 Висновок до другого розділу 51 3 Створення моделі та оцінка ефективнсті 52 3.1 Підготовка та попередня обробка набору даних 52 3.2 Відбір ознак 53 3.3 Модель XGBoost 54 3.4 Модель Random Forest 57 3.5 Висновок до третього розділу 61 4 Охорона праці та безпека в надзвичайних ситуаціях 62 4.1 Організація безпечного робочого місця користувача ПК 62 4.2 Захист від статичної електрики в серверних приміщеннях 64 4.3 Дії персоналу при виникненні пожежі в комп’ютерному залі 66 4.4 Висновок до четвертого розділу 68 Висновки 69 Перелік джерел 71 ДОДАТКИ
URI:	http://elartu.tntu.edu.ua/handle/lib/52154
ISBN:	{ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с. {ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с.
Copyright owner:	© Ясінський Олександр Олегович, 2026
References (Ukraine):	1. ENISA Threat Landscape 2024. Enisa. 2024. URL: https://www.enisa.europa.eu/publications/enisa-threat-landscape-2024. 2. Війна Росії проти України: хронологія кібератак. European Parlament. URL: https://www.europarl.europa.eu/RegData/etudes/BRIE/2022/733549/EPRS_BRI(2022)733549_XL.pdf. 3. Reddy Kothamali P., Banik S. Limitations of Signature-Based Threat Detection. Limitations of Signature-Based Threat Detection. 2022. URL: https://www.researchgate.net/publication/388494583_Limitations_of_Signature-Based_Threat_Detection. 4. Jeon J. Possibility for Proactive Anomaly Detection. arxiv. 15.04.2025. URL: https://arxiv.org/abs/2504.11623. 5. Ikechukwu Okoli U. Machine learning in cybersecurity: A review of threat detection and defense mechanisms. ResearchGate. 09.02.2024. URL: https://www.researchgate.net/publication/378208150_Machine_learning_in_cybersecurity_A_review_of_threat_detection_and_defense_mechanisms. 6. Haas S. Zeek-Osquery: Host-Network Correlation for Advanced Monitoring and Intrusion Detection. HAL open science. 04.02.2021. URL: https://inria.hal.science/hal-03440828/preview/497034_1_En_17_Chapter.pdf. 7. Moruff Oyelakin A. Overview and Exploratory Analyses of CICIDS 2017 Intrusion Detection Dataset. ResearchGate. 16.09.2023. URL: https://www.researchgate.net/publication/373994633_Overview_and_Exploratory_Analyses_of_CICIDS_2017_Intrusion_Detection_Dataset. 8. Arcos-Argudo M. A Deterministic Comparison of Classical Machine Learning and Hybrid Deep Representation Models for Intrusion Detection on NSL-KDD and CICIDS2017. mdpi. 08.05.2025. URL: https://www.mdpi.com/1999-4893/18/12/749. 9. de Carvalho Bertoli G. Bridging the gap to real-world for network intrusion detection systems with data-centric approach. arxiv. 13.05.2021. URL: https://arxiv.org/abs/2110.13655. 10. zakon rada. 08.05.2025. URL: https://zakon.rada.gov.ua/laws/show/2163-19#Text. 11. ISO/IEC 27001:2022. ISO. URL: https://www.iso.org/cms/live/live/en/sites/isoorg/contents/data/standard/08/28/82875.html. 12. ISO/IEC 27005:2022. ISO. URL: https://www.iso.org/standard/80585.html. 13. S. Lupenko, O. Orobchuk, I. Kateryniuk, R. Kozak, H. Lypak. Secure information system for Chinese Image medicine knowledge consolidation. Proceedings of the 4th International Workshop on Information Technologies: Theoretical and Applied Problems 2024 (ITTAP 2024), Ternopil, Ukraine and Opole, Poland, October 23-25, 2024, CEUR Workshop Proceedings, Vol-3896. pp. 509-519. ISSN 1613-0073. URL: https://ceur-ws.org/Vol-3896/paper23.pdf. 14. Rahman M., Atiquzzaman M. A Survey on Network Security Traffic Analysis and Anomaly Detection Techniques. ResearchGate. 27.05.2024. URL: https://www.researchgate.net/publication/380903277_A_Survey_on_Network_Security_Traffic_Analysis_and_Anomaly_Detection_Techniques. 15. What is Anomaly Detection? VMware by Broadcom. URL: https://www.vmware.com/topics/anomaly-detection. 16. Gujral E. Anomaly Detection Methods: A Survey. MADLab. 2023. URL: https://www.cs.ucr.edu/~egujr001/ucr/madlab/publication/EG_2023_Anomaly_Detection_Methods.pdf. 17. Ahmed M., Mahmood A. N., Hu J. A comprehensive survey on network anomaly detection. ResearchGate. 02.07.2016. URL: https://www.researchgate.net/publication/326136935_A_comprehensive_survey_on_network_anomaly_detection. 18. Anomaly Detection: A Guide to Algorithms & Use Cases. Encord. 15.02.2024. URL: https://encord.com/blog/anomaly-detection/. 19. Суботін С. О. Побудова інтелектуальних систем моніторингу та діагностики: навчальний посібник. КПІ ім. Ігоря Сікорського. 2023. URL: https://ela.kpi.ua/server/api/core/bitstreams/ecdf61dd-487e-46e2-817a-c80f2198eff7/content. 20. Point Anomaly Detection: Identifying Single Unusual Data Points. UX for AI. 24.08.2023. URL: https://uxforai.com/p/point-anomaly-detection. 21. Gupta P., Goudar V. S., Singh P. Network intrusion detection using machine learning and deep learning: a review. PMC. 16.12.2024. URL: https://pmc.ncbi.nlm.nih.gov/articles/PMC11723367/. 22. What Is an Advanced Persistent Threat (APT)? Palo Alto Networks. URL: https://www.paloaltonetworks.com/cyberpedia/what-is-advanced-persistent-threat-apt. 23. Network Traffic Analysis (NTA) Fundamentals. Rapid7. URL: https://www.rapid7.com/fundamentals/network-traffic-analysis. 24. Early S., Stephens C., Doyle R. Anomaly Detection in Network Traffic. UCSD CSE. 2001. URL: https://cseweb.ucsd.edu/classes/fa01/cse221/projects/group10.pdf. 25. Duda, O., Pasichnyk V., Lypak H., Matsiuk O., Mudrokha V. Formation of integrated repositories of social and communication data by consolidating the resources of museums, libraries and archives in smart cities projects. CEUR Workshop Proceedings, 2021, 2870, pp. 1420–1430. URL: http://ceur-ws.org/Vol-2870/paper104.pdf. 26. Supervised Learning. ScienceDirect. URL: https://www.sciencedirect.com/topics/computer-science/supervised-learning. 27. What is unsupervised learning? Google Cloud. URL: https://cloud.google.com/discover/what-is-unsupervised-learning. 28. What is Reinforcement Learning? GeeksforGeeks. 20.01.2025. URL: https://www.geeksforgeeks.org/machine-learning/what-is-reinforcement-learning. 29. Ясінський О. Методи машинного навчання для виявлення аномалій у мережевому трафіку сучасних інформаційних систем. Природничі та гуманітарні науки. Актуальні питання: збірник тез доповідей ІХ Міжнародної студентської науково-технічної конференції. Тернопіль: ТНТУ, 2026. С. 264-265. 30. Липак Г., Липак Т., Кунанець Н. Проєктування інформаційної системи на основі машинного навчання для збереження та класифікації артефактів документальної спадщини. Вісник Хмельницького національного університету: технічні науки. Т. 334 № 4 (2024). С. 176-182. https://doi.org/10.31891/2307-5732-2024-339-4-29. 31. Липак Г. І., Коломийчук Д. А. Вплив бекдор атак на можливості навчання нейронних мереж // Матеріали МНТК „Фундаментальні та прикладні проблеми сучасних технологій“, Тернопіль, 28-29 травня 2025 року. 2025. С. 207. 32. What is an example of NIDS? Stamus Networks. 27.09.2023. URL: https://www.stamus-networks.com/blog/what-is-an-example-of-nids. 33. Network-Based Intrusion Detection System (NIDS). CyberHoot. URL: https://cyberhoot.com/cybrary/network-based-intrusion-detection-system-nids. 34. Difference between HIDS and NIDS. GeeksforGeeks. 29.05.2024. URL: https://www.geeksforgeeks.org/computer-networks/difference-between-hids-and-nids. 35. Deepanshu, Saini V. Network Intrusion Detection System using Machine Learning. Serials Journals. 2021. URL: https://serialsjournals.com/abstract/51172_44-deepanshu.pdf. 36. What is the Difference Between Snort and Zeek? Stamus Networks. 11.10.2023. URL: https://www.stamus-networks.com/blog/what-is-the-difference-between-snort-and-zeek. 37. How Does Antivirus Software Work? Security.org. URL: https://www.security.org/antivirus/how-does-antivirus-work. 38. What Is Endpoint Detection and Response (EDR)? CrowdStrike. URL: https://www.crowdstrike.com/en-us/cybersecurity-101/endpoint-security/endpoint-detection-and-response-edr. 39. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System. arXiv. 10.06.2016. URL: https://arxiv.org/abs/1603.02754. 40. Introduction to Random Forest. DataHacker. 25.04.2020. URL: https://datahacker.rs/012-machine-learning-introduction-to-random-forest. 41. Sharafaldin I. Toward a Reliable Dataset for Intrusion Detection. ResearchGate. 01.02.2018. URL: https://www.researchgate.net/publication/322923753_Toward_a_Reliable_Dataset_for_Intrusion_Detection. 42. Ясінський О. О., Липак Г. І. Проблема репрезентативності наборів даних у теоретичному моделюванні сучасних кіберзагроз. Актуальні задачі сучасних технологій: збірник тез доповідей XIV Міжнародної науково-технічної конференції молодих учених та студентів. Тернопіль: ТНТУ, 2025. С. 381-382. 43. Intrusion Detection Datasets: A Review from KDD Cup 99 to CIC-IDS-2017. ScienceDirect. 15.05.2023. URL: https://www.sciencedirect.com/science/article/abs/pii/S187705092101568X. 44. Data Cleaning: Definition, Process, and Benefit. Tableau. 12.01.2024. URL: https://www.tableau.com/learn/articles/what-is-data-cleaning. 45. Brownlee J. How to Handle Missing Data with Python. Machine Learning Mastery. 02.08.2023. URL: https://machinelearningmastery.com/handle-missing-data-python/. 46. All About Feature Scaling. Towards Data Science. 14.07.2023. URL: https://towardsdatascience.com/all-about-feature-scaling-bcc0ad7d2d13. 47. Robust Scaler: Outlier Robust Feature Scaling. GeeksforGeeks. 22.11.2024. URL: https://www.geeksforgeeks.org/standardscaler-minmaxscaler-and-robustscaler-techniques-ml/. 48. SMOTE for Imbalanced Classification with Python. Machine Learning Mastery. 14.01.2024. URL: https://machinelearningmastery.com/smote-oversampling-for-imbalanced-classification/. 49. Handling Class Imbalance with Synthetic Data Generation. KDnuggets. 28.08.2023. URL: https://www.kdnuggets.com/2023/08/handling-class-imbalance-synthetic-data-generation.html. 50. Feature Selection Techniques in Machine Learning. Analytics Vidhya. 15.06.2024. URL: https://www.analyticsvidhya.com/blog/2020/10/feature-selection-techniques-in-machine-learning/. 51. Кліщ, М., Липак, Г., Кунанець, Н., Пасічник, С., & Липак, Т. Структура інформаційної системи передбачення та інтерпретації зміни стану користувача сервісу. Вісник Національного Університету “Львівська Політехніка”. Інформаційні системи та мережі, 17 (2025). С. 226 - 238. https://doi.org/10.23939/sisn2025.17.226. 52. Understanding the Curse of Dimensionality. Towards Data Science. 05.09.2023. URL: https://towardsdatascience.com/the-curse-of-dimensionality-50dc6e49aa12. 53. Outlier Detection: Methods, Models and Applications. DataCamp. 10.12.2024. URL: https://www.datacamp.com/blog/outlier-detection-methods. 54. Isolation Forest Algorithm for Anomaly Detection. GeeksforGeeks. 25.10.2024. URL: https://www.geeksforgeeks.org/isolation-forest-algorithm-anomly-detection/. 55. Precision vs. Recall: Which Metric Should You Use?. HubSpot. 04.11.2024. URL: https://blog.hubspot.com/service/precision-vs-recall. 56. Understanding Confusion Matrix and Its Metrics. Analytics Vidhya. 12.02.2025. URL: https://www.analyticsvidhya.com/blog/2020/06/confusion-matrix-machine-learning/. 57. Мінімальні вимоги щодо безпеки та захисту здоров’я працівників під час роботи з екранними пристроями. Наказ Міністерства соціальної політики України від 14.02.2018 № 207. URL: https://zakon.rada.gov.ua/laws/show/z0308-18. 58. ДБН В.2.5-28:2018. Природне і штучне освітлення. К.: Мінрегіонбуд України, 2018. URL: https://online.budstandart.com/ua/catalog/doc-page.html?id_doc=79885. 59. ДСН 3.3.6.042-99. Санітарні норми мікроклімату виробничих приміщень. МОЗ України. URL: https://zakon.rada.gov.ua/rada/show/va042282-99. 60. Правила пожежної безпеки в Україні. Наказ Міністерства внутрішніх справ України від 30.12.2014 № 1417. URL: https://zakon.rada.gov.ua/laws/show/z0252-15. 61. Правила технічної експлуатації електроустановок споживачів. Наказ Міністерства енергетики та вугільної промисловості України від 13.02.2012 № 91. URL: https://zakon.rada.gov.ua/laws/show/z0350-12. 62. Порядок надання домедичної допомоги особам при підозрі на ураження електричним струмом. Наказ Міністерства охорони здоров'я України від 09.03.2022 № 441. URL: https://zakon.rada.gov.ua/laws/show/z0343-22. 63. ДСТУ EN 61340-5-1:2018. Електростатика. Частина 5-1. Захист електронних пристроїв від електростатичних явищ. Загальні вимоги. К.: ДП «УкрНДНЦ», 2018. 64. ДСТУ EN 60950-1:2015. Обладнання інформаційних технологій. Безпека. Частина 1. Загальні вимоги. К.: ДП «УкрНДНЦ», 2015. 65. Кодекс цивільного захисту України. Верховна Рада України. URL: https://zakon.rada.gov.ua/laws/show/5403-17. 66. Порядок здійснення навчання населення діям у надзвичайних ситуаціях. Постанова Кабінету Міністрів України від 26.06.2013 № 444. URL: https://zakon.rada.gov.ua/laws/show/444-2013-п. 67. ДСТУ ISO 23601:2019. Ідентифікація безпеки. Знаки безпеки на планах евакуації. К.: ДП «УкрНДНЦ», 2019.
Content type:	Master Thesis
Показва се в Колекции:	122 — комп’ютерні науки, F3 Комп’ютерні науки

Файлове в Този Публикация:

Файл	Описание	Размер	Формат
2026_KRM_SNnm-61_Yasinskyi_OO.pdf	Дипломна робота	2,39 MB	Adobe PDF	Изглед/Отваряне

Показване на запис на пълна публикация Разлистване на Статистики

Публикацияте в DSpace са защитени с авторско право, с всички права запазени, освен ако не е указно друго.

Админ Инструменти