Please use this identifier to cite or link to this item:
http://elartu.tntu.edu.ua/handle/lib/48118
Title: | Методи і засоби моніторингу та прогнозування несправностей у розподілених компʼютерних системах |
Other Titles: | Methods and means of monitoring and forecasting faults in distributed computer systems |
Authors: | Гладовський, Назар Олександрович Hladovskyi, Nazar |
Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University |
Bibliographic description (Ukraine): | Гладовський Н.О. Методи і засоби моніторингу та прогнозування несправностей у розподілених компʼютерних системах : кваліфікаційна робота на здобуття ступеня магістр: спец. 123 — комп’ютерна інженерія / наук.кер. І.О. Баран. Тернопіль: ТНТУ, 2024. 72 с. |
Bibliographic description (International): | Hladovskyi N. Methods and means of monitoring and forecasting faults in distributed computer systems : Master Thesis „123 — Computer Engineering“ / Nazar Hladovskyi - Ternopil, TNTU, 2024 – 72 p. |
Issue Date: | 20-Dec-2024 |
Submitted date: | 27-Jun-2024 |
Date of entry: | 2-Feb-2025 |
Publisher: | Тернопільський національний технічний університет імені Івана Пулюя |
Country (code): | UA |
Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя |
Supervisor: | Баран, Ігор Олегович Baran, Ihor |
Committee members: | Карпінський, Микола Петрович Karpinskyi, Mykola |
UDC: | 004.94 |
Keywords: | 123 комп’ютерна інженерія моніторинг випадковий ліс усунення несправності syslog random forest infocommunication system monitoring forecasting troubleshooting інфокомунікаційна система прогнозування |
Number of pages: | 72 |
Abstract: | У кваліфікаційній роботі проведено аналіз сучасних методів та засобів діагностики несправностей комп’ютерних систем. Запропоновано використання сукупності інформаційних систем для проведення діагностики та автоматичного усунення несправностей розподілених комп’ютерних систем. Сформульовано пропозиції щодо застосування поєднання систем технічного обліку, відстеження, оцінювання та системи прогнозування з метою втілення концептуальної моделі автоматизації обслуговування розподілених систем.
Досліджено питання автоматичного усунення несправностей з погляду прогнозування інцидентів з допомогою алгоритмів машинного навчання. Прогноз ґрунтується на вимірах поточного стану комутаторів та історичних випадках відмов апаратного забезпечення комутатора.
Прогнозування несправностей із використанням методу випадкового лісу дозволить завчасно бути готовим до усунення ймовірної несправності, чи, в деяких випадках, навіть і до запобігання цим несправностям. Це дасть змогу ефективно проводити обслуговування розподілених комп’ютерних систем. The Thesis analyzes modern methods and tools for diagnosing faults in computer systems. It is proposed to use a set of information systems for diagnosing and automatically eliminating faults in distributed computer systems. Proposals are formulated for the use of a combination of technical accounting, tracking, evaluation and forecasting systems in order to implement a conceptual model for automating maintenance of distributed systems. The issue of automatic troubleshooting from the point of view of predicting incidents using machine learning algorithms is studied. The forecast is based on measurements of the current state of switches and historical cases of switch hardware failures. Forecasting faults using the random forest method will allow you to be prepared in advance to eliminate a probable fault, or, in some cases, even to prevent these faults. This will allow you to effectively maintain distributed computer systems. |
Content: | ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ, СИМВОЛІВ, ОДИНИЦЬ СКОРОЧЕНЬ І ТЕРМІНІВ8 ВСТУП9 РОЗДІЛ 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ11 1.1. Аналіз розподілених комп’ютерних систем 11 1.2. Аналіз програмних рішень систем моніторингу 16 1.2.1. Graphite18 1.2.2. New Relic19 1.2.3. Nagios20 1.2.4. Prometheus22 1.2.5. Zabbix23 1.3. Висновки до розділу25 РОЗДІЛ 2. ТЕОРЕТИЧНА ЧАСТИНА26 2.1. Завдання моніторингу 26 2.2. Принциви усунення несправностей під час обслуговування систем 28 2.3. Методи вирішення задачі автоматизації обслуговування30 2.4. Взаємодія систем для автоматичного обслуговування РКС33 2.5. Алгоритми та методи машинного навчання як інструмент технічної діагностики37 2.6. Висновки до розділу40 РОЗДІЛ 3. ПРОГНОЗУВАННЯ АНОМАЛІЙ ЗА ДОПОМОГОЮ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ41 3.1. Характеристика системних журналів syslog41 3.2. Модель прогнозування відмови 43 3.3. Створення шаблонів повідомлень системних журналів44 3.4. Навчання алгоритму та прогнозування50 3.5. Оцінка якості моделі прогнозування53 3.5. Висновки до розділу56 РОЗДІЛ 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ57 4.1. Охорона праці57 4.2. Комп’ютерне забезпечення процесу оцінки радіаційної та хімічної обстановки60 4.3. Висновки до розділу62 ВИСНОВКИ63 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ65 ДОДАТОК А. Тези конференції |
URI: | http://elartu.tntu.edu.ua/handle/lib/48118 |
Copyright owner: | © Гладовський Назар Олександрович, 2024 © Hladovskyi Nazar, 2024 |
References (Ukraine): | Глобальна інформаційна інфраструктура інфокомунікаційних мереж та
систем : навч. посібник / уклад. : Ю.О. Ушенко, А.Л. Негрич, О.В. Галочкін.
Чернівці : Чернівецький нац. ун-т ім. Ю. Федьковича, 2021. 224 с.
Особливості розподілених систем. URL:
https://moodle.znu.edu.ua/pluginfile.php/486881/mod_resource/content/1/Глоба%20к
нига%20Том1-21-31.pdf (дата звернення:17.11.2024). Луцик Н.С., Луцків А.М., Осухівська Г.М., Тиш Є.В. Програма та методичні рекомендації з проходження практики за тематикою кваліфікаційної роботи для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль. ТНТУ. 2024. 45 с. Луцик Н. С., Луцків А. М., Осухівська Г. М., Тиш Є. В. Методичні рекомендації до виконання кваліфікаційної роботи магістра для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль. ТНТУ. 2024. 44 с. Варавін А.В., Лещишин Ю.З., Чайковський А.В. Методичні вказівки до виконання курсового проєкту з дисципліни «Дослідження і проєктування комп’ютерних систем та мереж» для здобувачів другого (магістерського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль. ТНТУ, 2024. 32 с. Микитишин А. Г., Митник М. М., Стухляк П. Д., Пасічник В. В. Комп’ютерні мережі. Книга 1 [навчальний посібник]. Львів : «Магнолія 2006», 2013. 256 с. Микитишин А. Г., Митник М. М., Стухляк П. Д., Пасічник В. В. Комп’ютерні мережі. Книга 2. [навчальний посібник]. Львів : "Магнолія 2006", 2014. 312 с.. Погоруй А. О., Чемерис О.А. Вступ до теорії випадкових процесів : навчальний посібник. Житомир : Вид-во ЖДУ ім. І. Франка, 2020. 70 с Croll A. Complete Web Monitoring. – Sean Power: O’Reilly Media, 2009. 672 p. McCarthy K. 10 Things I Learned Deploying Graphite, 2013. URL: https://kevinmccarthy.org/2013/07/18/10-things-i-learned-deploying-graphite/ (дата звертання: 27.04.2019). Сайт NewRelic. URL: http://newrelic.com/servermonitoring (дата звертання: 19.11.2024). Doll B. New Relic Architecture – Collecting 20+ Billion Metrics a Day URL: http://highscalability.com/blog/2011/7/18/new-relicarchitecture-collecting-20-billion-metrics-a-day.html (дата звертання: 20.11.2024). Prometheus vs Zabbix: відмінне та подібне цих систем моніторингую. URL: https://itedu.center/ua/blog/comparisons/prometheus_vs_zabbix/?srsltid =AfmBOoqapxCJC3O6io9A5herFuYZCrqMj52JlRODrWQLKan-HeLbQYiq (дата звертання: 22.11.2024). Огляд системи мониторингу Zabbix. URL: http://www.flycat.info/ 2008/03/05/zabbix-monitoring-system (дата звертання: 22.11.2024). Tysh Ie. Approach And Method Of Evaluation Of The General Reliability Indicator Of Computer Systems. International Scientific Journal Computer Systems And Information Technologies. Khmelnytskyi : Khmelnytskyi National University. №3. 2021. С.74-80. Гладовський Н.О. Програмні рішення моніторингу систем та мереж // Інформаційні моделі, системи та технології: Праці XІІ наук.-техн. конф. (Тернопіль, ТНТУ ім. І. Пулюя, 18-19 грудня 2024 р.) с. 118. Гладовський Н.О. Виявлення несправних параметрів у ході моніторингу мережі // Інформаційні моделі, системи та технології: Праці XІІ наук.-техн. конф. (Тернопіль, ТНТУ ім. І. Пулюя, 18-19 грудня 2024 р.) c. 119. Palamar A., Palamar M., Osukhivska H. Real-time Health Monitoring Computer System Based on Internet of Medical Things. CEUR Workshop Proceedings, 3rd International Workshop on Information Technologies: Theoretical and Applied Problems (ITTAP 2023), Ternopil, Ukraine, Opole, Poland, November 22–24, 2023. Vol. 3628. P. 106-115. Gitomer, D. H., Steinberg, L. S., and Mislevy, R. J. (1995). Diagnostic assessment of a troubleshooting skill in an intelligent tutoring system. In Nichols, P. D., Chipman, S. F., and Brennan, R. L. (eds.), Cognitively Diagnostic Assessment, Lawrence Erlbaum Associates, Hillsdale, NJ. Newell, A., and Simon, H. A. (1972). Human Problem Solving, PrinticeHall, Englewood Cliffs, NJ. Jonassen, D. H., and Hernandez-Serrano, J. (2002). Case-based reasoning and instructional design: Using stories to support problem solving. Educ. Technol. Res. Dev. 50(2):pp. 65–77. Cormode G., Muthukrishnan S., Yi K. Algorithms for Distributed Functional Monitoring// Proceedings of the nineteenth annual ACM-SIAM symposium on Discrete algorithms. San Francisco, California. 2008. P. 1076-1085. Wuhib F., Dam M., Stadler R., Clemm A. Decentralized computation of threshold crossing alerts// Proc. 16th IEEE/IFIP International Workshop on Distributed Systems. Barcelona, Spain. 2005. Vol. 3775. P. 220-232. Wuhib F., Stadler R., Clemm C. Decentralized service-level monitoring using network threshold crossing alerts// IEEE Communications Magazine. 2006. Vol. 44. No 10. P. 70-76. Stallings W. SNMP, SNMPv2, SNMPv3, RMON1 and 2. — 3rd edition. AdisonWesley. 1998. 640 p. Steinder M., Sethi A. S. Probabilistic Fault Diagnosis in Communication Systems Through Incremental Hypothesis Updating// Computer Networks. July 2004. vol. 45. no. 4. pp. 537-562. Appleby K., Goldszmidt G., Steinder M. Yemanja – A Layered Event Correlation Engine for Multi- domain Server Farms// Integrated Network Management Proceedings, 2001 IEEE/IFIP International Symposium on. 2001. pp. 329-344. Rish I., Brodie M., Odintsova N., Ma S., Grabarnik G. Real-time Problem Determination in Distributed Systems using Active Probing// Network Operations and Management Symposium. NOMS 2004. IEEE/IFIP. April 2004. Vol. 1. pp. 133-146. Guo J., Kar G., Kermani P. Approaches to Building Self Healing System 72 using Dependency Analysis// Network Operations and Management Symposium. NOMS 2004. IEEE/IFIP. April 2004. Vol. 1. pp. 119-132. Tang Y., Al-Shaer E. S. Boutaba R. Active Integrated Fault Localization in Communication Networks// Integrated Network Management Proceedings. IM’2005. IEEE/IFIP International Symposium on. May 2005. pp. 543-556. Автоматизація оновлення програмного забезпечення розподілених інфокомунікаційних систем. URL: http://www.tech.vernadskyjournals.in.ua/ journals/2024/1_2024/part_1/45.pdf (дата звертання: 28.11.2024). Raviv Y., Intrator N. Bootstrapping with noise: An effective regularization technique. Connection Science 8 (3-4). Tel Aviv, 1996. P. 355-372. Дубініна С. В. Байєсівські методи моделювання актуальних процесів та оцінювання ризиків страхових компаній: дис. канд. техн. наук: 05.13.23. Київ, 2017. 199 с. Ensemble methods: bagging, boosting and stacking. URL: https://towardsdatascience.com/ensemble-methods-baggingboosting-and-stacking-c9214a10a205 (дата звернення:29.11.2024). Skorenkyy Y., Kozak R., Zagorodna N., Kramar O., Baran, I. Use of augmented reality-enabled prototyping of cyber-physical systems for improving cybersecurity education. Journal of Physics: Conference Series. 2021. Vol. 1840, No. 1. DOI: http://dx.doi.org/10.1088/1742-6596/1840/1/012026 Guo Chen, Youjian Zhao, Dan Pei, and Dan Li. 2015. Rewiring 2 Links is Enough: Accelerating Failure Recovery in Production Data Center Networks. In Distributed Computing Systems (ICDCS), 2015 IEEE 35th International Conference on. IEEE, 569–578. “Switch failure causes outages at hosting.com data center,”. URL: http://www.datacenterdynamics.com/content-tracks/servers- storage/switch-failurecauses-outages-at-hostingcom-data- center/32344.fullarticle. (дата звертання: 29.11.2024). Лупенко С. А., Пасічник В. В., Тиш Є. В. Комп’ютерна логіка. Львів: Видавництво «Магнолія - 2006». 2015. 354 с Liu Dapeng, Zhao Youjian, Xu Haowen, Sun Yongqian, Pei Dan, Luo Jiao, Jing Xiaowei, and Feng Mei. 2015. Opprentice: Towards Practical and Automatic Anomaly Detection through Machine Learning. In ACM IMC. Tokyo, Japan. Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 14.12.2024). Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної та заочної (дистанційної) форм навчання / укл.: Стручок В. С. Тернопіль: ФОП Паляниця В. А., 2022. 156 с. |
Content type: | Master Thesis |
Appears in Collections: | 123 — комп’ютерна інженерія |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Nazar_Hladovskyi.pdf | 1,51 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Admin Tools