Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/43366
Назва: Методи ідентифікації та вилучення географічно пов'язаних об'єктів з даних про атаки на об'єкти критичної інфраструктури України
Інші назви: Methods for Identifying and Extracting Geographically Related Objects from Textual Data on Attacks on Critical Infrastructure Facilities in Ukraine
Автори: Чорний, Павло Русланович
Chornyi, Pavlo
Приналежність: Тернопільський національний технічний університет імені Івана Пулюя
Бібліографічний опис: Чорний П. Р. Методи ідентифікації та вилучення географічно пов'язаних об'єктів з даних про атаки на об'єкти критичної інфраструктури України : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „125 — кібербезпека“ / П. Р. Чорний. — Тернопіль: ТНТУ, 2023. — 72 с.
Дата публікації: 28-гру-2023
Дата внесення: 4-січ-2024
Видавництво: ТНТУ
Країна (код): UA
Місце видання, проведення: Тернопіль
Науковий керівник: Скарга-Бандурова, Інна Сергіївна
Skarga-Bandurova, Inna
Члени комітету: Дуда, Олексій Михайлович
Duda, Oleksiy
Теми: 125
кібербезпека
іменовані сутності
геокодування
ідентифікація атак
критична інфраструктура
кібербезпека
обробка природньої мови
named entities
geocoding
attack identification
critical infrastructure
cyber security
ner
natural language processing
spacy
python
natural language processing
Кількість сторінок: 72
Короткий огляд (реферат): У кваліфікаційній роботі проведено аналіз підходів до ідентифікації та вилучення подій з текстових даних, вперше використано технологію розпізнавання іменованих об'єктів з відкритих джерел для аналізу різних видів атак на критичну інфраструктуру України, із подальшою інтеграцією в системи моніторингу для візуалізацією зазначених об'єктів, виявлення та побудови стратегії реагування на атаки та майбутні загрози. У ході виконання кваліфікаційної роботи розроблено метод для збору інформації про фізичні та кібератаки з відкритих джерел їх аналіз та виокремлення об’єктів, з можливістю подальшої побудови зв’язків та візуалізації.
The qualification work analyzes approaches to identifying and extracting events from text data. Additionally, for the first time, the technology of recognizing named objects from open sources was used to analyze various types of attacks on the critical infrastructure of Ukraine, with further integration into monitoring systems to visualize these objects, identify and build a strategy for responding to attacks and future threats. In the course of the qualification work, a method was developed for collecting information about physical and cyber attacks from open sources, analyzing them, and identifying objects, with the possibility of further linking and visualization.
Опис: Методи ідентифікації та вилучення географічно пов’язаних об’єктів з текстових даних про атаки на об’єкти критичної інфраструктури України // Methods for Identifying and Extracting Geographically Related Objects from Textual Data on Attacks on Critical Infrastructure Facilities in Ukraine // Чорний Павло Русланович // Тернопільський національний технічний університет імені Івана Пулюя, факультет комп’ютерно-інформаційних систем і програмної інженерії, кафедра кібербезпеки, група СБм-62 // Тернопіль, 2023 // С. 72, рис. – 31, табл. – 2, додат. – 1, бібліогр. – 38.
Зміст: ВСТУП ... 8 1. ТЕОРЕТИЧНА ОСНОВА ... 10 1.1 Методи ідентифікації та вилучення подій з тексту ... 10 1.2 Геопросторовий аналіз для побудови звʼязків між подіями в контексті безпеки ... 16 1.3 Висновки ... 17 2 ТЕХНОЛОГІЇ РОЗПІЗНАВАННЯ ІМЕНОВАНИХ ОБ'ЄКТІВ ДЛЯ АНАЛІЗУ ТА ВІЗУАЛІЗАЦІЇ ДАНИХ ... 19 2.1 Що таке NER? ... 19 2.2 Методи навчання, що застосовуються для NER... 22 2.3 Загальна методологія роботи ... 23 2.4 Збір даних ... 25 2.5 Аналіз даних та візуалізація ... 28 2.6 Висновки ... 31 3. ПРАКТИЧНА РЕАЛІЗАЦІЯ ... 32 3.1 Попередня обробки даних ... 32 3.2 Перетворення об'єктів на географічні одиниці ... 38 3.3 Візуалізація даних ... 42 3.4 Висновки ... 49 4. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ ... 50 4.1 Охорона праці ... 50 4.2 Безпека життєдіяльності ... 54 4.2.1 Пожежна безпека ... 55 4.2.2 Освітлення ... 58 4.2.3 Мікроклімат і вентилювання ... 60 4.3 Дії у надзвичайних ситуаціях ... 61 4.4 Висновки ... 61 ВИСНОВОК ... 63 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ... 64 ДОДАТКИ ... 70
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/43366
Власник авторського права: © Чорний Павло Русланович, 2023
Перелік літератури: 1 Supporting knowledge re-use with effective searches of related engineering documents—A comparison of search engine and natural language processing-based algorithms. [Електронний ресурс] / I. Ö.Arnarsson, O. Frost, E. Gustavsson, D. Stenholm // INTERNATIONAL CONFERENCE ON ENGINEERING DESIGN. – 2019. – Режим доступу до ресурсу: https://www.cambridge.org/core/services/aop-cambridge-core/content/view/23692B10CC75D406F048464EDFE2C665/S222043421900266Xa.pdf/supporting-knowledge-re-use-with-effective-searches-of-related-engineering-documents-a-comparison-of-search-engine-and-natural-language-processing-based-algorithms.pdf.
2. Reconstruction of the 1874 Santa Tecla’s rainstorm inWestern Catalonia (NE Spain) from flood marks and historical accounts [Електронний ресурс] / J.Balasch, J. Ruiz-Bellet, J. Tuset, J. Martin de Oliva // Natural Hazards and Earth System Science. – 2010. – Режим доступу до ресурсу: https://www.researchgate.net/profile/Jordi-Tuset/publication/235720321_Reconstruction_of_the_1874_Santa_Tecla\'s_rainstorm_in_Western_Catalonia_NE_Spain_from_flood_marks_and_historical_accounts/links/0912f512dde78817ad000000/Reconstruction-of-the-1874-Santa-Teclas-rainstorm-in-Western-Catalonia-NE-Spain-from-flood-marks-and-historical-accounts.pdf?_tp=eyJjb250ZXh0Ijp7ImZpcnN0UGFnZSI6InB1YmxpY2F0aW9uIiwicGFnZSI6InB1YmxpY2F0aW9uIn19
3. Transformer based named entity recognition for place name extraction from unstructured text [Електронний ресурс] / C.Berragan, A. Singleton, A. Calafiore, J. Morley // International Journal of Geographical Information Science. – 2022. – Режим доступу до ресурсу: https://doi.org/10.1080/13658816.2022.2133125. 65 4. Brown S. Machine learning, explained. [Електронний ресурс] / S. Brown. – 2021. – Режим доступу до ресурсу: https://mitsloan.mit.edu/ideas-made-to-matter/machine-learning-explained.
5. Casero A. A. Named entity recognition and normalization in biomedical literature: A practical case in sars- cov-2 literature [Електронний ресурс] / A. A. Casero. – 2021. – Режим доступу до ресурсу: https://oa.upm.es/67933/1/TFM_ALVARO_ALONSO_CASERO.pdf.
7. Deep learning-based named entity recognition and knowledge graph construction for geological hazards [Електронний ресурс] / R.Fan, L. Wang, J. Yan, W. Song // ISPRS Int. J. Geo Inf. – 2019. – Режим доступу до ресурсу: https://www.mdpi.com/2220-9964/9/1/15.
8. Hu Y. H. A Supervised Machine Learning Approach to Toponym Disambiguation [Електронний ресурс] / Y. H. Hu, L. Ge // The Geospatial Web. – 2007. – Режим доступу до ресурсу: https://www.geospatialweb.com/chapter-11.html.
9. ISO 3166 — Codes for the representation of names of countries and their subdivisions [Електронний ресурс] – Режим доступу до ресурсу: https://www.iso.org/obp/ui/#iso:code:3166:UA.
10. Dumbacher B. SABLE: Tools for web crawling, web scraping, and text classification [Електронний ресурс] / B. Dumbacher, L. K. Diamond. – 2018. – Режим доступу до ресурсу: https://nces.ed.gov/FCSM/pdf/A_1Dumbacher_2018FCSM.pdf.
11. Spatial Planning Text Information Processing with Use of Machine Learning Methods [Електронний ресурс] / I.Kaczmarek, A. Iwaniak, A. Swietlicka, M. Piwowarczyk // ISPRS Annals of the Photogrammetry. – 2020. – Режим доступу до ресурсу: https://isprs-annals.copernicus.org/articles/VI-4-W2-2020/95/2020/isprs-annals-VI-4-W2-2020-95-2020.pdf.
12. Personalized content extraction and text classification using effective web scraping techniques [Електронний ресурс] / T.Karthikeyan, K. Sekaran, D. Ranjith, K. Vinoth // Int. J. Web Portals. – 2019. – Режим доступу до ресурсу: https://ericbrasiln.github.io/ferramentas_digitais_UNILAB/textos/10.4018.pdf.
13. Geographic Question Answering: Challenges, Uniqueness, Classification, and Future Directions [Електронний ресурс] / G.Mai, K. Janowicz, R. Zhu, L. Cai // AGILE. – 2021. – Режим доступу до ресурсу: https://agile-giss.copernicus.org/articles/2/8/2021/agile-giss-2-8-2021.pdf.
14. Comparing supervised learning algorithms for spatial nominal entity recognition [Електронний ресурс] / A.Medad, M. Gaio, L. Moncla, S. Mustiere // AGILE: GIScience Series. – 2020. – Режим доступу до ресурсу: https://doi.org/10.5194/agile-giss-1-15-2020.
15. Medlock B. W. Investigating Classification for Natural Language Processing Tasks [Електронний ресурс] / B. W. Medlock // University of Cambridge. – 2008. – Режим доступу до ресурсу: https://www.cl.cam.ac.uk/techreports/UCAM-CL-TR-721.pdf.
16. Location extraction from social media: Geoparsing, location disambiguation, and geotagging. [Електронний ресурс] / S. E.Middleton, G. Kordopatis-Zilos, S. Papadopoulos, Y. Kompatsiaris // TOIS. – 2018. – Режим доступу до ресурсу: https://doi.org/10.1145/3202662.
17. Chornyi P. Data extraction using NER [Електронний ресурс] / P. Chornyi, I. Skarga-Bandurova. – 2023. – Режим доступу до ресурсу: https://github.com/BarryAllen7/Data_extraction_using_NER.git.
18. Phum A. Toponym detection in the bio-medical domain: A hybrid approach with deep learning [Електронний ресурс] / A. Phum, T. Rcanasinghe, C. Orˇasan // International Conference on Recent Advances in Natural Language. – 2019. – Режим доступу до ресурсу: https://aclanthology.org/R19-1106.pdf.
19. Radford B. J. Regressing Location on Text for Probabilistic Geocoding [Електронний ресурс] / B. J. Radford. – 2021. – Режим доступу до ресурсу: https://arxiv.org/pdf/2107.00080.pdf.
20. Scheele C. Geographic context-aware text mining: Enhance social media message classification for situational awareness by integrating spatial and temporal features. [Електронний ресурс] / C. Scheele, M. Yu, Q. Huang // Int. J. Digit. Earth. – 2021. – Режим доступу до ресурсу: https://www.tandfonline.com/doi/full/10.1080/17538947.2021.1968048.
21. Named Entity Recognition Approaches and Their Comparison for Custom NER Model [Електронний ресурс] / H.Shelar, G. Kaur, N. Heda, P. Agrawal // Science & Technology Libraries. – 2020. – Режим доступу до ресурсу: https://www.researchgate.net/publication/341501760_Named_Entity_Recognition_Approaches_and_Their_Comparison_for_Custom_NER_Model.
22. Sit M. A. Identifying disaster-related tweets and their semantic, spatial and temporal context using deep learning, natural language processing and spatial analysis: A case study of Hurricane Irma [Електронний ресурс] / M. A. Sit, C. Koylu, I. Demir // Int. J. Digit. Earth. – 2019. – Режим доступу до ресурсу: https://www.researchgate.net/publication/347648534_Identifying_disaster-related_tweets_and_their_semantic_spatial_and_temporal_context_using_deep_learning_natural_language_processing_and_spatial_analysis_a_case_study_of_Hurricane_Irma.
23. Wang J. NeuroTPR: A neuro-net toponym recognition model for extracting locations from social media messages [Електронний ресурс] / J. Wang, Y. Hu, K. Joseph // Trans. GIS. – 2020. – Режим доступу до ресурсу: https://www.researchgate.net/profile/Yingjie-Hu/publication/341378611_NeuroTPR_A_neuro-net_toponym_recognition_model_for_extracting_locations_from_social_media_messages/links/5f49c8db458515a88b82df38/NeuroTPR-A-neuro-net-toponym-recognition-model-for-extracting-locations-from-social-media-messages.pdf?_tp=eyJjb250ZXh0Ijp7ImZpcnN0UGFnZSI6InB1YmxpY2F0aW9uIiwicGFnZSI6InB1YmxpY2F0aW9uIn19.
24. What is named entity recognition? [Електронний ресурс] // IBM – Режим доступу до ресурсу: https://www.ibm.com/topics/named-entity-recognition.
25. Wolff R. Semantic Analysis, Explained [Електронний ресурс] / R. Wolff. – 2020. – Режим доступу до ресурсу: https://monkeylearn.com/blog/semantic-analysis/.
26. Deep learning for real-time social media text classification for situation awareness—Using Hurricanes Sandy, Harvey, and Irma as case studies [Електронний ресурс] / M.Yu, Q. Huang, H. Qin, C. Scheele // Int. J. Digit. Earth. – 2019. – Режим доступу до ресурсу: https://www.tandfonline.com/doi/full/10.1080/17538947.2019.1574316.
27. Prysiagniuk A. How machine learning works and its practical applications. [Електронний ресурс] / A. Prysiagniuk. – 2019. – Режим доступу до ресурсу: https://nachasi.com/tech/2019/01/31/yak-pratsyuye-machine-learning/.
28. НПАОП 0.00-7.15-18 «Вимоги щодо безпеки та захисту здоров’я працівників під час ро-боти з екранними пристроями». Наказ Міністерства соціальної політики України від 14.02.2018 №207 "Про затвердження вимог щодо безпеки та захисту здоров’я працівників під час роботи з екранними пристроями". Зареєстровано в Міністерстві юстиції України 25 квітня 2018 р. за № 508/31960. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/z0508-18
29. НАПБ А.01.001.-2014 «Правил пожежної безпеки в Україні». Наказ Міністерства внутрішніх справ України від 30.12.2014 № 1417 Про затвердження Правил пожежної безпеки в Україні. Зареєстровано в Міністерстві юстиції України 05 березня 2015 р. за № 252/26697. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/z0252-15
30. Кодексу цивільного захисту України. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/5403-17
31. Електробезпека в будівлях і спорудах. Вимоги до захисних заходів від ураження електричним струмом. Наказ від 1 липня 2016 року N 204. Режим доступу до ресурсу: http://epicentre.co.ua/dstu/doc28522.html.
32. ДБН В.2.5-28:2018 «Природне і штучне освітлення». Режим доступу до ресурсу: http://www.minregion.gov.ua/wp-content/uploads/2018/12/V2528-1.pdf.
33. НПАОП 0.00-7.15-18 «Вимоги щодо безпеки та захисту здоров’я працівників під час роботи з екранними пристроями». Зареєстровано в Міністерстві юстиції України 25 квітня 2018 р. за № 508/31960. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/z0508-18.
34. Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин ДСанПІН 3.3.2.007-98. Затверджено Постановою Головного державного санітарного лікаря України 10 грудня 1998 р. N 7. Режим доступу до ресурсу: https://zakon.rada.gov.ua/rada/show/v0007282-98.
35. ДСТУ Б В.1.1-36:2016 «Визначення категорій приміщень, будинків та зовнішніх установок за вибухопожежною та пожежною небезпекою». Наказ від 15.06.2016 №158. Режим доступу до ресурсу: https://zakon.rada.gov.ua/rada/show/v0158858-16
36. Санітарні норми мікроклімату виробничих приміщень ДСН 3.3.6.042-99. Постанова N 42 від 01.12.99. Режим доступу до ресурсу: https://zakon.rada.gov.ua/rada/show/va042282-99.
37. Кодекс цивільного захисту України. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/5403-17#Text.
38. Положення про організацію оповіщення про загрозу виникнення або виникнення надзвичайних ситуацій та зв’язку у сфері цивільного захисту, затвердженого постановою КМУ від 27.09.2017 р. №733. Режим доступу до ресурсу: https://zakon.rada.gov.ua/laws/show/733-2017-%D0%BF#Text.
Тип вмісту: Master Thesis
Розташовується у зібраннях:125 — кібербезпека

Файли цього матеріалу:
Файл Опис РозмірФормат 
КР магістра Чорний_2023.pdfКваліфікаційна робота магістра3,04 MBAdobe PDFПереглянути/відкрити
Авторська довідка_Чорний_2023.pdfАвторська довідка226,17 kBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора