Ezzel az azonosítóval hivatkozhat erre a dokumentumra forrásmegjelölésben vagy hiperhivatkozás esetén:
http://elartu.tntu.edu.ua/handle/lib/50862| Title: | Розробка системи відстеження походження та забезпечення якості даних при інтеграції гетерогенних потоків в граф знань на платформі Blue Brain Nexus |
| Other Titles: | Development of a System for Tracking the Origin and Ensuring Data Quality when Integrating Heterogeneous Streams into a Knowledge Graph on the Blue Brain Nexus Platform |
| Authors: | Бревус, Галина Богданівна Brevus, Halyna Bohdanivna |
| Affiliation: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна |
| Bibliographic description (Ukraine): | Бревус Г. Б. Розробка системи відстеження походження та забезпечення якості даних при інтеграції гетерогенних потоків в граф знань на платформі Blue Brain Nexus : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 - комп’ютерні науки / наук. кер. М. Є. Фриз. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2025. 96 с. |
| Bibliographic reference (2015): | Бревус Г. Б. Розробка системи відстеження походження та забезпечення якості даних при інтеграції гетерогенних потоків в граф знань на платформі Blue Brain Nexus : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 «Комп’ютерні науки» / наук. кер. М. Є. Фриз. Тернопіль : ТНТУ, 2025. 96 с. |
| Issue Date: | 23-dec-2025 |
| Submitted date: | 9-dec-2025 |
| Date of entry: | 2-jan-2026 |
| Publisher: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
| Country (code): | UA |
| Place of the edition/event: | Тернопіль |
| Supervisor: | Фриз, Михайло Євгенович Fryz, Mykhailo |
| Committee members: | Луцик, Надія Степанівна Lutsyk, Nadiia |
| UDC: | 004.65:004.89 |
| Keywords: | 122 комп’ютерні науки гетерогенні дані граф знань інтеграція даних походження даних управління якістю blue brain nexus data provenance data quality etl knowledge graph ontologies rdf semantic web |
| Page range: | 96 |
| Abstract: | Кваліфікаційна робота присвячена вирішенню проблем забезпечення якості та прозорості походження даних (provenance) під час їх інтеграції у семантичні графи знань. Об’єктом дослідження є процеси опрацювання гетерогенних потоків даних на платформі Blue Brain Nexus. У роботі проаналізовано існуючі стандарти опису походження даних (PROV-O) та метрики оцінки якості семантичних даних. Розроблено архітектуру системи, яка дозволяє автоматизовано відстежувати життєвий цикл інформації від першоджерела до графу знань. Практична реалізація включає створення ETL-конвеєрів з вбудованими перевірками валідності та формування метаданих походження. Отримані результати дозволяють підвищити рівень довіри до даних у великих наукових та корпоративних проектах. Також розглянуто економічні аспекти розробки, вимоги до охорони праці та цивільного захисту The qualification work is devoted to solving the problems of ensuring quality and transparency of data origin (provenance) during their integration into semantic knowledge graphs. The object of study is the processes of processing heterogeneous data streams on the Blue Brain Nexus platform. The paper analyzes existing data provenance description standards (PROV-O) and metrics for assessing the quality of semantic data. A system architecture has been developed that allows automated tracking of the information life cycle from the primary source to the knowledge graph. The practical implementation includes the creation of ETL pipelines with built-in validity checks and the generation of provenance metadata. The results obtained increase the level of trust in data in large scientific and corporate projects. Economic aspects of development, labor protection requirements, and civil protection are also considered |
| Description: | Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 23.12.2025р. на засіданні екзаменаційної комісії №32 у Тернопільському національному технічному університеті імені Івана Пулюя |
| Content: | ВСТУП 7 1 АНАЛІТИЧНИЙ ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ 10 1.1 Концепція графів знань та семантичних сховищ даних 10 1.2 Проблема якості та походження даних у гетерогенних системах 16 1.3 Огляд можливостей платформи Blue Brain Nexus 22 Висновок до першого розділу 29 2 МОДЕЛЮВАННЯ СИСТЕМИ ВІДСТЕЖЕННЯ ТА КОНТРОЛЮ ЯКОСТІ 30 2.1 Формалізація моделей походження даних на основі PROV-O 30 2.2 Розробка метрик та алгоритмів оцінки якості інтегрованих даних 37 2.3 Проектування архітектури семантичного ETL-процесу 45 Висновок до другого розділу 52 3 ПРАКТИЧНА РЕАЛІЗАЦІЯ ТА ЕКСПЕРИМЕНТАЛЬНА ПЕРЕВІРКА 53 3.1 Налаштування середовища Blue Brain Nexus та опис онтологій 53 3.2 Розробка програмних засобів для автоматизації контролю якості 61 3.3 Аналіз результатів та оцінка ефективності системи 69 Висновок до третього розділу 75 4 ОБҐРУНТУВАННЯ ЕКОНОМІЧНОЇ ЕФЕКТИВНОСТІ 76 5 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 88 6 ЕКОЛОГІЯ 94 ЗАГАЛЬНІ ВИСНОВКИ 95 СПИСОК ЛІТЕРАТУРИ 96 |
| URI: | http://elartu.tntu.edu.ua/handle/lib/50862 |
| Copyright owner: | © Бревус Галина Богданівна, 2025 |
| References (Ukraine): | 1. H. Markram, E. Muller, S. Ramaswamy та iн., «Reconstruction and simulation of neocortical microcircuitry,» Cell, 2015. 2. K. Amunts, C. Ebell, J. Muller, M. Telefont, A. Knoll та T. Lippert, «The Human Brain Project: Creating a European research infrastructure to decode the human brain,» Neuron, 2016. 3. P. Buneman, S. Khanna та T. Wang-Chiew, «Data provenance: Some basic issues,» International Conference on Foundations of Software Technology and Theoretical Computer Science, 2001. 4. R. Y. Wang та D. M. Strong, «Beyond accuracy: What data quality means to data consumers,» Journal of management information systems, 1996. 5. L. Ehrlinger та W. W ̈oß, «Towards a definition of knowledge graphs,» SEMANTiCS (Posters, Demos, SuCCESS), 2016. 6. T. Berners-Lee, J. Hendler та O. Lassila, «The semantic web,» Scientific american, 2001. 7. E. Kleinsteuber, T. Al Mustafa, F. Zander та et al., «Managing Provenance Data in Knowledge Graph Management Platforms,» 2024. doi:10.1007/s13222-023-00463-0 8. G. Markakis та iн., «Blue Brain Nexus: An open, semantics-based data management platform,» в Proceedings of the 15th International Conference on e-Science, IEEE, 2019. 9. M. D. Wilkinson та iн., «The FAIR Guiding Principles for scientific data management and stewardship,» Scientific data, 2016. 10. P. M. Thompson, N. Jahanshad, C. R. Ching та iн., «A practical guide to data management for neuroscience research,» PLoS Biology, 2020. 11. T. Liebig, A. Maisenbacher, M. Opitz, J. R. Seyler, G. Sudra та J. Wissmann, «Building a Knowledge Graph for Products and Solutions in the Automation Industry,» 2019. https://ceur-ws.org/Vol-2489/paper2.pdf. 12. R. Dorsch, M. Freund, J. Fries та A. Andreas, GraphGuard: Enhancing Data Quality in Knowledge Graph Pipelines, 2023. https://ceur-ws.org/Vol-3647/SemIIM2023_paper_5.pdf. 13. H. Knublauch та D. Kontokostas, «Shapes constraint language (SHACL),» W3C, тех. звiт., 2017. 14. E. Prud’hommeaux, J. E. Labra Gayo та H. Solbrig, «Shape expressions: An rdf validation and transformation language,» в ACM International Conference Proceeding Series, 2014. doi:10.1145/2660517.2660523 15. N. Fursova, «Methodology for Data Validation 1.1,» Technical Report, 2018. дата зверн. 25 вер. 2025. https://cros-legacy.ec.europa.eu/system/files/ess_handbook_-_methodology_for_data_validation_v1.1_-_rev2018_0.pdf. 16. C. Batini, C. Cappiello, C. Francalanci та A. Maurino, «Methodologies for data quality assessment and improvement,» ACM computing surveys, 2009. 17. Wikipedia, Knowledge graph, 2025. дата зверн. 3 груд. 2025. https://en.wikipedia.org/wiki/Knowledge_graph. 18. Z. Guo, H. Chen, J. Wang та iн., «A survey on data lineage techniques,» IEEE Transactions on Knowledge and Data Engineering, 2019. 19. P. Groth та L. Moreau, «Provenance: an introduction to PROV,» Synthesis Lectures on the Semantic Web: Theory and Technology, 2014. 20. B. P ́erez, J. Rubio та C. S ́aenz-Ad ́an, «A systematic review of provenance systems,» Knowledge and Information Systems, 2018. 21. R. Kozak, Y. Skorenkyy, O. Kramar, T. Lechachenko та H. Brevus, «Cybersecurity provisioning for Industry 4.0 digital twin with AR components,» Conference name: 3rd International Workshop on Computer Information Technologies in Industry 4.0, CITI 2025; Conference date: 11 June 2025 through 12 June 2025; Conference code: 213470, т. 4057, CEUR-WS, 2025, с. 166-178. https://www.scopus.com/inward/record.uri?eid=2-s2.0-105019516326&partnerID=40&md5=30f4463c421daa232560a7cf165190ed. 22. R. Kozak, H. Brevus, Y. Skorenkyy, O. Kramar та N. Zagorodna, «Cybersecurity issues related to incorporation of VR interfaces into Industry 5.0 human-machine interfaces,» в Proceedings of the International Conference on System-Integrated Intelligence (SysInt 2025), Bremen, Germany: Deutsche Gesellschaft für Materialkunde e.V., черв. 2025, с. 45. 23. Blue Brain Project, Blue Brain Nexus Documentation, 2025. дата зверн. 12 листоп. 2025. https://bluebrainnexus.io/docs/. 24. H. Y. Ostrovska, L. Y. Maliuta, R. P. Sherstiuk, I. V. Lutsykiv та I. A. Yasinetska, «Development of intellectual potential at systematic paradigm of knowledge management,» Scientific Bulletin of National Mining University, No 4, с. 171, 2020, issn: 2071-2227. doi:10.33271/nvngu/2020-4/171 25. Blue Brain Project, Nexus Forge Documentation, 2025. дата зверн. 12 листоп. 2025. https://nexus-forge.readthedocs.io/. 26. P. Rohde, M. K. K. Abdel-Basset, L. K ̈afer та A.-C. N. Ngomo, «SHACL-ACL: An Access Control Language for RDF based on SHACL,» в The Semantic Web: ESWC 2023, 2023. https://2023.eswc-conferences.org/wp-content/uploads/2023/05/paper_Rohde_2023_SHACL-ACL.pdf. 27. B. Lypa, I. Horyn, N. Zagorodna, D. Tymoshchuk та T. Lechachenko, «Comparison of feature extraction tools for network traffic data,» CEUR Workshop Proceedings, т. 3896, с. 1-11, 2024. 28. Y. Skorenkyy, R. Kozak, N. Zagorodna, O. Kramar та I. Baran, «Use of augmented reality-enabled prototyping of cyber-physical systems for improving cybersecurity education,» Journal of Physics: Conference Series, т. 1840, No 1, 2021. doi:10.1088/1742-6596/1840/1/012026 29. Data Spaces Support Centre, Data Spaces Blueprint v2.0, 2025. дата зверн. 12 листоп. 2025. https://dssc.eu/space/BVE2/1071251457/Data+Spaces+Blueprint+v2.0+-+Home. 30. F. Noardo та iн., «Standards for Data Space Building Blocks,» Remote Sensing, 2024. doi:10.3390/rs16203824 https://www.mdpi.com/2072-4292/16/20/3824. 31. D. Rodrigues, M. Almeida, P. Guimarães та M. Y. Santos, «DataHub and Apache Atlas: A Comparative Analysis of Data Catalog Tools,» в CAPSI 2022 Proceedings, 2022. https://aisel.aisnet.org/capsi2022/41. 32. S. Saha, V. Murthy та P. Nanjundaswamy, «Apache Atlas: Data governance and metadata framework for Hadoop,» в 2018 IEEE International Conference on Big Data, IEEE, 2018. 33. Apache Software Foundation, Apache Atlas, 2025. дата зверн. 13 груд. 2025. https://atlas.apache.org/. 34. M. Lan та iн., «DataHub: A generalized metadata search & discovery tool,» LinkedIn Engineering Blog, 2020. 35. DataHub Project, DataHub Documentation, 2025. дата зверн. 13 груд. 2025. https://datahubproject.io/docs/. 36. M.-A. Abchir, O. El-Ghazi, M. Fredj та G. Galluzo, «Gouvernance des données : une approche de datavisualisation pour l’aide à la décision,» в CAPSI 2022 Proceedings, 2022. https://aisel.aisnet.org/capsi2022/29. 37. J. Khatun, «Understanding Data Contracts,» TechRxiv, 2024. doi:10.36227/techrxiv.171779368.80821952 38. Octopai, What are Data Contracts? 2024. дата зверн. 4 груд. 2025. https://www.octopai.com/what-are-data-contracts/. 39. Actian, Improve data quality with data lineage, 2025. дата зверн. 3 груд. 2025. https://www.actian.com/data-intelligence/data-lineage/. 40. I. Paananen, «Perceptions on data contracts and data sharing agreements,» Aalto University, School of Business, 2025. https://urn.fi/URN:NBN:fi:aalto-202511118736. 41. Wikipedia, Software requirements specification, 2025. дата зверн. 3 груд. 2025. https://en.wikipedia.org/wiki/Software_requirements_specification. 42. V. Yatsyshyn, O. Pastukh, A. Palamar та R. Zharovskyy, «Technology of relational database management systems performance evaluation during computer systems design,» Scientific Journal of TNTU, т. 109, No 1, с. 54-65, 2023. 43. S. Dastgheib, S. Vahdati, C. Lange та D. Fensel, «SHACL Engine for Validating RDF Data in a Distributed Environment,» в The Semantic Web: ESWC 2023 Satellite Events, Springer Nature Switzerland, 2023, с. 51-65, isbn: 978-3-031-43458-7. doi:10.1007/978-3-031-43458-7_4 44. D. Calvanese, D. Garijo, M. Montali, A. Mosca та M. Properzi, «A Survey of SHACL Implementations,» arXiv preprint arXiv:2112.01441, 2021. https://arxiv.org/abs/2112.01441. 45. D. Fensel та iн., ред., Knowledge Graphs and Big Data Processing. Springer, 2022, isbn: 978-3-030-95480-2. doi: 10.1007/978-3-030-95481-9 46. A. C. R. F. de Oliveira та M. d’Aquin, «Generating SHACL from natural language,» arXiv preprint arXiv:2108.06096, 2021. https://arxiv.org/abs/2108.06096. 47. bitol-io, Open Data Contract Standard, 2025. дата зверн. 8 листоп. 2025. https://bitol-io.github.io/open-data-contract-standard/latest/. 48. A. Kashosi, O. Kyshkevych та N. Zagorodna, «Data quality management in ETL process under resource constraints,» в Proceedings of the X Scientific and Technical Conference of TNTU, 2022. 49. Great Expectations Team, Great Expectations: Always know what to expect from your data, https://greatexpectations.io/, 2021. 50. L. Ni, W. Liu, L. Song та Y. Chen, «Apache Griffin: An open-source data quality solution for distributed data systems,» в 2018 IEEE International Conference on Big Data, IEEE, 2018, с. 884-889. 51. I. С. Стефанович, П. I. Стефанович та Т. В. Курбанова, «ПIДВИЩЕННЯ СТIЙКОСТI ОБ’ЄКТIВ ГОСПОДАРЮВАННЯ,» в The 6th International scientific and practical conference “Modern directions of scientific research development” (November 24-26, 2021), Chicago, USA: BoScience Publisher, 2021. 52. Безоплатна правнича допомога, Захист цивiльного населення пiд час вiйни, 2024. дата зверн. 1 груд. 2025. https://wiki.legalaid.gov.ua/. 53. Закон України «Про охорону працi», 2025. дата зверн. 1 груд. 2025. https://zakon.rada.gov.ua/laws/show/2694-12. 54. К. Дiдур, «Економiчна ефективнiсть впровадження заходiв з охорони працi,» Матерiали конференцiй, 2020. 55. Л. Катренко та А. Катренко, Охорона працi в галузi комп’ютинґу: Пiдручник. Львiв: Магнолiя 2006, 2024, с. 544. |
| Content type: | Master Thesis |
| Ebben a gyűjteményben: | 122 — комп’ютерні науки |
Fájlok a dokumentumban:
| Fájl | Leírás | Méret | Formátum | |
|---|---|---|---|---|
| Mag_2025_SNmd_61_Brevus_HB.pdf | Дипломна робота | 6,53 MB | Adobe PDF | Megtekintés/Megnyitás |
Minden dokumentum, ami a DSpace rendszerben szerepel, szerzői jogokkal védett. Minden jog fenntartva!
Admin Tools