Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://elartu.tntu.edu.ua/handle/lib/39650
Назва: | Дослідження платформ керування даними та інструментів візуалізації для аналітики наукових досліджень |
Інші назви: | Research on Data Management Platforms and Visualization Tools for Science Analytics |
Автори: | Бєлоусов, Казимир Казимирович Bielousov, Kazymyr Kazymyrovych |
Приналежність: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна |
Бібліографічний опис: | Бєлоусов К. К. Дослідження платформ керування даними та інструментів візуалізації для аналітики наукових досліджень : кваліфікаційна робота освітнього рівня магістра за спеціальністю „124 – системний аналіз“ / К. К. Бєлоусов – Тернопіль : ТНТУ, 2022. – 71 с. |
Дата публікації: | 20-гру-2022 |
Дата подання: | 6-гру-2022 |
Дата внесення: | 27-гру-2022 |
Країна (код): | UA |
Місце видання, проведення: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
Науковий керівник: | Дуда, Олексій Михайлович |
Члени комітету: | Жаровський, Руслан Олегович |
УДК: | 004.9 |
Теми: | аналіз analysis інтеграція integration дані data дослідження research доступність accessibility пошук search сумісність interoperability робочий процес workflow |
Короткий огляд (реферат): | Кваліфікаційна робота присв’ячена дослідженню платформ керування даними та інструментів візуалізації для аналітики наукових досліджень. В першому розділі кваліфікаційної роботи описано програсивні методи збирання даних в процесах наукових досліджень. Виконано пошук та аналіз наукових публікацій щодо платформ даних в наукових дослідженнях. Проаналізовано кількісні показники наукових публікацій щодо платформ даних в наукових дослідженнях. Розглянуто критерії оцінювання інформаційно технологічних платформ для зберігання даних в наукових дослідженнях. В другому розділі кваліфікаційної роботи описано типи інформаційних колекцій та наборів даних, що використовуються в сучасних наукових дослідженнях. Досліджено поширені методи аналітичного опрацювання колекцій та наборів великих даних у наукових дослідженнях. Розглянуто системну платформу для інтеграції даних, засобів візуалізації та аналітичного опрацювання. В третьому розділі кваліфікаційної роботи описано встановлення та налаштування програмно-алгоритмічних елементів системних платформ керування даними, візуалізації та аналітичного опрацювання. Проаналізовано результати наукових розвідок. The qualification work is dedicated to researching data management platforms and visualization tools for scientific research analytics. In the first section of the qualification work, progressive methods of data collection in the processes of scientific research are described. A search and analysis of scientific publications on data platforms in scientific research was carried out. Quantitative indicators of scientific publications regarding data platforms in scientific research were analyzed. The criteria for evaluating information technology platforms for data storage in scientific research are considered. The second section of the qualification paper describes the types of information collections and data sets used in modern scientific research. Common methods of analytical processing of collections and sets of big data in scientific research are studied. A system platform for data integration, visualization tools and analytical processing is considered. The third section of the qualification work describes the installation and configuration of software and algorithmic elements of system platforms for data management, visualization and analytical processing. The results of scientific investigations were analyzed. |
Зміст: | ВСТУП 7 1 СТАН ДОСЛІДЖЕНЬ В ГАЛУЗІ ПЛАТФОРМ КЕРУВАННЯ ДАНИМИ 9 1.1 Програсивні методи збирання даних в процесах наукових досліджень 9 1.2 Пошук та аналіз наукових публікацій щодо платформ даних в наукових дослідженнях 16 1.3 Аналіз кількісних показників наукових публікацій щодо платформ даних в наукових дослідженнях 20 1.4 Критерії оцінювання інформаційно технологічних платформ для зберігання даних в наукових дослідженнях 23 1.5 Висновок до першого розділу 27 2 CИСТЕМНИЙ АНАЛІЗ ТИПІВ ІНФОРМАЦІЙНИХ КОЛЕКЦІЙ ТА НАБОРІВ ДАНИХ, МЕТОДІВ ЇХ АНАЛІТИЧНОГО ОПРАЦЮВАННЯ В НАУКОВИХ ДОСЛІДЖЕННЯХ 28 2.1 Типи інформаційних колекцій та наборів даних, що використовуються в сучасних наукових дослідженнях 28 2.2 Поширені методи аналітичного опрацювання колекцій та наборів великих даних у наукових дослідженнях 32 2.3 Cистемна платформа для інтеграції даних, засобів візуалізації та аналітичного опрацювання 36 2.4 Висновок до другого розділу 41 3 МОДЕЛЮВАННЯ ТА ВИКОРИСТАННЯ ПЛАТФОРМ КЕРУВАННЯ ДАНИМИ ТА ІНСТРУМЕНТІВ ВІЗУАЛІЗАЦІЇ ДЛЯ АНАЛІТИКИ НАУКОВИХ ДОСЛІДЖЕНЬ 42 3.1 Встановлення та налаштування програмно-алгоритмічних елементів системних платформ керування даними, візуалізації та аналітичного опрацювання 43 3.2 Системне використання засобів інтерактивної візуалізації даних 45 3.3 Ініціювання програмно-алгоритмічних засобів візуального дослідження 50 3.4 Аналіз результатів наукових розвідок 53 3.5 Висновок до третього розділу 54 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 55 4.1 Організація праці при виконанні робіт в обчислювальному центрі 55 4.2 Здоровий спосіб життя людини та його вплив на професійну діяльність 59 4.3 Висновок до четвертого розділу 62 ВИСНОВКИ 63 ПЕРЕЛІК ДЖЕРЕЛ 64 ДОДАТКИ |
URI (Уніфікований ідентифікатор ресурсу): | http://elartu.tntu.edu.ua/handle/lib/39650 |
Власник авторського права: | © Бєлоусов Казимир Казимирович, 2022 |
Перелік літератури: | 1 Barkow-Oesterreicher S, Türker C, Panse C. FCC − an automated rulebased processing tool for life science data. Source Code Biol Med 2013;8:3. 2 Chiva C, Maia TM, Panse C, Stejskal K, Douché T, Matondo M, et al. Quality standards in proteomics research facilities.EMBO Rep 2021;22. https://doi.org/10.15252/embr.202152626 3 Panse, Christian, Christian Trachsel, and Can Türker. "Bridging data management platforms and visualization tools to enable ad-hoc and smart analytics in life sciences." Journal of Integrative Bioinformatics (2022). 4 Brunner E, Ahrens CH, Mohanty S, Baetschmann H, Loevenich S, Potthast F, et al. A high-quality catalog of the Drosophilamelanogaster proteome. Nat Biotechnol 2007;25:576−83. 5 Keim DA. Information visualization and visual data mining. IEEE Trans Visual Comput Graph 2002;8:1−8. 6 van Wijk JJ. The value of visualization. In: VIS 05. Minneapolis, Minnesota, USA: IEEE Visualization; 2005:79−86 pp. 7 United Nations Statistical Commission (2014) Big data and modernization of statistical systems. Report of the Secretary-General E/CN. 3.2014/11 of the forty-ffth session of UNSC 4–7 March 2014. United Nations, New York. 8 Di Bella E, Leporatti L, Maggino F (2018) Big data and social indicators: actual trends and new perspectives. Soc Indic Res 135:869– 878. https://doi.org/10.1007/s11205-016-1495-y. 9 Allen, Cameron, et al. "A review of scientific advancements in datasets derived from big data for monitoring the Sustainable Development Goals." Sustainability Science 16.5 (2021): 1701-1716. 10 Kong, Lingqiang, Zhifeng Liu, and Jianguo Wu. "A systematic review of big data-based urban sustainability research: State-of-the-science and future directions." Journal of Cleaner Production 273 (2020): 123142. 11 UNECOSOC (2013) Fundamental Principles of Ofcial Statistics. Resolution adopted by the United Nations Economic and Social Council on 24 July 2013. United Nations, New York. 12 Tam S-M, Van Halderen G (2020) The fve V’s, seven virtues and ten rules of big data engagement for ofcial statistics. Stat J IAOS 36:423–433. https://doi.org/10.3233/SJI-190595. 13 Florescu D, Karlberg M, Reis F, Del castillo PR, Skaliotis M & Wirthmann A (2014) Will ‘big data’ transform ofcial statistics. European Conference on the Quality of Ofcial Statistics 2014. Vienna, Austria. 14 Van Den Homberg M, Susha I (2018) Characterizing data ecosystems to support ofcial statistics with open mapping data for reporting on sustainable development goals. ISPRS Int J Geo-Inf 7:456. https://doi.org/10.3390/ijgi7120456. 15 Liu, Xingjian, and Ying Long. "Automated identification and characterization of parcels with OpenStreetMap and points of interest." Environment and Planning B: Planning and Design 43.2 (2016): 341-360 16 He, Qingsong, et al. "The impact of urban growth patterns on urban vitality in newly built-up areas based on an association rules analysis using geographical ‘big data’." Land Use Policy 78 (2018): 726-738 17 Xing, Hanfa, Yuan Meng, and Yan Shi. "A dynamic human activity‐driven model for mixed land use evaluation using social media data." Transactions in GIS 22.5 (2018): 1130-1151. 18 Song, Yimeng, et al. "Dynamic assessments of population exposure to urban greenspace using multi-source big data." Science of the Total Environment 634 (2018): 1315-1325 19 Goel, Rahul, et al. "Estimating city-level travel patterns using street imagery: A case study of using Google Street View in Britain." PloS one 13.5 (2018): e0196521 20 Kuo, Ching-Yen, et al. "Application of a time-stratified case-crossover design to explore the effects of air pollution and season on childhood asthma hospitalization in cities of differing urban patterns: Big data analytics of government open data." International Journal of Environmental Research and Public Health 15.4 (2018): 647 21 Becker, R.A., Caceres, R., Hanson, K., Loh, J.M., Urbanek, S., Varshavsky, A., Volinsky, C., 2011. A tale of one city: using cellular network data for urban planning. Ieee Pervasive Comput. 10 (4), 18e26. 22 Ilieva, R.T., McPhearson, T., 2018. Social-media data for urban sustainability. Nat. Sustain. 1 (10), 553e565. 23 Zhu, Xi, and Diansheng Guo. "Urban event detection with big data of taxi OD trips: A time series decomposition approach." Transactions in GIS 21.3 (2017): 560-574 24 Tao, Sui, et al. "Exploring Bus Rapid Transit passenger travel behaviour using big data." Applied geography 53 (2014): 90-104 25 Roof, K., Oleru, N., 2008. Public health: seattle and King County’s push for the built environment. J. Environ. Health 71 (1), 24e27. 26 Kuang, Bing, et al. "How urbanization influence urban land consumption intensity: Evidence from China." Habitat International 100 (2020): 102103. 27 Hassani, Hossein, et al. "A review of data mining applications in crime." Statistical Analysis and Data Mining: The ASA Data Science Journal 9.3 (2016): 139-154. 28 Hassani, Hossein, Xu Huang, and Emmanuel Silva. "Big data and climate change." Big Data and Cognitive Computing 3.1 (2019): 12. 29 Xu, Dongkuan, and Yingjie Tian. "A comprehensive survey of clustering algorithms." Annals of Data Science 2.2 (2015): 165-193. 30 Agrawal, Rakesh, Tomasz Imieliński, and Arun Swami. "Mining association rules between sets of items in large databases." Proceedings of the 1993 ACM SIGMOD international conference on Management of data. 1993. 31 Chifor, Bogdan-Cosmin, Ion Bica, and Victor-Valeriu Patriciu. "Sensing service architecture for smart cities using social network platforms." Soft Computing 21.16 (2017): 4513-4522 32 Poorthuis, Ate. "How to draw a neighborhood? The potential of big data, regionalization, and community detection for understanding the heterogeneous nature of urban neighborhoods." Geographical Analysis 50.2 (2018): 182-203 33 Ahlberg C. Spotfire: an information exploration environment. SIGMOD Rec 1996;25:25−9. 34 Marzolf B, Deutsch EW, Moss P, Campbell D, Johnson MH, Galitski T. SBEAMS-Microarray: database software supportinggenomic expression analyses for systems biology. BMC Bioinf 2006;7:286−91. 35 Poullet P, Carpentier S, Barillot E. myProMS, a web server for management and validation of mass spectrometry-basedproteomic data. Proteomics 2007;7:2553−6 36 Paulhe N, Canlet C, Damont A, Peyriga L, Durand S, Deborde C, et al. PeakForest: a multi-platform digital infrastructure forinteroperable metabolite spectral data and metadata management. Metabolomics 2022;18:40 37 Berthold MR, Cebron N, Dill F, Gabriel TR, Kötter T, Meinl T, et al. KNIME: the konstanz information miner. In: Studies inClassification, Data Analysis, and Knowledge Organization (GfKL 2007). Springer; 2007 38 Analyze anything with teradata analytics platform; 2018. Available from: https://www.teradata.com. 39 Qu K, Garamszegi S, Wu F, Thorvaldsdottir H, Liefeld T, Ocana M, et al. Integrative genomic analysis by interoperation ofbioinformatics tools in GenomeSpace. Nat Methods 2016;13:245−7. 40 CLC Genomics workbench; 2018. Available from: https://www.qiagenbioinformatics.com. 41 Sharma V, Eckels J, Taylor GK, Shulman NJ, Stergachis AB, Shannon AJ, et al. Panorama: a targeted proteomics knowledgebase. J Proteome Res 2014;13:4205−10. 42 The seven bridges platform: biomedical data analysis at scale; 2018. Available from: https://www.sevenbridges.com/platform/ 43 Türker C, Schmid M, Joho D, Akal F, Gürel U. B-Fabric Project Manual; 2018. Available from: http://bfabric.org 44 Türker C, Akal F, Joho D, Panse C, Barkow-Oesterreicher S, Rehrauer H, et al. B-Fabric: the Swiss army knife for LifeSciences. In: Proceedings of the 13th international conference on extending database technology. EDBT ’10 Lausanne, Switzerland. New York, NY, USA: ACM; 2010:717−20 pp. 45 Aleksiev T, Barkow-Oesterreicher S, Kunszt P, Maffioletti S, Murri R, Panse C. VM-MAD: a cloud/cluster software forservice-oriented academic environments. In: Kunkel JM, Ludwig T, Meuer HW, editors Supercomputing. Berlin, Heidelberg: Springer; 2013:447−61 pp. 46 Chang W, Cheng J, Allaire J, Xie Y, McPherson J. shiny: Web application framework for R; 2016. R package version 0.13.2. Available from: https://CRAN.R-project.org/package=shiny 47 Perkins DN, Pappin DJC, Creasy DM, Cottrell JS. Probability-based protein identification by searching sequence databasesusing mass spectrometry data. Electrophoresis 1999;20:3551−67. 48 Eng JK, Jahan TA, Hoopmann MR. Comet: an open-source MS/MS sequence database search tool. Proteomics2012;13:22−4. 49 HUPO Proteomics Standards Initiative; 2017. Available from: http://www.psidev.info/ 50 Lang DT, the CRAN Team. XML: tools for parsing and generating XML within R and S-plus; 2017. R package version 3.98-1.7. Available from: https://CRAN.R-project.org/package=XML 51 Trachsel C, Panse C. bfabricShiny: a shiny module for bridging B-fabric and R using REST; 2022. R package version 0.11.9. Available from https://github.com/fgcz/bfabricShiny 52 Nanni P, Panse C, Gehrig P, Mueller S, Grossmann J, Schlapbach R. PTM MarkerFinder, a software tool to detect andvalidate spectra from peptides carrying post-translational modifications. Proteomics 2013;13:2251−5 53 Trachsel C, Panse C, Kockmann T, Wolski WE, Grossmann J, Schlapbach R. rawDiag - an R package supporting rationalLC-MS method optimization for bottom-up proteomics. J Proteome Res 2018;17:2908−14 54 Wilkinson L. The Grammar of graphics (statistics and computing). Secaucus, NJ, USA: Springer-Verlag, Inc.; 2005 55 Wickham H. ggplot2: Elegant Graphics for Data Analysis. New York: Springer-Verlag; 2009. Available from: http://ggplot2.org 56 R Development Core Team. R: a language and environment for statistical computing. Vienna, Austria; 2008. Availablefrom: http://www.Rproject.org 57 Yoghourdjian V, Dwyer T, Klein K, Marriott K, Wybrow M. Graph thumbnails: identifying and comparing multiple graphs ata glance. IEEE Trans Visual Comput Graph 2018;1:3081−95 58 МІНІСТЕРСТВО СОЦІАЛЬНОЇ ПОЛІТИКИ УКРАЇНИ. Наказ 14.02.2018 № 207 Про затвердження Вимог щодо безпеки та захисту здоров’я працівників під час роботи з екранними пристроями. Доступно онлайн: https://zakon.rada.gov.ua/laws/show/z0508-18#Text 59 Умови праці працівників, які використовують у роботі персональні комп’ютери. Доступно онлайн: https://zolochiv.net/umovy-pratsi-pratsivnykiviaki-vykorystovuiut-u-roboti-personal-ni-komp-iutery/ 60 Здоровий спосіб життя. Доступно онлайн: https://buklib.net/books/ 27545 61 Лекція 2. Теоретичні засади формування здорового способу життя. Доступно онлайн: https://msn.khnu.km.ua/pluginfile.php/281951/mod_resource/ content/0/%D0%A2%D0%95%D0%9C%D0%90_02.htm. |
Тип вмісту: | Master Thesis |
Розташовується у зібраннях: | 124 — системний аналіз |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
SAm-61_Bielousov_K_K.pdf | 2,68 MB | Adobe PDF | Переглянути/відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.
Інструменти адміністратора