Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/39650
Назва: Дослідження платформ керування даними та інструментів візуалізації для аналітики наукових досліджень
Інші назви: Research on Data Management Platforms and Visualization Tools for Science Analytics
Автори: Бєлоусов, Казимир Казимирович
Bielousov, Kazymyr Kazymyrovych
Приналежність: ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна
Бібліографічний опис: Бєлоусов К. К. Дослідження платформ керування даними та інструментів візуалізації для аналітики наукових досліджень : кваліфікаційна робота освітнього рівня магістра за спеціальністю „124 – системний аналіз“ / К. К. Бєлоусов – Тернопіль : ТНТУ, 2022. – 71 с.
Дата публікації: 20-гру-2022
Дата подання: 6-гру-2022
Дата внесення: 27-гру-2022
Країна (код): UA
Місце видання, проведення: ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Науковий керівник: Дуда, Олексій Михайлович
Члени комітету: Жаровський, Руслан Олегович
УДК: 004.9
Теми: аналіз
analysis
інтеграція
integration
дані
data
дослідження
research
доступність
accessibility
пошук
search
сумісність
interoperability
робочий процес
workflow
Короткий огляд (реферат): Кваліфікаційна робота присв’ячена дослідженню платформ керування даними та інструментів візуалізації для аналітики наукових досліджень. В першому розділі кваліфікаційної роботи описано програсивні методи збирання даних в процесах наукових досліджень. Виконано пошук та аналіз наукових публікацій щодо платформ даних в наукових дослідженнях. Проаналізовано кількісні показники наукових публікацій щодо платформ даних в наукових дослідженнях. Розглянуто критерії оцінювання інформаційно технологічних платформ для зберігання даних в наукових дослідженнях. В другому розділі кваліфікаційної роботи описано типи інформаційних колекцій та наборів даних, що використовуються в сучасних наукових дослідженнях. Досліджено поширені методи аналітичного опрацювання колекцій та наборів великих даних у наукових дослідженнях. Розглянуто системну платформу для інтеграції даних, засобів візуалізації та аналітичного опрацювання. В третьому розділі кваліфікаційної роботи описано встановлення та налаштування програмно-алгоритмічних елементів системних платформ керування даними, візуалізації та аналітичного опрацювання. Проаналізовано результати наукових розвідок.
The qualification work is dedicated to researching data management platforms and visualization tools for scientific research analytics. In the first section of the qualification work, progressive methods of data collection in the processes of scientific research are described. A search and analysis of scientific publications on data platforms in scientific research was carried out. Quantitative indicators of scientific publications regarding data platforms in scientific research were analyzed. The criteria for evaluating information technology platforms for data storage in scientific research are considered. The second section of the qualification paper describes the types of information collections and data sets used in modern scientific research. Common methods of analytical processing of collections and sets of big data in scientific research are studied. A system platform for data integration, visualization tools and analytical processing is considered. The third section of the qualification work describes the installation and configuration of software and algorithmic elements of system platforms for data management, visualization and analytical processing. The results of scientific investigations were analyzed.
Зміст: ВСТУП 7 1 СТАН ДОСЛІДЖЕНЬ В ГАЛУЗІ ПЛАТФОРМ КЕРУВАННЯ ДАНИМИ 9 1.1 Програсивні методи збирання даних в процесах наукових досліджень 9 1.2 Пошук та аналіз наукових публікацій щодо платформ даних в наукових дослідженнях 16 1.3 Аналіз кількісних показників наукових публікацій щодо платформ даних в наукових дослідженнях 20 1.4 Критерії оцінювання інформаційно технологічних платформ для зберігання даних в наукових дослідженнях 23 1.5 Висновок до першого розділу 27 2 CИСТЕМНИЙ АНАЛІЗ ТИПІВ ІНФОРМАЦІЙНИХ КОЛЕКЦІЙ ТА НАБОРІВ ДАНИХ, МЕТОДІВ ЇХ АНАЛІТИЧНОГО ОПРАЦЮВАННЯ В НАУКОВИХ ДОСЛІДЖЕННЯХ 28 2.1 Типи інформаційних колекцій та наборів даних, що використовуються в сучасних наукових дослідженнях 28 2.2 Поширені методи аналітичного опрацювання колекцій та наборів великих даних у наукових дослідженнях 32 2.3 Cистемна платформа для інтеграції даних, засобів візуалізації та аналітичного опрацювання 36 2.4 Висновок до другого розділу 41 3 МОДЕЛЮВАННЯ ТА ВИКОРИСТАННЯ ПЛАТФОРМ КЕРУВАННЯ ДАНИМИ ТА ІНСТРУМЕНТІВ ВІЗУАЛІЗАЦІЇ ДЛЯ АНАЛІТИКИ НАУКОВИХ ДОСЛІДЖЕНЬ 42 3.1 Встановлення та налаштування програмно-алгоритмічних елементів системних платформ керування даними, візуалізації та аналітичного опрацювання 43 3.2 Системне використання засобів інтерактивної візуалізації даних 45 3.3 Ініціювання програмно-алгоритмічних засобів візуального дослідження 50 3.4 Аналіз результатів наукових розвідок 53 3.5 Висновок до третього розділу 54 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 55 4.1 Організація праці при виконанні робіт в обчислювальному центрі 55 4.2 Здоровий спосіб життя людини та його вплив на професійну діяльність 59 4.3 Висновок до четвертого розділу 62 ВИСНОВКИ 63 ПЕРЕЛІК ДЖЕРЕЛ 64 ДОДАТКИ
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/39650
Власник авторського права: © Бєлоусов Казимир Казимирович, 2022
Перелік літератури: 1 Barkow-Oesterreicher S, Türker C, Panse C. FCC − an automated rulebased processing tool for life science data. Source Code Biol Med 2013;8:3.
2 Chiva C, Maia TM, Panse C, Stejskal K, Douché T, Matondo M, et al. Quality standards in proteomics research facilities.EMBO Rep 2021;22. https://doi.org/10.15252/embr.202152626
3 Panse, Christian, Christian Trachsel, and Can Türker. "Bridging data management platforms and visualization tools to enable ad-hoc and smart analytics in life sciences." Journal of Integrative Bioinformatics (2022).
4 Brunner E, Ahrens CH, Mohanty S, Baetschmann H, Loevenich S, Potthast F, et al. A high-quality catalog of the Drosophilamelanogaster proteome. Nat Biotechnol 2007;25:576−83.
5 Keim DA. Information visualization and visual data mining. IEEE Trans Visual Comput Graph 2002;8:1−8.
6 van Wijk JJ. The value of visualization. In: VIS 05. Minneapolis, Minnesota, USA: IEEE Visualization; 2005:79−86 pp.
7 United Nations Statistical Commission (2014) Big data and modernization of statistical systems. Report of the Secretary-General E/CN. 3.2014/11 of the forty-ffth session of UNSC 4–7 March 2014. United Nations, New York.
8 Di Bella E, Leporatti L, Maggino F (2018) Big data and social indicators: actual trends and new perspectives. Soc Indic Res 135:869– 878. https://doi.org/10.1007/s11205-016-1495-y.
9 Allen, Cameron, et al. "A review of scientific advancements in datasets derived from big data for monitoring the Sustainable Development Goals." Sustainability Science 16.5 (2021): 1701-1716.
10 Kong, Lingqiang, Zhifeng Liu, and Jianguo Wu. "A systematic review of big data-based urban sustainability research: State-of-the-science and future directions." Journal of Cleaner Production 273 (2020): 123142.
11 UNECOSOC (2013) Fundamental Principles of Ofcial Statistics. Resolution adopted by the United Nations Economic and Social Council on 24 July 2013. United Nations, New York.
12 Tam S-M, Van Halderen G (2020) The fve V’s, seven virtues and ten rules of big data engagement for ofcial statistics. Stat J IAOS 36:423–433. https://doi.org/10.3233/SJI-190595.
13 Florescu D, Karlberg M, Reis F, Del castillo PR, Skaliotis M & Wirthmann A (2014) Will ‘big data’ transform ofcial statistics. European Conference on the Quality of Ofcial Statistics 2014. Vienna, Austria.
14 Van Den Homberg M, Susha I (2018) Characterizing data ecosystems to support ofcial statistics with open mapping data for reporting on sustainable development goals. ISPRS Int J Geo-Inf 7:456. https://doi.org/10.3390/ijgi7120456.
15 Liu, Xingjian, and Ying Long. "Automated identification and characterization of parcels with OpenStreetMap and points of interest." Environment and Planning B: Planning and Design 43.2 (2016): 341-360
16 He, Qingsong, et al. "The impact of urban growth patterns on urban vitality in newly built-up areas based on an association rules analysis using geographical ‘big data’." Land Use Policy 78 (2018): 726-738
17 Xing, Hanfa, Yuan Meng, and Yan Shi. "A dynamic human activity‐driven model for mixed land use evaluation using social media data." Transactions in GIS 22.5 (2018): 1130-1151.
18 Song, Yimeng, et al. "Dynamic assessments of population exposure to urban greenspace using multi-source big data." Science of the Total Environment 634 (2018): 1315-1325
19 Goel, Rahul, et al. "Estimating city-level travel patterns using street imagery: A case study of using Google Street View in Britain." PloS one 13.5 (2018): e0196521
20 Kuo, Ching-Yen, et al. "Application of a time-stratified case-crossover design to explore the effects of air pollution and season on childhood asthma hospitalization in cities of differing urban patterns: Big data analytics of government open data." International Journal of Environmental Research and Public Health 15.4 (2018): 647
21 Becker, R.A., Caceres, R., Hanson, K., Loh, J.M., Urbanek, S., Varshavsky, A., Volinsky, C., 2011. A tale of one city: using cellular network data for urban planning. Ieee Pervasive Comput. 10 (4), 18e26.
22 Ilieva, R.T., McPhearson, T., 2018. Social-media data for urban sustainability. Nat. Sustain. 1 (10), 553e565.
23 Zhu, Xi, and Diansheng Guo. "Urban event detection with big data of taxi OD trips: A time series decomposition approach." Transactions in GIS 21.3 (2017): 560-574
24 Tao, Sui, et al. "Exploring Bus Rapid Transit passenger travel behaviour using big data." Applied geography 53 (2014): 90-104
25 Roof, K., Oleru, N., 2008. Public health: seattle and King County’s push for the built environment. J. Environ. Health 71 (1), 24e27.
26 Kuang, Bing, et al. "How urbanization influence urban land consumption intensity: Evidence from China." Habitat International 100 (2020): 102103.
27 Hassani, Hossein, et al. "A review of data mining applications in crime." Statistical Analysis and Data Mining: The ASA Data Science Journal 9.3 (2016): 139-154.
28 Hassani, Hossein, Xu Huang, and Emmanuel Silva. "Big data and climate change." Big Data and Cognitive Computing 3.1 (2019): 12.
29 Xu, Dongkuan, and Yingjie Tian. "A comprehensive survey of clustering algorithms." Annals of Data Science 2.2 (2015): 165-193.
30 Agrawal, Rakesh, Tomasz Imieliński, and Arun Swami. "Mining association rules between sets of items in large databases." Proceedings of the 1993 ACM SIGMOD international conference on Management of data. 1993.
31 Chifor, Bogdan-Cosmin, Ion Bica, and Victor-Valeriu Patriciu. "Sensing service architecture for smart cities using social network platforms." Soft Computing 21.16 (2017): 4513-4522
32 Poorthuis, Ate. "How to draw a neighborhood? The potential of big data, regionalization, and community detection for understanding the heterogeneous nature of urban neighborhoods." Geographical Analysis 50.2 (2018): 182-203
33 Ahlberg C. Spotfire: an information exploration environment. SIGMOD Rec 1996;25:25−9.
34 Marzolf B, Deutsch EW, Moss P, Campbell D, Johnson MH, Galitski T. SBEAMS-Microarray: database software supportinggenomic expression analyses for systems biology. BMC Bioinf 2006;7:286−91.
35 Poullet P, Carpentier S, Barillot E. myProMS, a web server for management and validation of mass spectrometry-basedproteomic data. Proteomics 2007;7:2553−6
36 Paulhe N, Canlet C, Damont A, Peyriga L, Durand S, Deborde C, et al. PeakForest: a multi-platform digital infrastructure forinteroperable metabolite spectral data and metadata management. Metabolomics 2022;18:40
37 Berthold MR, Cebron N, Dill F, Gabriel TR, Kötter T, Meinl T, et al. KNIME: the konstanz information miner. In: Studies inClassification, Data Analysis, and Knowledge Organization (GfKL 2007). Springer; 2007
38 Analyze anything with teradata analytics platform; 2018. Available from: https://www.teradata.com.
39 Qu K, Garamszegi S, Wu F, Thorvaldsdottir H, Liefeld T, Ocana M, et al. Integrative genomic analysis by interoperation ofbioinformatics tools in GenomeSpace. Nat Methods 2016;13:245−7.
40 CLC Genomics workbench; 2018. Available from: https://www.qiagenbioinformatics.com.
41 Sharma V, Eckels J, Taylor GK, Shulman NJ, Stergachis AB, Shannon AJ, et al. Panorama: a targeted proteomics knowledgebase. J Proteome Res 2014;13:4205−10.
42 The seven bridges platform: biomedical data analysis at scale; 2018. Available from: https://www.sevenbridges.com/platform/
43 Türker C, Schmid M, Joho D, Akal F, Gürel U. B-Fabric Project Manual; 2018. Available from: http://bfabric.org
44 Türker C, Akal F, Joho D, Panse C, Barkow-Oesterreicher S, Rehrauer H, et al. B-Fabric: the Swiss army knife for LifeSciences. In: Proceedings of the 13th international conference on extending database technology. EDBT ’10 Lausanne, Switzerland. New York, NY, USA: ACM; 2010:717−20 pp.
45 Aleksiev T, Barkow-Oesterreicher S, Kunszt P, Maffioletti S, Murri R, Panse C. VM-MAD: a cloud/cluster software forservice-oriented academic environments. In: Kunkel JM, Ludwig T, Meuer HW, editors Supercomputing. Berlin, Heidelberg: Springer; 2013:447−61 pp.
46 Chang W, Cheng J, Allaire J, Xie Y, McPherson J. shiny: Web application framework for R; 2016. R package version 0.13.2. Available from: https://CRAN.R-project.org/package=shiny
47 Perkins DN, Pappin DJC, Creasy DM, Cottrell JS. Probability-based protein identification by searching sequence databasesusing mass spectrometry data. Electrophoresis 1999;20:3551−67.
48 Eng JK, Jahan TA, Hoopmann MR. Comet: an open-source MS/MS sequence database search tool. Proteomics2012;13:22−4.
49 HUPO Proteomics Standards Initiative; 2017. Available from: http://www.psidev.info/
50 Lang DT, the CRAN Team. XML: tools for parsing and generating XML within R and S-plus; 2017. R package version 3.98-1.7. Available from: https://CRAN.R-project.org/package=XML
51 Trachsel C, Panse C. bfabricShiny: a shiny module for bridging B-fabric and R using REST; 2022. R package version 0.11.9. Available from https://github.com/fgcz/bfabricShiny
52 Nanni P, Panse C, Gehrig P, Mueller S, Grossmann J, Schlapbach R. PTM MarkerFinder, a software tool to detect andvalidate spectra from peptides carrying post-translational modifications. Proteomics 2013;13:2251−5
53 Trachsel C, Panse C, Kockmann T, Wolski WE, Grossmann J, Schlapbach R. rawDiag - an R package supporting rationalLC-MS method optimization for bottom-up proteomics. J Proteome Res 2018;17:2908−14
54 Wilkinson L. The Grammar of graphics (statistics and computing). Secaucus, NJ, USA: Springer-Verlag, Inc.; 2005
55 Wickham H. ggplot2: Elegant Graphics for Data Analysis. New York: Springer-Verlag; 2009. Available from: http://ggplot2.org
56 R Development Core Team. R: a language and environment for statistical computing. Vienna, Austria; 2008. Availablefrom: http://www.Rproject.org
57 Yoghourdjian V, Dwyer T, Klein K, Marriott K, Wybrow M. Graph thumbnails: identifying and comparing multiple graphs ata glance. IEEE Trans Visual Comput Graph 2018;1:3081−95
58 МІНІСТЕРСТВО СОЦІАЛЬНОЇ ПОЛІТИКИ УКРАЇНИ. Наказ 14.02.2018 № 207 Про затвердження Вимог щодо безпеки та захисту здоров’я працівників під час роботи з екранними пристроями. Доступно онлайн: https://zakon.rada.gov.ua/laws/show/z0508-18#Text
59 Умови праці працівників, які використовують у роботі персональні комп’ютери. Доступно онлайн: https://zolochiv.net/umovy-pratsi-pratsivnykiviaki-vykorystovuiut-u-roboti-personal-ni-komp-iutery/
60 Здоровий спосіб життя. Доступно онлайн: https://buklib.net/books/ 27545
61 Лекція 2. Теоретичні засади формування здорового способу життя. Доступно онлайн: https://msn.khnu.km.ua/pluginfile.php/281951/mod_resource/ content/0/%D0%A2%D0%95%D0%9C%D0%90_02.htm.
Тип вмісту: Master Thesis
Розташовується у зібраннях:124 — системний аналіз

Файли цього матеріалу:
Файл Опис РозмірФормат 
SAm-61_Bielousov_K_K.pdf2,68 MBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора