Please use this identifier to cite or link to this item: http://elartu.tntu.edu.ua/handle/lib/44479
Title: Розробка програмного забезпечення машинного навчання та обробки статистичних даних мовою Wolfram Language
Other Titles: Development of software for machine learning and statistical data processing in the Wolfram Language
Authors: Пешкович, Сергій Романович
Peshkovych, Serhiy
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя
Bibliographic description (Ukraine): Пешкович С. Р. Розробка програмного забезпечення машинного навчання та обробки статистичних даних мовою Wolfram Language : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „121 — інженерія програмного забезпечення“ / С. Р. Пешкович. — Тернопіль: ТНТУ, 2023. — 96 с.
Issue Date: Dec-2023
Submitted date: Dec-2023
Date of entry: 6-Feb-2024
Publisher: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: Тернопіль
Supervisor: Бойко, Ігор Володимирович
Committee members: Готович, Володимир Анатолійович
UDC: 004.9
Keywords: 121
інженерія програмного забезпечення
статистична обробка даних
машинне навчання
лінійна регресія
логістична регресія
Wolfram Mathematica
Number of pages: 96
Abstract: Метою атестаційної роботи магістра є розробка та практична реалізація методів машинного навчання й засобів спрямованих на обробку статистичної інформації різної етимології на основі середовища Wolfram Mathematica та мови програмування Wolfram Language. Технології розробки: Wolfram Mathematica, Wolfram Language, C#. Технології для тестування: WolframUnit.
The purpose of the master's certification work is the development and practical implementation of machine learning methods and tools aimed at processing statistical information of various etymologies based on the Wolfram Mathematica environment and the Wolfram Language programming language. Development technologies: Wolfram Mathematica, Wolfram Language, C#. Technologies for testing: WolframUnit.
Content: ЗМІСТ АНОТАЦІЯ 2 ABSTRACT 3 ЗМІСТ 4 ВСТУП 5 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ 6 2. МАШИННЕ НАВЧАННЯ З ВИКОРИСТАННЯМ МОВИ ПРОГРАМУВАННЯ WOLFRAM 10 2.1. Загальні підходи до побудови методології машинного навчання мовою Wolfram. Алгоритм градієнтного спуску 10 2.2. Реалізація алгоритму градієнтного спуску 11 2.3.Реалізаця алгоритму лінійної регресії. Набір даних Boston. Модель програмної системи регресії 14 2.4. Підходи до оцінки ефективності моделей 26 2.5. Методологія перенавчання гіперпараметрів моделі 28 3. СТАТИСТИЧНИЙ АНАЛІЗ ДАНИХ 30 3.1 Випадкові числа та їх генерація 30 3.2. Загальні статистичні показники 35 3.3. Статистичні діаграми та їх побудова у Wolfram Mathematica 38 3.4. Звичайний метод найменших квадратів та його реалізація мовою Wolfram Mathematica 55 4. МЕТОДИ ЛОГІСТИЧНОЇ РЕГРЕСІЇ 63 4.1. Поняття про логістичну регресію та її реалізацію мовою Wolfram. Набір даних Titanic 63 4.2. Застосування функції класифікації даних 69 4.3. Тестування моделі 74 5. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 80 5.1. Охорона праці 80 5.2 Безпека в надзвичайних ситуаціях 83 ВИСНОВКИ 89 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 90 ДОДАТКИ 95 ДОДАТОК А 96 1. ПІДСТАВИ ДО РОЗРОБКИ 98 2. ПРИЗНАЧЕННЯ ІНФОРМАЦІЙНОЇ СИСТЕМИ 98 3 ВИМОГИ ДО ІНФОРМАЦІЙНОЇ СИСТЕМИ 98 3.1 Функціональні вимоги 98 3.2 Технічні вимоги 99 3.3 Програмні вимоги 99 4. ЕТАПИ РОЗРОБКИ 99 5 СУПРОВІДНА ДОКУМЕНТАЦІЯ 100 6 ПОРЯДОК ЗДАЧІ ПРОЕКТУ 100 7. ВІДМІТКИ ПРО ВИКОНАННЯ ЕТАПІВ ТА ЗМІНИ В ПРОЕКТІ 100 ДОДАТОК Б 101
URI: http://elartu.tntu.edu.ua/handle/lib/44479
Copyright owner: © Пешкович Сергій Романович, 2023
References (Ukraine): 1. ISO Central Secretary. Information technology – Vocabulary. Standard ISO/IEC 2382:2015. Genf, Schweiz: International Organization for Standardization, 2015, p. 2121272.
2. Merriam–Webster. Data. Accessed Apr. 10, 2022. url: https://www.merriam-webster.com/dictionary/data.
3. Clifford M. Will. Theory and Experiment in Gravitational Physics. Cambridge University Press, Sept. 2018. doi: 10.1017/9781316338612.
4. Holger Ernst. “Patent information for strategic technology management”. In: World Patent Information 25.3 (Sept. 2003), pp. 233–242. doi: 10. 1016/s0172-2190(03)00077-2.
5. Peter Walde et al. “Erstellung von Technologie- und Wettbewerbsanalysen mithilfe von Big Data”. In: Wirtschaftsinformatik & Management 5.2 (Feb. 2013), pp. 12–23. doi: 10.1365/s35764-013-0274-7.
6. Robert Follmer and Dana Gruschwitz. Mobility in Germany – short report (edition 4.0). Accessed Apr. 18, 2022. Bonn, Berlin, Sept. 2019. url: http: //www.mobilitaet-in-deutschland.de/pdf/MiD2017_ShortReport.pdf.
7. Fábio Duarte and Ricardo Álvarez. “The data politics of the urban age”. In: Palgrave Communications 5.1 (May 2019). doi: 10.1057/s41599-019- 0264-3.
8. Deutscher Wetterdienst – Zentraler Vertrieb Klima und Umwelt. Klimadaten Deutschland. Accessed Apr. 1, 2020. Offenbach. url: https://www. dwd.de/DE/leistungen/klimadatendeutschland/klimadatendeutschland. html.
9. Jiawei Han, Micheline Kamber, and Jian Pei. Data Mining: Concepts and Techniques. 3rd ed. Elsevier, 2012.
10. Merriam-Webster. Data mining. Accessed Apr. 10, 2022. url: https: //www.merriam-webster.com/dictionary/data%20mining.
11. R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. 2020. url: https://www.Rproject.org/.
12. Guido van Rossum and Fred L. Drake. Python 3 Reference Manual. Scotts Valley, USA: CreateSpace, 2009.
13. Hadley Wickham. ggplot2. Elegant Graphics for Data Analysis. Springer, New York, 2009. doi: 10.1007/978-0-387-98141-3.
14. Till Tantau. The TikZ and PGF Packages. Manual for version 3.1.7. Nov. 2020. url: https://pgf-tikz.github.io/pgf/pgfmanual.pdf.
15. Simon Urbanek and Jeffrey Horner. Cairo: R Graphics Device using Cairo Graphics Library for Creating High-Quality Bitmap (PNG, JPEG, TIFF), Vector (PDF, SVG, PostScript) and Display (X11 and Win32) Output. R package. 2020. url: https://CRAN.R-project.org/package=Cairo.
16. Claus O. Wilke. cowplot: Streamlined Plot Theme and Plot Annotations for ’ggplot2’. R package. 2020. url: https : / /CRAN.R- project . org / package=cowplot.
17. Hadley Wickham et al. dplyr: A Grammar of Data Manipulation. R package. 2020. url: https://CRAN.R-project.org/package=dplyr.
18. Winston Chang. extrafont: Tools for using fonts. R package. 2014. url: https://CRAN.R-project.org/package=extrafont.
19. Daniel Müllner. “fastcluster: Fast Hierarchical, Agglomerative Clustering Routines for R and Python”. In: Journal of Statistical Software 53.9 (2013), pp. 1–18. url: http://www.jstatsoft.org/v53/i09/.
20. Alina Beygelzimer et al. FNN: Fast Nearest Neighbor Search Algorithms and Applications. R package. 2019. url: https://CRAN.R-project.org/ package=FNN.
21. Hadley Wickham. forcats: Tools for Working with Categorical Variables (Factors). R package. 2020. url: https://CRAN.R-project.org/package= forcats.
22. Andrie de Vries and Brian D. Ripley. ggdendro: Create Dendrograms and Tree Diagrams Using ’ggplot2’. R package. 2020. url: https://CRAN.Rproject. org/package=ggdendro.
23. Thomas Lin Pedersen. ggforce: Accelerating ’ggplot2’. R package. 2020. url: https://CRAN.R-project.org/package=ggforce.
24. Kamil Slowikowski. ggrepel: Automatically Position Non-Overlapping Text Labels with ’ggplot2’. R package. 2020. url: https://CRAN.R-project.org/ package=ggrepel.
25. Herve Cardot. Gmedian: Geometric Median, k-Median Clustering and Robust Median PCA. R package. 2020. url: https://CRAN.R-project. org/package=Gmedian.
26. Baptiste Auguie. gridExtra: Miscellaneous Functions for ’Grid’ Graphics. R package. 2017. url: https://CRAN.R-project.org/package=gridExtra.
27. Gabor Csardi and Tamas Nepusz. “The igraph software package for complex network research”. In: InterJournal Complex Systems (2006), p. 1695. url: https://igraph.org.
28. Stefano Meschiari. latex2exp: Use LaTeX Expressions in Plots. R package. 2015. url: https://CRAN.R-project.org/package=latex2exp.
29. Garrett Grolemund and Hadley Wickham. “Dates and Times Made Easy with lubridate”. In: Journal of Statistical Software 40.3 (2011), pp. 1–25. url: https://www.jstatsoft.org/v40/i03/.
30. Jeroen Ooms. magick: Advanced Graphics and Image-Processing in R. R package. 2020. url: https://CRAN.R-project.org/package=magick.
31. Doug McIlroy et al. mapproj: Map Projections. R package. 2020. url: https://CRAN.R-project.org/package=mapproj.
32. W. N. Venables and B. D. Ripley. Modern Applied Statistics with S. 4th ed. Springer, New York, 2002. doi: 10.1007/978-0-387-21706-2.
33. Friedrich Leisch and Evgenia Dimitriadou. mlbench: Machine Learning Benchmark Problems. R package. 2010. url: https://CRAN.R-project. org/package=mlbench.
34. Alan Genz et al. mvtnorm: Multivariate Normal and t Distributions. R package. 2020. url: https://CRAN.R-project.org/package=mvtnorm.
.35. Alan Genz and Frank Bretz. Computation of Multivariate Normal and t Probabilities. Lecture Notes in Statistics. Springer, Berlin, Heidelberg, 2009.
36. Stefan Fritsch, Frauke Günther, and Marvin N.Wright. neuralnet: Training of Neural Networks. R package. 2019. url: https://CRAN.R-project.org/ package=neuralnet. 36. Stefan Fritsch, Frauke Günther, and Marvin N.Wright. neuralnet: Training of Neural Networks. R package. 2019. url: https://CRAN.R-project.org/ package=neuralnet.
37. Diego Hernangómez. nominatimlite: Interface with ’Nominatim’ API Service. R package. 2022. doi: 10.5281/zenodo.5113195. url: https: //dieghernan.github.io/nominatimlite/.
38. David Meyer and Christian Buchta. proxy: Distance and Similarity Measures. R package. 2020. url: https://CRAN.R-project.org/package= proxy.
39. Damian W. Betebenner. randomNames: Function for Generating Random Names and a Dataset. R package. 2019. url: https://cran.r-project.org/ package=randomNames.
40. Hadley Wickham. “Reshaping Data with the reshape Package”. In: Journal of Statistical Software 21.12 (2007), pp. 1–20. url: http://www.jstatsoft. org/v21/i12/.
41. Michael W. Kearney. “rtweet: Collecting and analyzing Twitter data”. In: Journal of Open Source Software 4.42 (2019). R package, p. 1829. doi: 10.21105/joss.01829.
42. Hadley Wickham and Dana Seidel. scales: Scale Functions for Visualization. R package. 2020. url: https://CRAN.R-project.org/package=scales.
43. Carter T. Butts. sna: Tools for Social Network Analysis. R package. 2020. url: https://CRAN.R-project.org/package=sna.
44. Edzer J. Pebesma and Roger S. Bivand. “Classes and methods for spatial data in R”. In: R News 5.2 (Nov. 2005), pp. 9–13. url: https://CRAN.Rproject. org/doc/Rnews/.
45. Roger S. Bivand, Edzer Pebesma, and Virgilio Gomez-Rubio. Applied spatial data analysis with R. 2nd ed. Springer, New York, 2013. url: https://asdar-book.org/.
46. Mark P. J. van der Loo. “The stringdist package for approximate string matching”. In: The R Journal 6 (1 2014), pp. 111–122. url: https:// CRAN.R- project.org/package=stringdist.
47. Hadley Wickham. stringr: Simple, Consistent Wrappers for Common String Operations. R package. 2019. url: https://CRAN.R-project.org/ package=stringr.
48. Hadley Wickham et al. “Welcome to the tidyverse”. In: Journal of Open Source Software 4.43 (2019), p. 1686. doi: 10.21105/joss.01686.
49. Julia Silge and David Robinson. “tidytext: Text Mining and Analysis Using Tidy Data Principles in R”. In: JOSS 1.3 (2016). doi: 10.21105/joss.00037.
50. Justin Donaldson. tsne: t-Distributed Stochastic Neighbor Embedding for R (t-SNE). R package. 2016. url: https://CRAN.R-project.org/package= tsne.
51. Kyle Bittinger. usedist: Distance Matrix Utilities. R package. 2020. url: https://CRAN.R-project.org/package=usedist.
Content type: Master Thesis
Appears in Collections:121 — інженерія програмного забезпечення

Files in This Item:
File SizeFormat 
dyplom_Peshkovych_S_2023.pdf5,03 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Admin Tools