Utilizza questo identificativo per citare o creare un link a questo documento: http://elartu.tntu.edu.ua/handle/lib/52591
Titolo: Розробка програмного забезпечення для аналізу та виявлення закономірностей у даних
Titoli alternativi: Development of software for data analysis and pattern detection
Autori: Карпюк, Катерина Василівна
Karpiuk, Kateryna
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя
Bibliographic reference (2015): Карпюк К. В. Розробка програмного забезпечення для аналізу та виявлення закономірностей у даних : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 – інженерія програмного забезпечення / наук. кер. М. Р. Петрик. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 68 с.
Data: giu-2026
Date of entry: 23-giu-2026
Editore: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: Тернопільський національний технічний університет імені Івана Пулюя, факультет ФІС
Supervisor: Петрик, Михайло Романович
Committee members: Яцишин, Василь Володимирович
UDC: 004.9
Parole chiave: аналіз даних
табличні дані
CSV
вебзастосунок
машинне навчання
закономірності
data analysis
tabular data
web application
machine learning
pattern detection
Number of pages: 74
Abstract: Кваліфікаційна робота присвячена розробці навчального вебсередовища для аналізу табличних даних та виявлення закономірностей у них. У роботі реалізовано вебзастосунок, який дозволяє завантажувати CSV-файли, переглядати профіль набору даних, аналізувати якість даних, виконувати статистичний і кореляційний аналіз, будувати графіки, виявляти викиди, формувати рейтинг закономірностей та запускати базові моделі машинного навчання. У першому розділі розглянуто предметну область аналізу даних, існуючі програмні рішення та сформовано вимоги до розроблюваної системи. У другому розділі спроєктовано архітектуру вебзастосунку, структуру серверної та клієнтської частин, базу даних, API та UML-діаграми. У третьому розділі описано реалізацію програмного забезпечення, зокрема серверної частини, модулів аналізу даних, машинного навчання та клієнтського інтерфейсу. У четвертому розділі наведено результати тестування системи, перевірено коректність роботи основних функцій і виконано оцінювання швидкодії на вибірках різного обсягу. У п’ятому розділі розглянуто питання безпеки життєдіяльності та основ охорони праці. Об’єкт дослідження: процес навчального аналізу табличних даних. Предмет дослідження: програмні засоби реалізації вебсередовища для профілювання, статистичного аналізу, виявлення закономірностей і застосування базових моделей машинного навчання до табличних даних.
The qualification work is devoted to the development of an educational web environment for analyzing tabular data and detecting patterns in them. The developed web application allows users to upload CSV files, view a dataset profile, analyze data quality, perform statistical and correlation analysis, build charts, detect outliers, generate a ranking of patterns, and run basic machine learning models. The first chapter describes the subject area of data analysis, existing software solutions, and the requirements for the developed system. The second chapter presents the design of the web application architecture, the structure of the server and client parts, the database, API, and UML diagrams. The third chapter describes the implementation of the software, including the server part, data analysis modules, machine learning modules, and the client interface. The fourth chapter presents the testing results, verifies the correctness of the main functions, and evaluates the system performance on datasets of different sizes. The fifth chapter considers life safety and occupational safety issues. Object of the research: the process of educational analysis of tabular data. Subject of the study: software tools for implementing a web environment for profiling, statistical analysis, pattern detection, and application of basic machine learning models to tabular data.
Content: Вступ ... 8 1 Аналіз предметної області та постановка задачі ... 10 1.1 Аналіз предметної області ... 10 1.2 Аналіз існуючих програмних рішень для аналізу даних... 12 1.3 Формування функціональних та нефункціональних вимог ... 13 1.4 Постановка задачі та критерії оцінювання результатів ... 15 2 Проєктування архітектури системи... 17 2.1 Вибір архітектурних рішень ... 17 2.2 Проєктування компонентів серверної частини та API ... 20 2.3 Вибір бази даних та проєктування структури ... 23 2.4 Проєктування клієнтського інтерфейсу і структури дашбордів ... 24 2.5 Проєктування UML-діаграм ... 25 3 Реалізація програмного забезпечення ... 29 3.1 Реалізація архітектури та серверної частини системи ... 29 3.2 Реалізація підсистеми профілювання та аналізу даних ... 32 3.3 Реалізація модулів виявлення закономірностей та машинного навчання ... 37 3.4 Реалізація клієнтської частини та засобів візуалізації ... 44 4 Тестування, впровадження та експлуатація ... 46 4.1 Методика тестування та джерела експериментальних даних ... 46 4.2 Первинне профілювання та аналіз якості даних у системі ... 48 4.3 Порівняння роботи системи на малому, середньому та великому обсязі вибірки ... 50 4.4 Перевірка роботи модулів виявлення закономірностей і машинного навчання ... 51 4.5 Впровадження експлуатація та напрями подальшого розвитку системи53 5 Безпека життєдіяльності, основи охорони праці ... 56 5.1 Застосування ризик-орієнтованого підходу для побудови імовірнісних структурно-логічних моделей виникнення та розвитку надзвичайних ситуацій... 56 5.2 Психофізіологічне розвантаження для працівників ... 59 Висновки ... 63 Список використаних джерел ... 65 Додатки ...69 Додаток А – Тези конференції ... 70 Додаток Б – Посилання на репозиторій GitHub ... 74
URI: http://elartu.tntu.edu.ua/handle/lib/52591
Copyright owner: © Карпюк Катерина Василівна , 2026
References (Ukraine): 1. Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques. 4th ed. Cambridge : Morgan Kaufmann, 2022. 752 p. URL: https://datamineaz.org/textbooks/hanDataMiningConceptual.pdf. (date of access: 14.06.2026).
2. Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R. CRISP-DM 1.0: Step-by-step data mining guide. SPSS Inc., 2000. 76 p. URL: https://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/14.2/es/CRISP-DM.pdf. (date of access: 14.06.2026).
3. Bruce P., Bruce A., Gedeck P. Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python. 2nd ed. Sebastopol : O’Reilly Media, 2020. 368 p. URL: https://datapot.vn/wp-content/uploads/2023/12/datapot.vn-Practical-Statistics-for-Data-Scientists.pdf?srsltid=AfmBOop0Aw4NogXNmGpNO8dG6EsG dynuyQ99sbq5ldXWUPBjjXe7hkzu. (date of access: 14.06.2026).
4. James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning: with Applications in R. 2nd ed. New York : Springer, 2021. 607 p. URL: https://www.casact.org/sites/default/files/2022-12/James-G.-et-al.-2nd-edition-Springer-2021.pdf. (date of access: 14.06.2026).
5. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. 3rd ed. Sebastopol : O’Reilly Media, 2022. 864 p. URL: https://www.rasa-ai.com/wp-content/uploads/2022/02/Aur%C3%A9lien-G%C 3%A9ron-Hands-On-Machine-Learning-with-Scikit-Learn-Keras-and-Tensorflow_-Concepts-Tools-and-Techniques-to-Build-Intelligent-Systems-O%E2%80%99Reilly-Media-2019.pdf. (date of access: 14.06.2026).
6. Power BI vs Tableau – Pros and Cons – The Data School. The Data School powered by The Information Lab. URL: https://www.thedataschool.co.uk/a/carlo-sanzeri/power-bi-vs-tableau-pros-and-cons/ (date of access: 14.06.2026).
7. GeeksforGeeks. Data Analysis and Visualization with Jupyter Notebook - GeeksforGeeks. GeeksforGeeks. URL: https://www.geeksforgeeks.org/data-analysis/ data-analysis-and-visualization-with-jupyter-notebook/ (date of access: 14.06.2026).
8. Data Mining. Orange Data Mining – Data Mining. URL: https://oldorange.biolab.si/ (date of access: 14.06.2026).
9. Pressman R. S., Maxim B. R. Software Engineering: A Practitioner’s Approach. 9th ed. New York : McGraw-Hill Education, 2019. 705 p. URL: https://www.mlsu.ac.in/econtents/16_EBOOK-7th_ed_software_engineering_a_practitioners_approach_by_roger_s._pressman_.pdf. (date of access: 14.06.2026).
10. Bass L., Clements P., Kazman R. Software Architecture in Practice. 4th ed. Boston : Addison-Wesley, 2021. 464 p. URL https://www.scribd.com/ document/771670822/Software-Architecture-in-Practice-4th -Edition. (date of access: 14.06.2026).
11. David R. Cheriton School of Computer Science | Cheriton School of Computer Science | University of Waterloo. URL: https://cs.uwaterloo.ca/ ~m2nagapp/courses/CS446/1195/Arch_Design_Activity/Layered.pdf (дата звернення: 14.06.2026).
12. Microservices Architecture | Atlassian. Collaboration software for software, IT and business teams | Atlassian. URL: https://www.atlassian.com/ microservices/microservices-architecture (date of access: 14.06.2026).
13. Choosing the Right Software Architecture: A Guide to Selecting the Best Fit for Your Project. Medium. URL: https://ravindusandaruwandh. medium.com/choosing-the-right-software-architecture-a-guide-to-selecting-the-best-fit-for-your-project-ecdda 7812fb1. (date of access: 14.06.2026).
14. Kleppmann M. Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. Sebastopol : O’Reilly Media, 2017. 616 p. URL: https://0-lucas.github.io/digital-garden/99.-Books/Martin-Kleppmann-Designing -Data-Intensive-Applications_-O%E2%80%99Reilly-Media-(2017).pdf. (date of access: 14.06.2026).
15. GeeksforGeeks. Flask Tutorial – GeeksforGeeks. GeeksforGeeks. URL: https://www.geeksforgeeks.org/python/flask-tutorial/ (date of access: 14.06.2026).
Content type: Bachelor Thesis
È visualizzato nelle collezioni:121 — Інженерія програмного забезпечення, F2 Інженерія програмного забезпечення (бакалаври)

File in questo documento:
File Descrizione DimensioniFormato 
dyplom_Karpiuk_K_2026.pdf1,95 MBAdobe PDFVisualizza/apri


Tutti i documenti archiviati in DSpace sono protetti da copyright. Tutti i diritti riservati.

Strumenti di amministrazione