Mesedez, erabili identifikatzaile hau item hau aipatzeko edo estekatzeko: http://elartu.tntu.edu.ua/handle/lib/53064
Titulua: Програмний засіб аналіз ринку мобільних телефонів засобами машинного навчання
Beste titulu batzuk: Software Tool for Mobile Phone Market Analysis Using Machine Learning
Egilea: Вітушинський, Андрій Іванович
Vitushynskyi, Andrii
Affiliation: Тернопільський національний технічний університет імені ім. І. Пулюя
Bibliographic reference (2015): Вітушинський А. І. Програмний засіб аналіз ринку мобільних телефонів засобами машинного навчання : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Р. М. Небесний. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 62 с.
Gordailuaren-data: 27-Jun-2026
Submitted date: 13-Jun-2026
Date of entry: 1-Jul-2026
Argitalpen: Тернопільський національний технічний університет імені ім. І. Пулюя
Country (code): UA
Place of the edition/event: Тернопіль
Supervisor: Небесний, Руслан Михайлович
Nebesnyi, Ruslan
UDC: 004.89:339.13:004.65
Gako-hitzak: 122
комп’ютерні науки
машинне навчання
аналіз ринку
веб-скрапінг
кластеризація
класифікація
смартфони
machine learning
market analysis
web scraping
beautifulsoup
random forest
clustering
classification
sqlite
python
smartphones
Page range: 62
Laburpena: Кваліфікаційна робота присвячена розробці програмного засобу для аналізу ринку мобільних телефонів із застосуванням методів машинного навчання. Актуальність теми зумовлена тим, що сучасний ринок смартфонів характеризується значною кількістю моделей, широким діапазоном цін та різноманіттям технічних характеристик, унаслідок чого ручний порівняльний аналіз і обґрунтований вибір пристрою стають складними для пересічного користувача. У роботі реалізовано повний цикл обробки даних: автоматизований збір інформації про товари з веб-ресурсу за допомогою бібліотеки BeautifulSoup, збереження зібраних даних у реляційній базі даних SQLite, попередня обробка та візуалізація даних засобами бібліотек pandas, matplotlib і seaborn, а також побудова та порівняння кількох класифікаційних моделей машинного навчання – дерева рішень, логістичної регресії, випадкового лісу (Random Forest), градієнтного бустингу XGBoost та ансамблевого голосування. Окрему увагу приділено обґрунтуванню вибору інструмента доступу до веб-ресурсу: проведено порівняння бібліотеки BeautifulSoup із фреймворком Selenium за критеріями швидкодії, споживання ресурсів та складності реалізації. За результатами порівняння для поставленої задачі обрано BeautifulSoup. Найкращу точність класифікації показав алгоритм Random Forest – 97,59 % на реальній вибірці та 79,47 % на імітованій. На основі побудованої моделі сформовано рекомендацію щодо вибору оптимальної моделі смартфона за критерієм максимізації характеристик при мінімізації ціни.
This qualification thesis is devoted to the development of a software tool for analyzing the mobile phone market using machine learning methods. The relevance of the topic stems from the fact that the modern smartphone market is characterized by a large number of models, a wide range of prices, and a diversity of technical specifications, which makes manual comparative analysis and a well-grounded choice of device difficult for the average user. The work implements a complete data processing pipeline: automated collection of product information from a web resource using the BeautifulSoup library, storage of the collected data in a relational SQLite database, preliminary processing and visualization of the data by means of the pandas, matplotlib, and seaborn libraries, as well as the construction and comparison of several machine learning classification models – a decision tree, logistic regression, random forest (Random Forest), gradient boosting (XGBoost), and ensemble voting. Particular attention is given to justifying the choice of the tool for accessing the web resource: the BeautifulSoup library is compared with the Selenium framework according to the criteria of performance, resource consumption, and implementation complexity. Based on the results of the comparison, BeautifulSoup was chosen for the task at hand. The highest classification accuracy was demonstrated by the Random Forest algorithm – 97.59% on the real sample and 79.47% on the simulated one. Based on the constructed model, a recommendation was formulated for choosing the optimal smartphone model according to the criterion of maximizing specifications while minimizing price.
Deskribapena: Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 27.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя
Content: ВСТУП 9 1 ТЕОРЕТИЧНІ ЗАСАДИ ВИКОРИСТАНИХ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ 12 1.1 Метод кластеризації K-середніх (K-Means) 12 1.2 Дерево рішень (Decision Tree) 13 1.3 Логістична регресія (Logistic Regression) 14 1.4 Випадковий ліс (Random Forest) 15 1.5 Градієнтний бустинг XGBoost 16 1.6 Ансамблеві методи (Voting Classifier) 17 1.7 Метрики оцінювання якості класифікації 18 1.8 Принципи підготовки даних для машинного навчання 19 1.9 Висновки до розділу 1 21 2 ПРОГРАМНА РЕАЛІЗАЦІЯ ДОСТУПУ ДО ВЕБ-РЕСУРСУ 22 2.1 Технологія веб-скрапінгу 22 2.2 Бібліотека BeautifulSoup та Selenium 22 2.3 Реалізація запиту до веб-ресурсу 25 2.4 Структура HTTP-запиту та HTML-розмітки 25 2.5 Висновки до розділу 2 26 3 ОПИС РОБОТИ ПРОГРАМНОГО КОДУ 27 3.1 Проєктування та створення бази даних 28 3.2 Збір та парсинг даних 29 3.3 Зчитування даних із бази даних 31 3.4 Опис структури зібраного набору даних 31 3.5 Візуалізація зібраних даних 32 3.6 Побудова та навчання моделей машинного навчання 34 3.6.1 Імпорт інструментів машинного навчання 35 3.6.2 Попередня обробка та кодування даних 35 3.6.3 Кластеризація та визначення цінових сегментів 37 3.6.4 Розбиття вибірки та навчання класифікаторів 39 3.6.5 Порівняння точності моделей 41 3.6.6 Формування підсумкової рекомендації 41 3.6.7 Інтерпретація результатів та обмеження моделі 46 3.7 Висновки до розділу 3 47 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 49 4.1 Питання щодо охорони праці 49 4.1.1 Ергономіка 49 4.1.2 Освітлення 51 4.1.3 Параметри мікроклімату 52 4.1.4 Емоційна психогігієна 53 4.2 Питання щодо безпеки в надзвичайних ситуаціях 55 ВИСНОВКИ 57 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 59 ДОДАТКИ 62
URI: http://elartu.tntu.edu.ua/handle/lib/53064
Copyright owner: © Вітушинський Андрій Іванович, 2026
References (Ukraine): 1. Курчак Ю. Р. Моделювання та аналіз системи рекомендацій на веб-сайті на основі теорії графів та статистичних алгоритмів : робота на здобуття кваліфікаційного ступеня магістра, спец. 122 – комп’ютерні науки / Ю. Р. Курчак ; наук. кер. І. О. Боднарчук. – Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2025. – 83 с.
2. Багрій М. Т. Розробка рекомендаційної системи для інтернет-магазину книг : робота на здобуття кваліфікаційного ступеня бакалавра, спец. 122 – комп’ютерні науки / М. Т. Багрій ; наук. кер. С. В. Марценко. – Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2025. – 64 с.
3. Небесний Р. М. Рекомендаційна система формування команд виконавців з відповідними фаховими компетентностями : дис. ... д-ра філософії : 122 / Р. М. Небесний. – Тернопіль, 2023. – 253 с.
4. Ржеуський А., Кунанець Н., Стахів М. Рекомендаційна система інформаційного обслуговування користувачів бібліотек // Матеріали V науково-технічної конференції «Інформаційні моделі, системи та технології», 1–2 лютого 2018 року. – Тернопіль : ТНТУ, 2018.
5. Бідюк П. І., Коршевнюк Л. О. Проектування комп’ютерних інформаційних систем підтримки прийняття рішень. Київ : Наукова думка, 2010. 340 с.
6. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. 2nd ed. Sebastopol : O'Reilly Media, 2019. 856 p.
7. Müller A. C., Guido S. Introduction to Machine Learning with Python: A Guide for Data Scientists. Sebastopol : O'Reilly Media, 2016. 392 p.
8. Raschka S., Mirjalili V. Python Machine Learning. 3rd ed. Birmingham : Packt Publishing, 2019. 770 p.
9. Breiman L. Random Forests. Machine Learning. 2001. Vol. 45, No. 1. P. 5–32.
10. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York : ACM, 2016. P. 785–794.
11. Pedregosa F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011. Vol. 12. P. 2825–2830.
12. VanderPlas J. Python Data Science Handbook: Essential Tools for Working with Data. Sebastopol : O'Reilly Media, 2016. 548 p.
13. McKinney W. Python for Data Analysis. 3rd ed. Sebastopol : O'Reilly Media, 2022. 579 p.
14. Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web. 2nd ed. Sebastopol : O'Reilly Media, 2018. 308 p.
15. Richardson L. Beautiful Soup Documentation. URL: https://www.crummy.com/software/BeautifulSoup/bs4/doc/ (дата звернення: 10.05.2024).
16. Selenium Documentation. URL: https://www.selenium.dev/documentation/ (дата звернення: 10.05.2024).
17. SQLite Documentation. URL: https://www.sqlite.org/docs.html (дата звернення: 12.05.2024).
18. Pandas Documentation. URL: https://pandas.pydata.org/docs/ (дата звернення: 12.05.2024).
19. Hunter J. D. Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering. 2007. Vol. 9, No. 3. P. 90–95.
20. Waskom M. L. seaborn: statistical data visualization. Journal of Open Source Software. 2021. Vol. 6, No. 60. P. 3021.
21. Стручок, В. С., Стручок, О. С., & Мудра, Д. В. (2017). Навчальний посібник до написання розділу дипломного проекту та дипломної роботи ″Безпека в надзвичайних ситуаціях ″для студентів всіх спец. денної, заочної (дистанційної) та екстернатної форм навчання.
22. Стручок, В. С. (2022). Техноекологія та цивільна безпека. Частина "Цивільна безпека". Навчальний посібник.
23. Жидецький, В. Ц., Джигирей, В. С., & Мельников, О. В. (2000). Основи охорони праці. Львів: Афіша, 350, 132-136.
24. Навакатікян О. О., Кальниш В. В., & Стрюков С. М. (1997). Охорона праці користувачів комп’ютерних відеодисплейних терміналів. О. Навакатікян.
25. Мельник, А., & Дмитроца, Л. (2026). Методи та архітектурні підходи до автоматизації тестування мобільних і вебзастосунків. вимірювальна та обчислювальна техніка в технологічних процесах, (2), 74-81. https://doi.org/10.31891/2219-9365-2026-86-9
26. Melnyk, A., Dmytrotsa, L., Palka, O., Vasylenko, Y., & Klymuk, N. (2025). Dynamic test case prioritisation for mobile applications based on real user behaviour data. Proceedings of the CITI 2025: The 3rd International Workshop on Computer Information Technologies in Industry 4.0 (Ternopil, Ukraine, June 11-12, 2025). CEUR Workshop Proceedings (CEURWS.org). 2025. Vol-4057, pp. 179-188. URL: https://ceur-ws.org/Vol-4057/paper12.pdf
27. Formation of an IT Project Team in the Context of PMBOK Requirements / R. Nebesnyi, N. Kunanets, R. Vaskiv, N. Veretennikova. 2021 IEEE 16th International Conference on Computer Sciences and Information Technologies (CSIT). 2021. Vol. 2. P. 431–436. URL: https://doi.org/10.1109/CSIT52704.2021.9615291 (дата звернення: 17.06.2026).
28. Project of an intelligent recommender system for parking vehicles in smart cities / Y. Pankiv, N. Kunanets, O. Artemenko, N. Veretennikova, R. Nebesnyi. 2021 IEEE 16th International Conference on Computer Sciences and Information Technologies (CSIT). 2021. Vol. 2. P. 419–422. URL: https://doi.org/10.1109/CSIT52704.2021.9648687 (дата звернення: 17.06.2026).
Content type: Bachelor Thesis
Bildumetan azaltzen da:122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Item honetako fitxategiak:
Fitxategia Deskribapena TamainaFormatua 
2026_KRB_SN-41_Vitushynskyi_AI.pdfДипломна робота1,93 MBAdobe PDFBistaratu/Ireki


DSpaceko itemak copyright bidez babestuta daude, eskubide guztiak gordeta, baldin eta kontrakoa adierazten ez bada.

Administratzailearen tresnak