Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://elartu.tntu.edu.ua/handle/lib/53129
Název: Програмний засіб аналізу сайтів з продажу побутової техніки
Další názvy: Software Tool for Analyzing Home Appliance Retail Websites
Autoři: Ніконенко, Віталій Сергійович
Nikonenko, Vitalii
Affiliation: Тернопільський національний технічний університет імені ім. І. Пулюя
Bibliographic reference (2015): Ніконенко В. С. Програмний засіб аналізу сайтів з продажу побутової техніки : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Дмитроца. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 59 с.
Datum vydání: 24-čer-2026
Submitted date: 10-čer-2026
Date of entry: 3-čer-2026
Nakladatel: Тернопільський національний технічний університет імені ім. І. Пулюя
Country (code): UA
Place of the edition/event: Тернопіль
Supervisor: Дмитроца, Леся Павлівна
Dmytrotsa, Lesia
UDC: 004.42
Klíčová slova: 122
комп’ютерні науки
веб-парсинг
аналіз даних
автоматизація
побутова техніка
e-commerce
машинне навчання
моніторинг цін
web scraping
data analysis
automation
household appliances
comparative analysis
machine learning
price monitoring
Page range: 59
Abstrakt: Кваліфікаційна робота присвячена дослідженню методів та розробці програмного забезпечення для автоматизованого збору й інтелектуального аналізу даних з інтернет-магазинів побутової техніки. У першому розділі описано сучасний стан технологій веб-скрейпінгу, висвітлено проблеми неструктурованих даних в електронній комерції, розглянуто аналоги рішень для моніторингу цін та принципи побудови архітектури систем обробки великих масивів даних. Другий розділ містить обґрунтування технологічного стеку, дослідження методів зіставлення товарних позицій, а також опис структури бази даних та алгоритмів нормалізації інформації. У третьому розділі представлено програмну реалізацію системи, проаналізовано ефективність алгоритмів аналізу тональності відгуків та наведено результати тестування швидкодії й точності збору даних.
The qualification work is devoted to the research of methods and the development of software for automated data collection and intellectual analysis from household appliance online stores. The first chapter describes the current state of web scraping technologies, highlights the problems of unstructured data in e-commerce, examines existing software solutions for price monitoring, and analyzes the architectural principles of systems for processing large datasets. The second chapter provides the justification for the choice of the technology stack, researches methods for matching product items from various sources, and describes the database structure and data normalization algorithms. The third chapter presents the software implementation of the system, analyzes the efficiency of sentiment analysis algorithms for customer reviews, and provides the results of performance and data collection accuracy testing.
Popis: Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 24.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя
Content: ВСТУП 9 РОЗДІЛ 1 АНАЛІТИЧНИЙ ОГЛЯД 12 1.1 Аналіз ринку електронної комерції та специфіка даних 12 1.2 Огляд та порівняння методів веб-скрейпінгу 13 1.3 Методи інтелектуальної обробки даних: концепція Entity Matching 15 1.4 Огляд сучасних підходів до аналізу споживчих настроїв (Sentiment Analysis) 17 1.5 Формулювання вимог до розроблюваної системи 18 1.6 Висновки до першого розділу 19 РОЗДІЛ 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОГО ЗАСОБУ 21 2.1 Обґрунтування вибору технологічного стеку 21 2.2 Проєктування архітектури системи 23 2.3 Проєктування бази даних системи 23 2.4 Алгоритмічне забезпечення системи: логіка Entity Matching 27 2.5 Висновки до другого розділу 27 РОЗДІЛ 3 ПРАКТИЧНА РЕАЛІЗАЦІЯ ТА РЕЗУЛЬТАТИ РОБОТИ 32 3.1 Структура програмного продукту та опис середовища розробки 32 3.2 Реалізація модуля збору даних (Data Acquisition Layer) 34 3.3 Реалізація алгоритму Entity Matching 36 3.4 Реалізація модуля аналізу тональності відгуків (NLP) 38 3.5 Реалізація модуля візуалізації та аналітичного дашборду 40 3.6 Реалізація модуля формування звітності 42 3.7 Реалізація графічного інтерфейсу користувача 43 3.8 Тестування та оцінка ефективності системи 45 3.9 Висновки до третього розділу 49 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНOСТІ, OСНOВИ ХOРOНИ ПРАЦІ 50 4.1 Діяльність Її види та розуміння в безпеці праці 50 9 4.2 Суть та зміст управління охороною праці та безпекою життєдіяльності 51 4.3 Висновки до четвертого розділу 53 ВИСНОВКИ 55 ПЕРЕЛІК ДЖЕРЕЛ 57 ДОДАТКИ
URI: http://elartu.tntu.edu.ua/handle/lib/53129
Copyright owner: © Ніконенко Віталій Сергійович, 2026
References (Ukraine): 1. Василенко Ю. А. Аналіз ринку електронної комерції України: тенденції та прогнози. Економіка та держава. 2023. № 4. С. 34–39.
2. Струтинська І. В., Дмитроца Л. П., Сороківська О. А., Козбур Г. В. Особливості цифрового розвитку малого і середнього бізнесу України, країн Європи та G7. Колективна монографія. Тернопіль : ФОП Паляниця В. А., 2024. С. 411–427. (Розділ VI).
3. Zhao B. Web Scraping. Encyclopedia of Big Data. Springer, 2017. P. 1–3.
4. Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web. 2nd ed. O'Reilly Media, 2018. 306 p.
5. Richardson L. Beautiful Soup Documentation. Release 4.12.0. Crummy.com. 2023. URL: https://www.crummy.com/software/BeautifulSoup/bs4/doc/ (дата звернення: 15.03.2024).
6. Playwright for Python. Microsoft Open Source. 2024. URL: https://playwright.dev/python/docs/intro (дата звернення: 01.03.2024).
7. Kovács G., Magyar G. Analysis of web scraping methodologies for e-commerce data collection. Procedia Computer Science. 2022. Vol. 204. P. 412–419.
8. Christen P. Data Matching: Concepts and Techniques for Record Linkage, Entity Resolution, and Duplicate Detection. Springer, 2012. 270 p.
9. Elmagarmid A. K., Ipeirotis P. G., Verykios V. S. Duplicate Record Detection: A Survey. IEEE Transactions on Knowledge and Data Engineering. 2007. Vol. 19, No. 1. P. 1–16.
10. Levenshtein V. I. Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady. 1966. Vol. 10, No. 8. P. 707–710.
11. Liu B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers, 2012. 167 p.
11. Liu B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers, 2012. 167 p.
13. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. 3rd ed. O'Reilly Media, 2022. 861 p.
14. Рибачок Н. А., Висоцька В. А. Аналіз методів обробки природної мови для україномовних текстів. Вісник Національного університету «Львівська політехніка». Серія «Інформаційні системи та мережі». 2021. № 9. С. 45–57.
15. Дмитроца Л. П., Шубалий О. І. Дослідження сучасних трендів аналітики big data. Матеріали XIV МНТКМУС «Актуальні задачі сучасних технологій», 11–12 грудня 2025. Тернопіль : ФОП Паляниця В. А., 2025. С. 257–259.
16. TIOBE Index for May 2024. Programming Community Index. URL: https://www.tiobe.com/tiobe-index/ (дата звернення: 10.05.2024).
17. Stack Overflow Developer Survey 2023. Stack Overflow. 2023. URL: https://survey.stackoverflow.co/2023/ (дата звернення: 20.04.2024).
17. Stack Overflow Developer Survey 2023. Stack Overflow. 2023. URL: https://survey.stackoverflow.co/2023/ (дата звернення: 20.04.2024).
19. Python Software Foundation. Python 3.12 Documentation. 2024. URL: https://docs.python.org/3.12/ (дата звернення: 05.03.2024).
20. Hipp D. R. SQLite Documentation. SQLite Consortium. 2024. URL: https://www.sqlite.org/docs.html (дата звернення: 20.02.2024).
21. thefuzz – Fuzzy String Matching in Python. GitHub. SeatGeek. 2023. URL: https://github.com/seatgeek/thefuzz (дата звернення: 18.03.2024).
22. Matplotlib Documentation. Release 3.8.4. The Matplotlib Development Team. 2024. URL: https://matplotlib.org/stable/contents.html (дата звернення: 10.04.2024).
23. Hunter J. D. Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering. 2007. Vol. 9, No. 3. P. 90–95.
24. CustomTkinter Documentation. GitHub. Tom Schimansky. 2023. URL: https://customtkinter.tomschimansky.com/ (дата звернення: 12.04.2024).
25. Martin R. C. Clean Architecture: A Craftsman's Guide to Software Structure and Design. Prentice Hall, 2017. 432 p.
26. Fowler M. Patterns of Enterprise Application Architecture. Addison-Wesley, 2002. 560 p.
27. Агравал С. Архітектура програмного забезпечення на Python. Видавнича група BHV, 2019. 312 с.
28. Codd E. F. A Relational Model of Data for Large Shared Data Banks. Communications of the ACM. 1970. Vol. 13, No. 6. P. 377–387.
29. Date C. J. An Introduction to Database Systems. 8th ed. Addison-Wesley, 2003. 1024 p.
30. Гайда А. Ю. Бази даних: навчальний посібник. Львів: Видавництво Львівської політехніки, 2020. 256 с.
31. Fowler M. Event Sourcing. martinfowler.com. 2005. URL: https://martinfowler.com/eaaDev/EventSourcing.html (дата звернення: 05.04.2024).
32. Щербак Л. М., Рева І. В. Методи виявлення дублікатів у великих базах даних електронної комерції. Проблеми інформаційних технологій. 2022. № 1(31). С. 112–121.
33. Карпенко М. Ю., Уткін Б. Г. Застосування алгоритмів нечіткого рядкового порівняння в системах моніторингу цін. Вісник Харківського національного університету радіоелектроніки. 2023. № 2. С. 78–86.
34. IEEE Standard Glossary of Software Engineering Terminology. IEEE Std 610.12-1990. New York: IEEE, 1990. 84 p.
35. ISO/IEC 25010:2011. Systems and software engineering – Systems and software Quality Requirements and Evaluation (SQuaRE) – System and software quality models. Geneva: ISO, 2011. 34 p.
36. Атаманчук П.С. Безпека життєдіяльності: навч. посіб. Київ : Центр учбової літератури, 2020. 276 с.
37. Андрейчук Н.І. Охорона праці : навч. посіб. / Н.І. Андрейчук, Ю.В. Кіт, С.В. Шибанов, О.В. Шерстньова. Львів : Видавництво Львівська політехніка, 2021. 276 с.
Content type: Bachelor Thesis
Vyskytuje se v kolekcích:122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
2026_KRB_SN-42_Nikonenko_VS.pdfДипломна робота2,4 MBAdobe PDFZobrazit/otevřít


Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

Nástroje administrátora