Система моніторингу та аналізу тональності стрічок новин для оцінки інформаційного фону

Семенів, Віктор Сергійович; Semeniv, Viktor

霂瑞霂��撘����迨��辣: http://elartu.tntu.edu.ua/handle/lib/53077

Title:	Система моніторингу та аналізу тональності стрічок новин для оцінки інформаційного фону
Other Titles:	News Feed Sentiment Monitoring and Analysis System for Information Environment Assessment
Authors:	Семенів, Віктор Сергійович Semeniv, Viktor
Affiliation:	Тернопільський національний технічний університет імені ім. І. Пулюя
Bibliographic reference (2015):	Семенів В. С. Система моніторингу та аналізу тональності стрічок новин для оцінки інформаційного фону : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Дмитроца. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 65 с.
Issue Date:	25-六月-2026
Submitted date:	11-六月-2026
Date of entry:	1-七月-2026
Publisher:	Тернопільський національний технічний університет імені ім. І. Пулюя
Country (code):	UA
Place of the edition/event:	Тернопіль
Supervisor:	Дмитроца, Леся Павлівна Dmytrotsa, Lesia
UDC:	004.912:004.89
Keywords:	122 комп’ютерні науки аналіз тональності моніторинг медіа-простору наївний байєсівський класифікатор обробка природної мови інформаційний фон веб-дашборд лематизація база даних sentiment analysis media space monitoring naive bayes classifier natural language processing information background web dashboard lemmatization sqlite sqlite database
Page range:	65
Abstract:	Кваліфікаційна робота присвячена дослідженню процесів автоматизованого збору, обробки та семантичного аналізу масивів неструктурованої текстової інформації з інтернет-ресурсів для оцінки емоційного забарвлення україномовних текстів. В першому розділі кваліфікаційної роботи описано актуальність автоматизованого моніторингу медіа-простору в умовах поширення дезінформації та інформаційно-психологічних операцій. Висвітлено математичний апарат імовірнісної класифікації тексту за допомогою мультиноміального наївного байєсівського класифікатора із застосуванням згладжування Лапласа. Розглянуто функціональні можливості та обмеження існуючих глобальних комерційних систем-аналогів (YouScan, Semantrum). Проаналізовано та обґрунтовано вибір оптимального технологічного стеку розробки на базі мови Python, бібліотек NLP, фреймворку Streamlit та СКБД SQLite. В другому розділі кваліфікаційної роботи обґрунтовано використання модульного патерну розробки з чітким розподілом зон відповідальності компонентів. Досліджено логічні та інформаційні потоки обробки даних і сформовано послідовний конвеєр попередньої лінгвістичної підготовки, що включає токенізацію, семантичну фільтрацію стоп-слів та морфологічну лематизацію флективних україномовних текстів. Подано логічну структуру реляційної бази даних SQLite, нормалізованої до третьої нормальної форми (3NF) та оптимізованої за допомогою B-Tree індексації часових полів для миттєвої вибірки історичних масивів. В третьому розділі кваліфікаційної роботи описано створення стабільних програмних модулів автоматизованого збору інформації (Data Harvester), аналітичного ядра класифікації тональності та декларативного рендерингу елементів інтерфейсу. Проаналізовано інженерні рішення безпечної взаємодії з СКБД через параметризовані SQL-запити для захисту від ін'єкцій та впровадження механізмів кешування оперативної пам'яті. Проведено комплексне експериментальне тестування створеного програмного продукту за методом «чорної скриньки», яке підтвердило його стовідсоткову відмовостійкість при мережевих затримках та зафіксувало високу швидкодію обробки великих масивів інформації. Об’єкт дослідження: процес автоматизованого збору, обробки та семантичного аналізу масивів неструктурованої текстової інформації з інтернет-ресурсів. Предмет дослідження: математичні моделі, алгоритми машинного навчання та програмні засоби визначення емоційного забарвлення (тональності) україномовних текстів. The qualification work is dedicated to the automated collection, processing, and semantic analysis of unstructured text information arrays from internet resources. The goal of the work is to improve the quality of automated media space monitoring services by developing a local software system (PC Dashboard) for collecting news feeds and classifying their sentiment. The first section of the qualification paper considers the modern information space problems, reviews existing commercial analogues like YouScan and Semantrum, highlights the mathematical apparatus of the Multinomial Naive Bayes classifier, and justifies the choice of the Python-based technological stack. The second section considers the modular architecture design with a clear separation of concerns, the development of an NLP pipeline for Ukrainian text preprocessing (tokenization, stop-words filtration, lemmatization), and the conceptual design of a 3NF relational SQLite database optimized with B-Tree indexes. The third section describes the programmatic implementation of the Data Harvester module, the sentiment analysis core, the Streamlit and Plotly-based UI dashboard, and the results of black-box experimental testing that confirmed high system performance and fault tolerance. Object of research: the process of automated collection, processing, and semantic analysis of unstructured text information arrays from internet resources. Subject of research: mathematical models, machine learning algorithms, and software tools for determining the emotional coloring (sentiment) of Ukrainian texts.
Description:	Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 25.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя
Content:	ВСТУП 10 РОЗДІЛ 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ТА ПОСТАНОВКА ЗАВДАННЯ 12 1.1 Аналіз інформаційного простору та проблематики оцінки тональності новин 12 1.2 Огляд та критичний аналіз існуючих інформаційних систем і аналогів 13 1.2.1 Глобальна система моніторингу YouScan 14 1.2.2 Сервіс медіа-моніторингу Semantrum 14 1.2.3 Бібліотеки та скрипти з відкритим кодом (Open Source) 15 1.3 Обґрунтування архітектурних та технологічних рішень 17 1.3.1 Мова програмування та бекенд-інфраструктура 17 1.3.2 Архітектура графічного інтерфейсу (PC Dashboard) 18 1.3.3 Система керування базами даних (СКБД) 18 1.4 Математичне обґрунтування моделей аналізу тональності 18 1.5 Технічна постановка завдання на розробку системи 20 1.5.1 Функціональні вимоги 21 1.5.2 Нефункціональні вимоги 22 1.6 Висновок до першого розділу 22 РОЗДІЛ 2. ПРОЄКТНА ЧАСТИНА ТА ОБҐРУНТУВАННЯ МЕТОДІВ ДОСЛІДЖЕННЯ 24 2.1 Системний аналіз та проєктування архітектури системи 24 2.2 Концептуальне проєктування бази даних 26 2.3 Об'єктно-орієнтоване моделювання та UML-діаграми 30 2.4 Алгоритмічне забезпечення процесу аналізу тональності 32 2.5 Висновок до другого розділу 34 РОЗДІЛ 3. ПРОГРАМНА РЕАЛІЗАЦІЯ ТА ЕКСПЕРИМЕНТАЛЬНЕ ТЕСТУВАННЯ СИСТЕМИ 36 3.1 Вибір та обґрунтування інструментальних засобів розробки 36 3.2 Програмна реалізація підсистеми збору та обробки даних 37 3.3 Розробка аналітичного ядра класифікації тональності 38 3.4 Кешування даних та управління збереженням інформації у БД 40 3.5 Розробка інтерактивного інтерфейсу користувача (UI) 41 3.6 Експериментальне тестування програмного продукту 42 3.7 Висновок до третього розділу 49 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 50 4.1 Моделювання та прогнозування небезпечних ситуацій 50 4.2 Вимоги до виробничих приміщень для експлуатації ВДТ 52 ВИСНОВКИ 56 ПЕРЕЛІК ДЖЕРЕЛ 59 ДОДАТКИ
URI:	http://elartu.tntu.edu.ua/handle/lib/53077
Copyright owner:	© Семенів Віктор Сергійович, 2026
References (Ukraine):	1. Шимчук Г. В. Методи обробки та зберігання великих масивів текстових даних у розподілених системах / Г. В. Шимчук // Вісник Тернопільського національного технічного університету. – 2024. – № 1. – С. 45-52. [Електронний ресурс]. – URL: https://visnyk.tntu.edu.ua/ 2. Jurafsky D., Martin J. H. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. – 3rd ed. draft. – 2023. – 600 p. [Електронний ресурс]. – URL: https://web.stanford.edu/~jurafsky/slp3/ 3. Готович В. А. Крос-платформні рішення для моніторингу та агрегації інформаційного простору: навч. посіб. / В. А. Готович. – Тернопіль: ТНТУ, 2023. – 180 с. [Електронний ресурс]. – URL: http://elartu.tntu.edu.ua/ 4. McKinney W. Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter. – 3rd ed. – O'Reilly Media, 2022. – 541 p. [Електронний ресурс]. – URL: https://wesmckinney.com/book/ 5. Офіційний сайт системи YouScan [Електронний ресурс]. – URL: https://youscan.io/ 6. Офіційний сайт системи Semantrum [Електронний ресурс]. – URL: https://semantrum.net/ 7. Tunstall L., von Werra L., Wolf T. Natural Language Processing with Transformers: Building Language Applications with Hugging Face. – O'Reilly Media, 2022. – 408 p. [Електронний ресурс]. – URL: https://www.oreilly.com/library/view/natural-language-processing/ 8. VanderPlas J. Python Data Science Handbook: Essential Tools for Working with Data. – 2nd ed. – O'Reilly Media, 2022. – 590 p. [Електронний ресурс]. – URL: https://jakevdp.github.io/PythonDataScienceHandbook/ 9. Streamlit Framework Documentation [Електронний ресурс]. – URL: https://docs.streamlit.io/ 10.SQLite Official Documentation [Електронний ресурс]. – URL: https://www.sqlite.org/docs.html 11. Мельник, А., & Дмитроца, Л. (2026). Методи та архітектурні підходи до автоматизації тестування мобільних і вебзастосунків. Вимірювальна та обчислювальна техніка в технологічних процесах, (2), 74-81. 12. Percival H., Gregory B. Architecture Patterns with Python: Enabling Test-Driven Development, Domain-Driven Design, and Event-Driven Microservices. – O'Reilly Media, 2021. – 300 p. [Електронний ресурс]. – URL: https://www.cosmicpython.com/book/preface.html 13. Lane H., Howard C., Hapke H. Natural Language Processing in Action. – 2nd ed. – Manning Publications, 2022. – 475 p. [Електронний ресурс]. – URL: https://www.manning.com/books/natural-language-processing-in-action-second-edition 14. Іванов О. М. Проєктування та розробка локальних баз даних на основі SQLite: навч. посіб. / О. М. Іванов. – Харків: ХНУРЕ, 2022. – 210 с. 15. Шевченко В. В. Об'єктно-орієнтоване моделювання та UML у програмній інженерії: підручник / В. В. Шевченко. – Київ : КНУ, 2023. – 250 с. 16. Ланде Д. В. Інформаційний пошук та аналіз тексту: навч. посіб. / Д. В. Ланде. – Київ: КПІ, 2021. – 240 с. 17. Григорович В. Г. Сучасні технології програмування на Python у Data Science. – Київ : КПІ, 2022. – 215 с. 18. Кравченко О. М. Розробка інтерактивних веб-дашбордів за допомогою Python. – Львів : Вид-во Львівської політехніки, 2023. – 190 с. 19. Мельник А. А. Обробка природної мови (NLP): методи та алгоритми : навч. посіб. – Тернопіль : ТНТУ, 2021. – 205 с. 20. Коваленко І. В. Тестування програмного забезпечення: теорія і практика (Black-box та White-box). – Одеса : ОНПУ, 2022. – 240 с. 21. Mitchell R. Web Scraping with Python: Collecting More Data from the 23 22. Modern Web. – 3rd ed. – O'Reilly Media, 2023. – 320 p. 22. Modern Web. – 3rd ed. – O'Reilly Media, 2023. – 320 p. 23. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. – 3rd ed. – O'Reilly Media, 2022. – 856 p. 24. Бойко В. С. Аналіз даних та машинне навчання в сучасних інформаційних системах. – Київ : КНУ, 2021. – 275 с. 25. Сидоренко О. П. Інженерія програмного забезпечення та мікросервісна архітектура. – Харків : ХНУРЕ, 2023. – 310 с. 26. Мартин Р. Чиста архітектура: мистецтво розробки програмного забезпечення (укр. видання). – Харків : Фабула, 2021. – 368 с. 27. Melnyk, A., Dmytrotsa, L., Palka, O., Vasylenko, Y., & Klymuk, N. (2025). Dynamic test case prioritisation for mobile applications based on real user behaviour data. Proceedings of the CITI 2025: The 3rd International Workshop on Computer Information Technologies in Industry 4.0 (Ternopil, Ukraine, June 11-12, 2025). CEUR Workshop Proceedings (CEURWS.org). 2025. Vol-4057, pp. 179-188. URL: https://ceur-ws.org/Vol-4057/paper12.pdf. 28. Геврик Є. О. Охорона праці та безпека життєдіяльності : навч. посіб. / Є. О. Геврик. – Київ : Знання, 2021. – 287 с. 29. Запорожець О. І. Безпека життєдіяльності та цивільний захист : підручник / О. І. Запорожець, В. М. Приймак. – Київ : Центр учбової літератури, 2022. – 354 с. 30. Ткачук В. А. Основи охорони праці в ІТ-сфері : навч. посіб. / В. А. Ткачук. – Львів : Видавництво Львівської політехніки, 2023. – 210 с. 31. Голінько В. І. Охорона праці та промислова безпека : підручник / В. І. Голінько. – Дніпро : НТУ «ДП», 2021. – 315 с. 32. Пістун І. П. Практикум з охорони праці та безпеки життєдіяльності : навч. посіб. / І. П. Пістун. – Суми : Університетська книга, 2022. – 412 с. 33. Національна безпека України в умовах сучасних викликів : монографія / за заг. ред. О. В. Данильяна. – Харків : Право, 2023. – 288 с. Богдановський І. В. Інформаційна безпека держави : підручник / І. В. Богдановський. – Київ : Видавничий дім «Кондор», 2024. – 320 с. 34. Кодекс цивільного захисту України : Закон України від 02.10.2012 № 5403-VI (редакція від 01.01.2024) [Електронний ресурс]. – URL: https://zakon.rada.gov.ua/laws/show/5403-17 35. Закон України «Про охорону праці» від 14.10.1992 № 2694-XII (редакція від 27.10.2023) [Електронний ресурс]. – URL: https://zakon.rada.gov.ua/laws/show/2694-1
Content type:	Bachelor Thesis
�蝷箔����:	122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

��辣銝剔�﹝獢�:

獢�獢�	��膩	憭批��	�撘�
2026_KRB_SN-42_Semeniv_VS.pdf	Дипломна робота	1,82 MB	Adobe PDF	璉�閫�/撘��

�蝷箸�辣摰蝥芸��

�DSpace銝剜�����★��������雿��.

蝞∠�極�