Empreu aquest identificador per citar o enllaçar aquest ítem: http://elartu.tntu.edu.ua/handle/lib/53077
Registre complet de metadades
Camp DCValorLengua/Idioma
dc.contributor.advisorДмитроца, Леся Павлівна-
dc.contributor.advisorDmytrotsa, Lesia-
dc.contributor.authorСеменів, Віктор Сергійович-
dc.contributor.authorSemeniv, Viktor-
dc.date.accessioned2026-07-01T12:17:32Z-
dc.date.available2026-07-01T12:17:32Z-
dc.date.issued2026-06-25-
dc.date.submitted2026-06-11-
dc.identifier.urihttp://elartu.tntu.edu.ua/handle/lib/53077-
dc.descriptionРоботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 25.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюяuk_UA
dc.description.abstractКваліфікаційна робота присвячена дослідженню процесів автоматизованого збору, обробки та семантичного аналізу масивів неструктурованої текстової інформації з інтернет-ресурсів для оцінки емоційного забарвлення україномовних текстів. В першому розділі кваліфікаційної роботи описано актуальність автоматизованого моніторингу медіа-простору в умовах поширення дезінформації та інформаційно-психологічних операцій. Висвітлено математичний апарат імовірнісної класифікації тексту за допомогою мультиноміального наївного байєсівського класифікатора із застосуванням згладжування Лапласа. Розглянуто функціональні можливості та обмеження існуючих глобальних комерційних систем-аналогів (YouScan, Semantrum). Проаналізовано та обґрунтовано вибір оптимального технологічного стеку розробки на базі мови Python, бібліотек NLP, фреймворку Streamlit та СКБД SQLite. В другому розділі кваліфікаційної роботи обґрунтовано використання модульного патерну розробки з чітким розподілом зон відповідальності компонентів. Досліджено логічні та інформаційні потоки обробки даних і сформовано послідовний конвеєр попередньої лінгвістичної підготовки, що включає токенізацію, семантичну фільтрацію стоп-слів та морфологічну лематизацію флективних україномовних текстів. Подано логічну структуру реляційної бази даних SQLite, нормалізованої до третьої нормальної форми (3NF) та оптимізованої за допомогою B-Tree індексації часових полів для миттєвої вибірки історичних масивів. В третьому розділі кваліфікаційної роботи описано створення стабільних програмних модулів автоматизованого збору інформації (Data Harvester), аналітичного ядра класифікації тональності та декларативного рендерингу елементів інтерфейсу. Проаналізовано інженерні рішення безпечної взаємодії з СКБД через параметризовані SQL-запити для захисту від ін'єкцій та впровадження механізмів кешування оперативної пам'яті. Проведено комплексне експериментальне тестування створеного програмного продукту за методом «чорної скриньки», яке підтвердило його стовідсоткову відмовостійкість при мережевих затримках та зафіксувало високу швидкодію обробки великих масивів інформації. Об’єкт дослідження: процес автоматизованого збору, обробки та семантичного аналізу масивів неструктурованої текстової інформації з інтернет-ресурсів. Предмет дослідження: математичні моделі, алгоритми машинного навчання та програмні засоби визначення емоційного забарвлення (тональності) україномовних текстів.uk_UA
dc.description.abstractThe qualification work is dedicated to the automated collection, processing, and semantic analysis of unstructured text information arrays from internet resources. The goal of the work is to improve the quality of automated media space monitoring services by developing a local software system (PC Dashboard) for collecting news feeds and classifying their sentiment. The first section of the qualification paper considers the modern information space problems, reviews existing commercial analogues like YouScan and Semantrum, highlights the mathematical apparatus of the Multinomial Naive Bayes classifier, and justifies the choice of the Python-based technological stack. The second section considers the modular architecture design with a clear separation of concerns, the development of an NLP pipeline for Ukrainian text preprocessing (tokenization, stop-words filtration, lemmatization), and the conceptual design of a 3NF relational SQLite database optimized with B-Tree indexes. The third section describes the programmatic implementation of the Data Harvester module, the sentiment analysis core, the Streamlit and Plotly-based UI dashboard, and the results of black-box experimental testing that confirmed high system performance and fault tolerance. Object of research: the process of automated collection, processing, and semantic analysis of unstructured text information arrays from internet resources. Subject of research: mathematical models, machine learning algorithms, and software tools for determining the emotional coloring (sentiment) of Ukrainian texts.uk_UA
dc.description.tableofcontentsВСТУП 10 РОЗДІЛ 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ ТА ПОСТАНОВКА ЗАВДАННЯ 12 1.1 Аналіз інформаційного простору та проблематики оцінки тональності новин 12 1.2 Огляд та критичний аналіз існуючих інформаційних систем і аналогів 13 1.2.1 Глобальна система моніторингу YouScan 14 1.2.2 Сервіс медіа-моніторингу Semantrum 14 1.2.3 Бібліотеки та скрипти з відкритим кодом (Open Source) 15 1.3 Обґрунтування архітектурних та технологічних рішень 17 1.3.1 Мова програмування та бекенд-інфраструктура 17 1.3.2 Архітектура графічного інтерфейсу (PC Dashboard) 18 1.3.3 Система керування базами даних (СКБД) 18 1.4 Математичне обґрунтування моделей аналізу тональності 18 1.5 Технічна постановка завдання на розробку системи 20 1.5.1 Функціональні вимоги 21 1.5.2 Нефункціональні вимоги 22 1.6 Висновок до першого розділу 22 РОЗДІЛ 2. ПРОЄКТНА ЧАСТИНА ТА ОБҐРУНТУВАННЯ МЕТОДІВ ДОСЛІДЖЕННЯ 24 2.1 Системний аналіз та проєктування архітектури системи 24 2.2 Концептуальне проєктування бази даних 26 2.3 Об'єктно-орієнтоване моделювання та UML-діаграми 30 2.4 Алгоритмічне забезпечення процесу аналізу тональності 32 2.5 Висновок до другого розділу 34 РОЗДІЛ 3. ПРОГРАМНА РЕАЛІЗАЦІЯ ТА ЕКСПЕРИМЕНТАЛЬНЕ ТЕСТУВАННЯ СИСТЕМИ 36 3.1 Вибір та обґрунтування інструментальних засобів розробки 36 3.2 Програмна реалізація підсистеми збору та обробки даних 37 3.3 Розробка аналітичного ядра класифікації тональності 38 3.4 Кешування даних та управління збереженням інформації у БД 40 3.5 Розробка інтерактивного інтерфейсу користувача (UI) 41 3.6 Експериментальне тестування програмного продукту 42 3.7 Висновок до третього розділу 49 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 50 4.1 Моделювання та прогнозування небезпечних ситуацій 50 4.2 Вимоги до виробничих приміщень для експлуатації ВДТ 52 ВИСНОВКИ 56 ПЕРЕЛІК ДЖЕРЕЛ 59 ДОДАТКИuk_UA
dc.format.extent65-
dc.language.isoukuk_UA
dc.publisherТернопільський національний технічний університет імені ім. І. Пулюяuk_UA
dc.subject122uk_UA
dc.subjectкомп’ютерні наукиuk_UA
dc.subjectаналіз тональностіuk_UA
dc.subjectмоніторинг медіа-просторуuk_UA
dc.subjectнаївний байєсівський класифікаторuk_UA
dc.subjectобробка природної мовиuk_UA
dc.subjectінформаційний фонuk_UA
dc.subjectвеб-дашбордuk_UA
dc.subjectлематизаціяuk_UA
dc.subjectбаза данихuk_UA
dc.subjectsentiment analysisuk_UA
dc.subjectmedia space monitoringuk_UA
dc.subjectnaive bayes classifieruk_UA
dc.subjectnatural language processinguk_UA
dc.subjectinformation backgrounduk_UA
dc.subjectweb dashboarduk_UA
dc.subjectlemmatizationuk_UA
dc.subjectsqlite sqlite databaseuk_UA
dc.titleСистема моніторингу та аналізу тональності стрічок новин для оцінки інформаційного фонуuk_UA
dc.title.alternativeNews Feed Sentiment Monitoring and Analysis System for Information Environment Assessmentuk_UA
dc.typeBachelor Thesisuk_UA
dc.rights.holder© Семенів Віктор Сергійович, 2026uk_UA
dc.coverage.placenameТернопільuk_UA
dc.subject.udc004.912:004.89uk_UA
dc.relation.references1. Шимчук Г. В. Методи обробки та зберігання великих масивів текстових даних у розподілених системах / Г. В. Шимчук // Вісник Тернопільського національного технічного університету. – 2024. – № 1. – С. 45-52. [Електронний ресурс]. – URL: https://visnyk.tntu.edu.ua/uk_UA
dc.relation.references2. Jurafsky D., Martin J. H. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. – 3rd ed. draft. – 2023. – 600 p. [Електронний ресурс]. – URL: https://web.stanford.edu/~jurafsky/slp3/uk_UA
dc.relation.references3. Готович В. А. Крос-платформні рішення для моніторингу та агрегації інформаційного простору: навч. посіб. / В. А. Готович. – Тернопіль: ТНТУ, 2023. – 180 с. [Електронний ресурс]. – URL: http://elartu.tntu.edu.ua/uk_UA
dc.relation.references4. McKinney W. Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter. – 3rd ed. – O'Reilly Media, 2022. – 541 p. [Електронний ресурс]. – URL: https://wesmckinney.com/book/uk_UA
dc.relation.references5. Офіційний сайт системи YouScan [Електронний ресурс]. – URL: https://youscan.io/uk_UA
dc.relation.references6. Офіційний сайт системи Semantrum [Електронний ресурс]. – URL: https://semantrum.net/uk_UA
dc.relation.references7. Tunstall L., von Werra L., Wolf T. Natural Language Processing with Transformers: Building Language Applications with Hugging Face. – O'Reilly Media, 2022. – 408 p. [Електронний ресурс]. – URL: https://www.oreilly.com/library/view/natural-language-processing/uk_UA
dc.relation.references8. VanderPlas J. Python Data Science Handbook: Essential Tools for Working with Data. – 2nd ed. – O'Reilly Media, 2022. – 590 p. [Електронний ресурс]. – URL: https://jakevdp.github.io/PythonDataScienceHandbook/uk_UA
dc.relation.references9. Streamlit Framework Documentation [Електронний ресурс]. – URL: https://docs.streamlit.io/uk_UA
dc.relation.references10.SQLite Official Documentation [Електронний ресурс]. – URL: https://www.sqlite.org/docs.htmluk_UA
dc.relation.references11. Мельник, А., & Дмитроца, Л. (2026). Методи та архітектурні підходи до автоматизації тестування мобільних і вебзастосунків. Вимірювальна та обчислювальна техніка в технологічних процесах, (2), 74-81.uk_UA
dc.relation.references12. Percival H., Gregory B. Architecture Patterns with Python: Enabling Test-Driven Development, Domain-Driven Design, and Event-Driven Microservices. – O'Reilly Media, 2021. – 300 p. [Електронний ресурс]. – URL: https://www.cosmicpython.com/book/preface.htmluk_UA
dc.relation.references13. Lane H., Howard C., Hapke H. Natural Language Processing in Action. – 2nd ed. – Manning Publications, 2022. – 475 p. [Електронний ресурс]. – URL: https://www.manning.com/books/natural-language-processing-in-action-second-editionuk_UA
dc.relation.references14. Іванов О. М. Проєктування та розробка локальних баз даних на основі SQLite: навч. посіб. / О. М. Іванов. – Харків: ХНУРЕ, 2022. – 210 с.uk_UA
dc.relation.references15. Шевченко В. В. Об'єктно-орієнтоване моделювання та UML у програмній інженерії: підручник / В. В. Шевченко. – Київ : КНУ, 2023. – 250 с.uk_UA
dc.relation.references16. Ланде Д. В. Інформаційний пошук та аналіз тексту: навч. посіб. / Д. В. Ланде. – Київ: КПІ, 2021. – 240 с.uk_UA
dc.relation.references17. Григорович В. Г. Сучасні технології програмування на Python у Data Science. – Київ : КПІ, 2022. – 215 с.uk_UA
dc.relation.references18. Кравченко О. М. Розробка інтерактивних веб-дашбордів за допомогою Python. – Львів : Вид-во Львівської політехніки, 2023. – 190 с.uk_UA
dc.relation.references19. Мельник А. А. Обробка природної мови (NLP): методи та алгоритми : навч. посіб. – Тернопіль : ТНТУ, 2021. – 205 с.uk_UA
dc.relation.references20. Коваленко І. В. Тестування програмного забезпечення: теорія і практика (Black-box та White-box). – Одеса : ОНПУ, 2022. – 240 с.uk_UA
dc.relation.references21. Mitchell R. Web Scraping with Python: Collecting More Data from the 23 22. Modern Web. – 3rd ed. – O'Reilly Media, 2023. – 320 p.uk_UA
dc.relation.references22. Modern Web. – 3rd ed. – O'Reilly Media, 2023. – 320 p.uk_UA
dc.relation.references23. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. – 3rd ed. – O'Reilly Media, 2022. – 856 p.uk_UA
dc.relation.references24. Бойко В. С. Аналіз даних та машинне навчання в сучасних інформаційних системах. – Київ : КНУ, 2021. – 275 с.uk_UA
dc.relation.references25. Сидоренко О. П. Інженерія програмного забезпечення та мікросервісна архітектура. – Харків : ХНУРЕ, 2023. – 310 с.uk_UA
dc.relation.references26. Мартин Р. Чиста архітектура: мистецтво розробки програмного забезпечення (укр. видання). – Харків : Фабула, 2021. – 368 с.uk_UA
dc.relation.references27. Melnyk, A., Dmytrotsa, L., Palka, O., Vasylenko, Y., & Klymuk, N. (2025). Dynamic test case prioritisation for mobile applications based on real user behaviour data. Proceedings of the CITI 2025: The 3rd International Workshop on Computer Information Technologies in Industry 4.0 (Ternopil, Ukraine, June 11-12, 2025). CEUR Workshop Proceedings (CEURWS.org). 2025. Vol-4057, pp. 179-188. URL: https://ceur-ws.org/Vol-4057/paper12.pdf.uk_UA
dc.relation.references28. Геврик Є. О. Охорона праці та безпека життєдіяльності : навч. посіб. / Є. О. Геврик. – Київ : Знання, 2021. – 287 с.uk_UA
dc.relation.references29. Запорожець О. І. Безпека життєдіяльності та цивільний захист : підручник / О. І. Запорожець, В. М. Приймак. – Київ : Центр учбової літератури, 2022. – 354 с.uk_UA
dc.relation.references30. Ткачук В. А. Основи охорони праці в ІТ-сфері : навч. посіб. / В. А. Ткачук. – Львів : Видавництво Львівської політехніки, 2023. – 210 с.uk_UA
dc.relation.references31. Голінько В. І. Охорона праці та промислова безпека : підручник / В. І. Голінько. – Дніпро : НТУ «ДП», 2021. – 315 с.uk_UA
dc.relation.references32. Пістун І. П. Практикум з охорони праці та безпеки життєдіяльності : навч. посіб. / І. П. Пістун. – Суми : Університетська книга, 2022. – 412 с.uk_UA
dc.relation.references33. Національна безпека України в умовах сучасних викликів : монографія / за заг. ред. О. В. Данильяна. – Харків : Право, 2023. – 288 с.uk_UA
dc.relation.referencesБогдановський І. В. Інформаційна безпека держави : підручник / І. В. Богдановський. – Київ : Видавничий дім «Кондор», 2024. – 320 с.uk_UA
dc.relation.references34. Кодекс цивільного захисту України : Закон України від 02.10.2012 № 5403-VI (редакція від 01.01.2024) [Електронний ресурс]. – URL: https://zakon.rada.gov.ua/laws/show/5403-17uk_UA
dc.relation.references35. Закон України «Про охорону праці» від 14.10.1992 № 2694-XII (редакція від 27.10.2023) [Електронний ресурс]. – URL: https://zakon.rada.gov.ua/laws/show/2694-1uk_UA
dc.contributor.affiliationТернопільський національний технічний університет імені ім. І. Пулюяuk_UA
dc.coverage.countryUAuk_UA
dc.identifier.citation2015Семенів В. С. Система моніторингу та аналізу тональності стрічок новин для оцінки інформаційного фону : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Дмитроца. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 65 с.uk_UA
Apareix a les col·leccions:122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
2026_KRB_SN-42_Semeniv_VS.pdfДипломна робота1,82 MBAdobe PDFVeure/Obrir


Els ítems de DSpace es troben protegits per copyright, amb tots els drets reservats, sempre i quan no s’indiqui el contrari.

Eines d'Administrador