Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/35428
Назва: Комп’ютеризована система тематичної рубрикації документів
Інші назви: Computer-aided system of documents topical classification
Автори: Григораш, Вадим Святославович
Hryhorash, Vadym
Приналежність: Тернопільський національний технічний університет імені Івана Пулюя
Бібліографічний опис: Григораш В. С. Комп’ютеризована система тематичної рубрикації документів : кваліфікаційна робота бакалавра за спеціальністю „123 — Комп’ютерна інженерія“ / Григораш Вадим Святославович.— Тернопіль : ТНТУ, 2021 – 72 с.
Bibliographic description: Hryhorash V. Computer-aided system of documents topical classification: Bachelor thesis „123 — Computer Engineering“ / Hryhorash Vadym - Ternopil, TNTU, 2021 - 72p.
Дата публікації: чер-2021
Дата подання: чер-2021
Дата внесення: 23-чер-2021
Видавництво: Тернопільський національний технічний університет імені Івана Пулюя
Країна (код): UA
Місце видання, проведення: Тернопільський національний технічний університет імені Івана Пулюя
Науковий керівник: Луцків, Андрій Мирославович
Lutskiv, Andriy
Члени комітету: Млинко, Богдана Богданівна
Mlynko, Bogdana
УДК: 004.89
Теми: система
текст
тема
документ
класифікація
рубрикація
system
text
topic
document
classification
rubricating
Кількість сторінок: 72
Короткий огляд (реферат): У кваліфікаційній роботі спроектовано та реалізовано програмний прототип комп’ютеризованої системи тематичної рубрикації текстових документів. До складу системи входять сховище документів та компонент, що відповідає з рубрикацію документів на основі аналізу їх вмісту. Компонент рубрикації документів складається з наступних модулів: модуль попереднього опрацювання тексту; модуль виявлення ознак тексту; модуль класифікації документів. В якості методів для виявлення ознак тексту у документі запропоновано використати різновиди статистичних ознак алгоритму TF-IDF, а також семантична векторизації.
In the qualification work the program prototype of the computerized system of thematic rubrication of text documents is designed and realized. The system includes a document repository and a component that corresponds to the rubrication of documents based on the analysis of their content. The component of rubrication of documents consists of the following modules: the module of preliminary processing of the text; text feature detection module; document classification module. As methods for detecting the features of the text in the document, it is proposed to use a variety of statistical features of the TF-IDF algorithm, as well as semantic vectorization.
Зміст: Вступ. 1. Аналіз технічного завдання і сфери застосування комп’ютеризованої системи тема- тичної рубрикації документів 2. Проектування структури і компонентів комп’ютеризованої системи тематичної рубрикації документів. 3. Програмна реалізація комп’ютеризованої системи тематичної рубрикації документів. 4. Безпека життєдіяльності, основи охорони праці. Висновки
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/35428
Власник авторського права: © Григораш Вадим Святославович, 2021
Перелік літератури: 1. Барсегян А., Куприянов М. , Степаненко В. , Холод И. Технологии анализа данных. СПб. : Изд-во " БХВ-Петербург". 2008. 384 c. 2. . Барсегян А. А, Куприянов М. С., Холод И. И., Тесс М. Д., Елизаров С. И. Анализ данных и процессов: учеб. пособие . 3-е изд., перераб. и доп. Санкт-Петербург : БХВ-Петербург, 2009. 512 с. 3. Yang Y. A re-examination of text categorization methods. Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 1999. P. 42-49. 4. Вагин В. Н., Головина Е. Ю., Загорянская А. А.,. Фомина М. В., Вагин В. Н. Достоверный и правдоподобный вывод в интеллектуальных системах. Москва : Физматлит, 2004. 704 с. 5. Барсегян А. А. Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. Санкт-Петербург : БХВ-Петербург, 2007. 384 с. 6. CJC Burges. A Tutorial on Support Vector Machines for Pattern Recognition URL : http://www.music.mcgill.ca/rfergu/adamTex/references/ Burges98.pdf (дата звернення 17.04.2021 р.). 7. Yang Y. A re-examination of text categorization methods. Proc. SIGIR’2012, 22nd ACM International Conference on Research and Development in Information Retrieval, 2012. P. 42-49. 8. Sebastiani F. Machine learning in automated text categorization / F. Sebastiani. ACM Comput. Surv. March 2010. Vol. 34, No. 1. P. 1-47. 9. Yang Y., Liu X. A re-examination of text categorization methods . Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 2007. P. 42-49. 10. Bing L. Sentiment Analysis and Opinion Mining. New Jersey - Morgan & Claypool Publishers, 2012. 167 p. 11. Khurshid A. Affective Computing and Sentiment Analysis: Metaphor, Ontology, Affect and Terminology. Berlin. Springer Science & Business Media, 2011.164 p. 12. .Narayanan, V. Fast and accurate sentiment classification using an enhanced naive bayes model. [Text] / V. Narayanan, I. Arora, A. Bhatia // Intelligent Data Engineering and Automated Learning IDEAL / V. Narayanan, I. Arora, A. Bhatia. – Berlin: Springer, 2013. – (volume 8206 of Lecture Notes in Computer Science). – pp. 194–201. 13. Patel D., Saxena S., Verma T. Sentiment Analysis using Maximum Entropy Algorithm in Big Data. International Journal of Innovative Research in Science, Engineering and Technology. 2016. pp. 8355–8361. 14. Руководство по работе с HTTP в Python. Библиотека requests. URL: https://khashtamov.com/ru/ (дата звернення 29.04.2021 р.). 15. Named-entity Recognition. URL: https://en.wikipedia.org/wiki/Named-entity_recognition (дата звернення 21.04.2021 р.). 16. Фанифатьева А. Д. Автоматический анализ тональности рецензий с использованием библиотеки tensorflow. URL: http://library.eltech.ru/ files/vkr/2017/bakalavri/ (дата звернення 15.05.2021 р.). 17. Convolutional Neural Networks (CNNs / ConvNets). URL: http://cs231n.github.io/neural-networks-1/ (дата звернення 18.05.2021 р.). 18. ДСанПіН 3.3-2.007-98 «Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин». 19. НПАОП 0.00-1.28-10 «Правила охорони праці під час експлуатації електронно-обчислювальних машин». 20. НАПБ А.01.001-2004 «Правила пожежної безпеки в Україні». 21. Стеблюк М.І. Цивільна оборона та цивільний захист: Підручник. — 2-ге вид., переробл. — К.: Знання, 2010. — 487 с. 22. Тарасова, В.В. Екологічна статистика. [Текст] / В.В.Тарасова. – Київ: «Центр учбової літератури», 2008. – 391с.
Тип вмісту: Bachelor Thesis
Розташовується у зібраннях:123 — Комп’ютерна інженерія (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
Hrygorash.pdf3,55 MBAdobe PDFПереглянути/відкрити
Авторська_довідка_Григораш_В.doc44,5 kBMicrosoft WordПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора