Palun kasuta seda identifikaatorit viitamiseks ja linkimiseks: http://elartu.tntu.edu.ua/handle/lib/35428
Pealkiri: Комп’ютеризована система тематичної рубрикації документів
Teised pealkirjad: Computer-aided system of documents topical classification
Autor: Григораш, Вадим Святославович
Hryhorash, Vadym
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя
Bibliographic description (Ukraine): Григораш В. С. Комп’ютеризована система тематичної рубрикації документів : кваліфікаційна робота бакалавра за спеціальністю „123 — Комп’ютерна інженерія“ / Григораш Вадим Святославович.— Тернопіль : ТНТУ, 2021 – 72 с.
Bibliographic description (International): Hryhorash V. Computer-aided system of documents topical classification: Bachelor thesis „123 — Computer Engineering“ / Hryhorash Vadym - Ternopil, TNTU, 2021 - 72p.
Ilmumisaasta: juu-2021
Submitted date: juu-2021
Date of entry: 23-juu-2021
Kirjastaja: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: Тернопільський національний технічний університет імені Івана Пулюя
Supervisor: Луцків, Андрій Мирославович
Lutskiv, Andriy
Committee members: Млинко, Богдана Богданівна
Mlynko, Bogdana
UDC: 004.89
Märksõnad: система
текст
тема
документ
класифікація
рубрикація
system
text
topic
document
classification
rubricating
Number of pages: 72
Kokkuvõte: У кваліфікаційній роботі спроектовано та реалізовано програмний прототип комп’ютеризованої системи тематичної рубрикації текстових документів. До складу системи входять сховище документів та компонент, що відповідає з рубрикацію документів на основі аналізу їх вмісту. Компонент рубрикації документів складається з наступних модулів: модуль попереднього опрацювання тексту; модуль виявлення ознак тексту; модуль класифікації документів. В якості методів для виявлення ознак тексту у документі запропоновано використати різновиди статистичних ознак алгоритму TF-IDF, а також семантична векторизації.
In the qualification work the program prototype of the computerized system of thematic rubrication of text documents is designed and realized. The system includes a document repository and a component that corresponds to the rubrication of documents based on the analysis of their content. The component of rubrication of documents consists of the following modules: the module of preliminary processing of the text; text feature detection module; document classification module. As methods for detecting the features of the text in the document, it is proposed to use a variety of statistical features of the TF-IDF algorithm, as well as semantic vectorization.
Content: Вступ. 1. Аналіз технічного завдання і сфери застосування комп’ютеризованої системи тема- тичної рубрикації документів 2. Проектування структури і компонентів комп’ютеризованої системи тематичної рубрикації документів. 3. Програмна реалізація комп’ютеризованої системи тематичної рубрикації документів. 4. Безпека життєдіяльності, основи охорони праці. Висновки
URI: http://elartu.tntu.edu.ua/handle/lib/35428
Copyright owner: © Григораш Вадим Святославович, 2021
References (Ukraine): 1. Барсегян А., Куприянов М. , Степаненко В. , Холод И. Технологии анализа данных. СПб. : Изд-во " БХВ-Петербург". 2008. 384 c. 2. . Барсегян А. А, Куприянов М. С., Холод И. И., Тесс М. Д., Елизаров С. И. Анализ данных и процессов: учеб. пособие . 3-е изд., перераб. и доп. Санкт-Петербург : БХВ-Петербург, 2009. 512 с. 3. Yang Y. A re-examination of text categorization methods. Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 1999. P. 42-49. 4. Вагин В. Н., Головина Е. Ю., Загорянская А. А.,. Фомина М. В., Вагин В. Н. Достоверный и правдоподобный вывод в интеллектуальных системах. Москва : Физматлит, 2004. 704 с. 5. Барсегян А. А. Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. Санкт-Петербург : БХВ-Петербург, 2007. 384 с. 6. CJC Burges. A Tutorial on Support Vector Machines for Pattern Recognition URL : http://www.music.mcgill.ca/rfergu/adamTex/references/ Burges98.pdf (дата звернення 17.04.2021 р.). 7. Yang Y. A re-examination of text categorization methods. Proc. SIGIR’2012, 22nd ACM International Conference on Research and Development in Information Retrieval, 2012. P. 42-49. 8. Sebastiani F. Machine learning in automated text categorization / F. Sebastiani. ACM Comput. Surv. March 2010. Vol. 34, No. 1. P. 1-47. 9. Yang Y., Liu X. A re-examination of text categorization methods . Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 2007. P. 42-49. 10. Bing L. Sentiment Analysis and Opinion Mining. New Jersey - Morgan & Claypool Publishers, 2012. 167 p. 11. Khurshid A. Affective Computing and Sentiment Analysis: Metaphor, Ontology, Affect and Terminology. Berlin. Springer Science & Business Media, 2011.164 p. 12. .Narayanan, V. Fast and accurate sentiment classification using an enhanced naive bayes model. [Text] / V. Narayanan, I. Arora, A. Bhatia // Intelligent Data Engineering and Automated Learning IDEAL / V. Narayanan, I. Arora, A. Bhatia. – Berlin: Springer, 2013. – (volume 8206 of Lecture Notes in Computer Science). – pp. 194–201. 13. Patel D., Saxena S., Verma T. Sentiment Analysis using Maximum Entropy Algorithm in Big Data. International Journal of Innovative Research in Science, Engineering and Technology. 2016. pp. 8355–8361. 14. Руководство по работе с HTTP в Python. Библиотека requests. URL: https://khashtamov.com/ru/ (дата звернення 29.04.2021 р.). 15. Named-entity Recognition. URL: https://en.wikipedia.org/wiki/Named-entity_recognition (дата звернення 21.04.2021 р.). 16. Фанифатьева А. Д. Автоматический анализ тональности рецензий с использованием библиотеки tensorflow. URL: http://library.eltech.ru/ files/vkr/2017/bakalavri/ (дата звернення 15.05.2021 р.). 17. Convolutional Neural Networks (CNNs / ConvNets). URL: http://cs231n.github.io/neural-networks-1/ (дата звернення 18.05.2021 р.). 18. ДСанПіН 3.3-2.007-98 «Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин». 19. НПАОП 0.00-1.28-10 «Правила охорони праці під час експлуатації електронно-обчислювальних машин». 20. НАПБ А.01.001-2004 «Правила пожежної безпеки в Україні». 21. Стеблюк М.І. Цивільна оборона та цивільний захист: Підручник. — 2-ге вид., переробл. — К.: Знання, 2010. — 487 с. 22. Тарасова, В.В. Екологічна статистика. [Текст] / В.В.Тарасова. – Київ: «Центр учбової літератури», 2008. – 391с.
Content type: Bachelor Thesis
Asub kollektsiooni(de)s:123 — Комп’ютерна інженерія (бакалаври)

Failid selles objektis:
Fail Kirjeldus SuurusFormaat 
Hrygorash.pdf3,55 MBAdobe PDFVaata/Ava
Авторська_довідка_Григораш_В.doc44,5 kBMicrosoft WordVaata/Ava


Kõik teosed on Dspaces autoriõiguste kaitse all.

Admin vahendid