Palun kasuta seda identifikaatorit viitamiseks ja linkimiseks:
http://elartu.tntu.edu.ua/handle/lib/35428
Pealkiri: | Комп’ютеризована система тематичної рубрикації документів |
Teised pealkirjad: | Computer-aided system of documents topical classification |
Autor: | Григораш, Вадим Святославович Hryhorash, Vadym |
Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя |
Bibliographic description (Ukraine): | Григораш В. С. Комп’ютеризована система тематичної рубрикації документів : кваліфікаційна робота бакалавра за спеціальністю „123 — Комп’ютерна інженерія“ / Григораш Вадим Святославович.— Тернопіль : ТНТУ, 2021 – 72 с. |
Bibliographic description (International): | Hryhorash V. Computer-aided system of documents topical classification: Bachelor thesis „123 — Computer Engineering“ / Hryhorash Vadym - Ternopil, TNTU, 2021 - 72p. |
Ilmumisaasta: | juu-2021 |
Submitted date: | juu-2021 |
Date of entry: | 23-juu-2021 |
Kirjastaja: | Тернопільський національний технічний університет імені Івана Пулюя |
Country (code): | UA |
Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя |
Supervisor: | Луцків, Андрій Мирославович Lutskiv, Andriy |
Committee members: | Млинко, Богдана Богданівна Mlynko, Bogdana |
UDC: | 004.89 |
Märksõnad: | система текст тема документ класифікація рубрикація system text topic document classification rubricating |
Number of pages: | 72 |
Kokkuvõte: | У кваліфікаційній роботі спроектовано та реалізовано програмний прототип комп’ютеризованої системи тематичної рубрикації текстових документів.
До складу системи входять сховище документів та компонент, що відповідає з рубрикацію документів на основі аналізу їх вмісту.
Компонент рубрикації документів складається з наступних модулів: модуль попереднього опрацювання тексту; модуль виявлення ознак тексту; модуль класифікації документів.
В якості методів для виявлення ознак тексту у документі запропоновано використати різновиди статистичних ознак алгоритму TF-IDF, а також семантична векторизації. In the qualification work the program prototype of the computerized system of thematic rubrication of text documents is designed and realized. The system includes a document repository and a component that corresponds to the rubrication of documents based on the analysis of their content. The component of rubrication of documents consists of the following modules: the module of preliminary processing of the text; text feature detection module; document classification module. As methods for detecting the features of the text in the document, it is proposed to use a variety of statistical features of the TF-IDF algorithm, as well as semantic vectorization. |
Content: | Вступ. 1. Аналіз технічного завдання і сфери застосування комп’ютеризованої системи тема- тичної рубрикації документів 2. Проектування структури і компонентів комп’ютеризованої системи тематичної рубрикації документів. 3. Програмна реалізація комп’ютеризованої системи тематичної рубрикації документів. 4. Безпека життєдіяльності, основи охорони праці. Висновки |
URI: | http://elartu.tntu.edu.ua/handle/lib/35428 |
Copyright owner: | © Григораш Вадим Святославович, 2021 |
References (Ukraine): | 1. Барсегян А., Куприянов М. , Степаненко В. , Холод И. Технологии анализа данных. СПб. : Изд-во " БХВ-Петербург". 2008. 384 c. 2. . Барсегян А. А, Куприянов М. С., Холод И. И., Тесс М. Д., Елизаров С. И. Анализ данных и процессов: учеб. пособие . 3-е изд., перераб. и доп. Санкт-Петербург : БХВ-Петербург, 2009. 512 с. 3. Yang Y. A re-examination of text categorization methods. Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 1999. P. 42-49. 4. Вагин В. Н., Головина Е. Ю., Загорянская А. А.,. Фомина М. В., Вагин В. Н. Достоверный и правдоподобный вывод в интеллектуальных системах. Москва : Физматлит, 2004. 704 с. 5. Барсегян А. А. Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. Санкт-Петербург : БХВ-Петербург, 2007. 384 с. 6. CJC Burges. A Tutorial on Support Vector Machines for Pattern Recognition URL : http://www.music.mcgill.ca/rfergu/adamTex/references/ Burges98.pdf (дата звернення 17.04.2021 р.). 7. Yang Y. A re-examination of text categorization methods. Proc. SIGIR’2012, 22nd ACM International Conference on Research and Development in Information Retrieval, 2012. P. 42-49. 8. Sebastiani F. Machine learning in automated text categorization / F. Sebastiani. ACM Comput. Surv. March 2010. Vol. 34, No. 1. P. 1-47. 9. Yang Y., Liu X. A re-examination of text categorization methods . Proc. of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 2007. P. 42-49. 10. Bing L. Sentiment Analysis and Opinion Mining. New Jersey - Morgan & Claypool Publishers, 2012. 167 p. 11. Khurshid A. Affective Computing and Sentiment Analysis: Metaphor, Ontology, Affect and Terminology. Berlin. Springer Science & Business Media, 2011.164 p. 12. .Narayanan, V. Fast and accurate sentiment classification using an enhanced naive bayes model. [Text] / V. Narayanan, I. Arora, A. Bhatia // Intelligent Data Engineering and Automated Learning IDEAL / V. Narayanan, I. Arora, A. Bhatia. – Berlin: Springer, 2013. – (volume 8206 of Lecture Notes in Computer Science). – pp. 194–201. 13. Patel D., Saxena S., Verma T. Sentiment Analysis using Maximum Entropy Algorithm in Big Data. International Journal of Innovative Research in Science, Engineering and Technology. 2016. pp. 8355–8361. 14. Руководство по работе с HTTP в Python. Библиотека requests. URL: https://khashtamov.com/ru/ (дата звернення 29.04.2021 р.). 15. Named-entity Recognition. URL: https://en.wikipedia.org/wiki/Named-entity_recognition (дата звернення 21.04.2021 р.). 16. Фанифатьева А. Д. Автоматический анализ тональности рецензий с использованием библиотеки tensorflow. URL: http://library.eltech.ru/ files/vkr/2017/bakalavri/ (дата звернення 15.05.2021 р.). 17. Convolutional Neural Networks (CNNs / ConvNets). URL: http://cs231n.github.io/neural-networks-1/ (дата звернення 18.05.2021 р.). 18. ДСанПіН 3.3-2.007-98 «Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин». 19. НПАОП 0.00-1.28-10 «Правила охорони праці під час експлуатації електронно-обчислювальних машин». 20. НАПБ А.01.001-2004 «Правила пожежної безпеки в Україні». 21. Стеблюк М.І. Цивільна оборона та цивільний захист: Підручник. — 2-ге вид., переробл. — К.: Знання, 2010. — 487 с. 22. Тарасова, В.В. Екологічна статистика. [Текст] / В.В.Тарасова. – Київ: «Центр учбової літератури», 2008. – 391с. |
Content type: | Bachelor Thesis |
Asub kollektsiooni(de)s: | 123 — Комп’ютерна інженерія (бакалаври) |
Failid selles objektis:
Fail | Kirjeldus | Suurus | Formaat | |
---|---|---|---|---|
Hrygorash.pdf | 3,55 MB | Adobe PDF | Vaata/Ava | |
Авторська_довідка_Григораш_В.doc | 44,5 kB | Microsoft Word | Vaata/Ava |
Kõik teosed on Dspaces autoriõiguste kaitse all.
Admin vahendid