Por favor, use este identificador para citar o enlazar este ítem:
http://elartu.tntu.edu.ua/handle/lib/26878
Título : | Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів |
Otros títulos : | Algorithms and software of languages construction of SAT-tools |
Autor : | Михалюк, Василь Андрійович |
Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Bibliographic description (Ukraine): | Михалюк В.А. Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів : автореферат дипломної роботи магістра за спеціальністю 123 – Комп’ютерна інженерія / В.А. Михалюк: Тернопільський національний технічний університет імені Івана Пулюя – Тернопіль: ТНТУ, 2018. – 10с. |
Bibliographic description (International): | Mykhaliuk V. Algorithms and software of languages construction of SAT-tools : abstract of master’s thesis on speciality 123 – Computer Engineering / V. Mykhaliuk; - Ternopil Ivan Puluj National Technical University – Ternopil: TNTU, 2018 – 10p |
Fecha de publicación : | 27-dic-2018 |
Submitted date: | 27-dic-2018 |
Date of entry: | 27-dic-2018 |
Country (code): | UA |
Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Supervisor: | Луцків, Андрій Мирославович |
Committee members: | Скоренький, Юрій Любомирович |
UDC: | 004.42 |
Palabras clave : | 123 комп’ютерна інженерія CAT-засоби корпус мови латентно-семантичний аналіз сингулярний розклад матриці TF-IDF матриця «терм-на-документ» |
Number of pages: | 10 |
Resumen : | В дипломній роботі магістра виконано дослідження алгоритмічного та програмного забезпечення побудови корпусів мов CAT-засобів. В роботі розглянуто метод латентно-семантичного аналізу для дослідження релевантних зв’язків термів і документів. Розглянуто сфери застосування, компанії світового рівня що вже розглядають цю технологію. Було описано створення матриці «терм-на-документ», застосування методу латентно-семантичного аналізу (LSA) для аналізу корпусу, що складається із повного набору статей англомовної Вікіпедії. Розглянуто використання Spark для попередньої обробки даних: читання, очищення та приведення в числову форму. Показано, як вираховується сингулярний розклад матриці (SVD), пояснено, як його інтерпретувати і використовувати. Проведено вирахування вагових коефіцієнтів за допомогою показника TF-IDF. Показано варіанти запитів простого пошуку по вихідній матриці, та щодо релевантності терма до терма, документа до документа, терма до документа, та багатьох термів одночасно. |
URI : | http://elartu.tntu.edu.ua/handle/lib/26878 |
References (Ukraine): | Михалюк В. Алгоритмічне та програмне забезпечення побудови корпусів мов САТ-засобів. [Електронний ресурс] / А. Луцків, В. Михалюк // Матеріали VI науково-технічної конференції „Інформаційні моделі, системи та технології“ – 2018. – Режим доступу до ресурсу: http://elartu.tntu.edu.ua/handle/lib/25390. |
Content type: | Master Thesis |
Aparece en las colecciones: | 123 — комп’ютерна інженерія |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Михалюк.pdf | 294,99 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
Herramientas de Administrador