Por favor, use este identificador para citar o enlazar este ítem: http://elartu.tntu.edu.ua/handle/lib/26878
Título : Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів
Otros títulos : Algorithms and software of languages construction of SAT-tools
Autor : Михалюк, Василь Андрійович
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна
Bibliographic description (Ukraine): Михалюк В.А. Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів : автореферат дипломної роботи магістра за спеціальністю 123 – Комп’ютерна інженерія / В.А. Михалюк: Тернопільський національний технічний університет імені Івана Пулюя – Тернопіль: ТНТУ, 2018. – 10с.
Bibliographic description (International): Mykhaliuk V. Algorithms and software of languages construction of SAT-tools : abstract of master’s thesis on speciality 123 – Computer Engineering / V. Mykhaliuk; - Ternopil Ivan Puluj National Technical University – Ternopil: TNTU, 2018 – 10p
Fecha de publicación : 27-dic-2018
Submitted date: 27-dic-2018
Date of entry: 27-dic-2018
Country (code): UA
Place of the edition/event: Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна
Supervisor: Луцків, Андрій Мирославович
Committee members: Скоренький, Юрій Любомирович
UDC: 004.42
Palabras clave : 123
комп’ютерна інженерія
CAT-засоби
корпус мови
латентно-семантичний аналіз
сингулярний розклад матриці
TF-IDF
матриця «терм-на-документ»
Number of pages: 10
Resumen : В дипломній роботі магістра виконано дослідження алгоритмічного та програмного забезпечення побудови корпусів мов CAT-засобів. В роботі розглянуто метод латентно-семантичного аналізу для дослідження релевантних зв’язків термів і документів. Розглянуто сфери застосування, компанії світового рівня що вже розглядають цю технологію. Було описано створення матриці «терм-на-документ», застосування методу латентно-семантичного аналізу (LSA) для аналізу корпусу, що складається із повного набору статей англомовної Вікіпедії. Розглянуто використання Spark для попередньої обробки даних: читання, очищення та приведення в числову форму. Показано, як вираховується сингулярний розклад матриці (SVD), пояснено, як його інтерпретувати і використовувати. Проведено вирахування вагових коефіцієнтів за допомогою показника TF-IDF. Показано варіанти запитів простого пошуку по вихідній матриці, та щодо релевантності терма до терма, документа до документа, терма до документа, та багатьох термів одночасно.
URI : http://elartu.tntu.edu.ua/handle/lib/26878
References (Ukraine): Михалюк В. Алгоритмічне та програмне забезпечення побудови корпусів мов САТ-засобів. [Електронний ресурс] / А. Луцків, В. Михалюк // Матеріали VI науково-технічної конференції „Інформаційні моделі, системи та технології“ – 2018. – Режим доступу до ресурсу: http://elartu.tntu.edu.ua/handle/lib/25390.
Content type: Master Thesis
Aparece en las colecciones: 123 — комп’ютерна інженерія

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Михалюк.pdf294,99 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

Herramientas de Administrador