Please use this identifier to cite or link to this item: http://elartu.tntu.edu.ua/handle/lib/26878
Title: Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів
Other Titles: Algorithms and software of languages construction of SAT-tools
Authors: Михалюк, Василь Андрійович
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна
Bibliographic description (Ukraine): Михалюк В.А. Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів : автореферат дипломної роботи магістра за спеціальністю 123 – Комп’ютерна інженерія / В.А. Михалюк: Тернопільський національний технічний університет імені Івана Пулюя – Тернопіль: ТНТУ, 2018. – 10с.
Bibliographic description (International): Mykhaliuk V. Algorithms and software of languages construction of SAT-tools : abstract of master’s thesis on speciality 123 – Computer Engineering / V. Mykhaliuk; - Ternopil Ivan Puluj National Technical University – Ternopil: TNTU, 2018 – 10p
Issue Date: 27-Dec-2018
Submitted date: 27-Dec-2018
Date of entry: 27-Dec-2018
Country (code): UA
Place of the edition/event: Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна
Supervisor: Луцків, Андрій Мирославович
Committee members: Скоренький, Юрій Любомирович
UDC: 004.42
Keywords: 123
комп’ютерна інженерія
CAT-засоби
корпус мови
латентно-семантичний аналіз
сингулярний розклад матриці
TF-IDF
матриця «терм-на-документ»
Number of pages: 10
Abstract: В дипломній роботі магістра виконано дослідження алгоритмічного та програмного забезпечення побудови корпусів мов CAT-засобів. В роботі розглянуто метод латентно-семантичного аналізу для дослідження релевантних зв’язків термів і документів. Розглянуто сфери застосування, компанії світового рівня що вже розглядають цю технологію. Було описано створення матриці «терм-на-документ», застосування методу латентно-семантичного аналізу (LSA) для аналізу корпусу, що складається із повного набору статей англомовної Вікіпедії. Розглянуто використання Spark для попередньої обробки даних: читання, очищення та приведення в числову форму. Показано, як вираховується сингулярний розклад матриці (SVD), пояснено, як його інтерпретувати і використовувати. Проведено вирахування вагових коефіцієнтів за допомогою показника TF-IDF. Показано варіанти запитів простого пошуку по вихідній матриці, та щодо релевантності терма до терма, документа до документа, терма до документа, та багатьох термів одночасно.
URI: http://elartu.tntu.edu.ua/handle/lib/26878
References (Ukraine): Михалюк В. Алгоритмічне та програмне забезпечення побудови корпусів мов САТ-засобів. [Електронний ресурс] / А. Луцків, В. Михалюк // Матеріали VI науково-технічної конференції „Інформаційні моделі, системи та технології“ – 2018. – Режим доступу до ресурсу: http://elartu.tntu.edu.ua/handle/lib/25390.
Content type: Master Thesis
Appears in Collections:123 — комп’ютерна інженерія

Files in This Item:
File Description SizeFormat 
Михалюк.pdf294,99 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Admin Tools