Please use this identifier to cite or link to this item:
http://elartu.tntu.edu.ua/handle/lib/26878
Title: | Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів |
Other Titles: | Algorithms and software of languages construction of SAT-tools |
Authors: | Михалюк, Василь Андрійович |
Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Bibliographic description (Ukraine): | Михалюк В.А. Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів : автореферат дипломної роботи магістра за спеціальністю 123 – Комп’ютерна інженерія / В.А. Михалюк: Тернопільський національний технічний університет імені Івана Пулюя – Тернопіль: ТНТУ, 2018. – 10с. |
Bibliographic description (International): | Mykhaliuk V. Algorithms and software of languages construction of SAT-tools : abstract of master’s thesis on speciality 123 – Computer Engineering / V. Mykhaliuk; - Ternopil Ivan Puluj National Technical University – Ternopil: TNTU, 2018 – 10p |
Issue Date: | 27-Dec-2018 |
Submitted date: | 27-Dec-2018 |
Date of entry: | 27-Dec-2018 |
Country (code): | UA |
Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Supervisor: | Луцків, Андрій Мирославович |
Committee members: | Скоренький, Юрій Любомирович |
UDC: | 004.42 |
Keywords: | 123 комп’ютерна інженерія CAT-засоби корпус мови латентно-семантичний аналіз сингулярний розклад матриці TF-IDF матриця «терм-на-документ» |
Number of pages: | 10 |
Abstract: | В дипломній роботі магістра виконано дослідження алгоритмічного та програмного забезпечення побудови корпусів мов CAT-засобів. В роботі розглянуто метод латентно-семантичного аналізу для дослідження релевантних зв’язків термів і документів. Розглянуто сфери застосування, компанії світового рівня що вже розглядають цю технологію. Було описано створення матриці «терм-на-документ», застосування методу латентно-семантичного аналізу (LSA) для аналізу корпусу, що складається із повного набору статей англомовної Вікіпедії. Розглянуто використання Spark для попередньої обробки даних: читання, очищення та приведення в числову форму. Показано, як вираховується сингулярний розклад матриці (SVD), пояснено, як його інтерпретувати і використовувати. Проведено вирахування вагових коефіцієнтів за допомогою показника TF-IDF. Показано варіанти запитів простого пошуку по вихідній матриці, та щодо релевантності терма до терма, документа до документа, терма до документа, та багатьох термів одночасно. |
URI: | http://elartu.tntu.edu.ua/handle/lib/26878 |
References (Ukraine): | Михалюк В. Алгоритмічне та програмне забезпечення побудови корпусів мов САТ-засобів. [Електронний ресурс] / А. Луцків, В. Михалюк // Матеріали VI науково-технічної конференції „Інформаційні моделі, системи та технології“ – 2018. – Режим доступу до ресурсу: http://elartu.tntu.edu.ua/handle/lib/25390. |
Content type: | Master Thesis |
Appears in Collections: | 123 — комп’ютерна інженерія |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Михалюк.pdf | 294,99 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Admin Tools