Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://elartu.tntu.edu.ua/handle/lib/26878
Назва: | Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів |
Інші назви: | Algorithms and software of languages construction of SAT-tools |
Автори: | Михалюк, Василь Андрійович |
Приналежність: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Бібліографічний опис: | Михалюк В.А. Алгоритмічне та програмне забезпечення побудови корпусів мов CAT-засобів : автореферат дипломної роботи магістра за спеціальністю 123 – Комп’ютерна інженерія / В.А. Михалюк: Тернопільський національний технічний університет імені Івана Пулюя – Тернопіль: ТНТУ, 2018. – 10с. |
Bibliographic description: | Mykhaliuk V. Algorithms and software of languages construction of SAT-tools : abstract of master’s thesis on speciality 123 – Computer Engineering / V. Mykhaliuk; - Ternopil Ivan Puluj National Technical University – Ternopil: TNTU, 2018 – 10p |
Дата публікації: | 27-гру-2018 |
Дата подання: | 27-гру-2018 |
Дата внесення: | 27-гру-2018 |
Країна (код): | UA |
Місце видання, проведення: | Тернопільський національний технічний університет імені Івана Пулюя Міністерства освіти і науки України, Тернопіль, Україна |
Науковий керівник: | Луцків, Андрій Мирославович |
Члени комітету: | Скоренький, Юрій Любомирович |
УДК: | 004.42 |
Теми: | 123 комп’ютерна інженерія CAT-засоби корпус мови латентно-семантичний аналіз сингулярний розклад матриці TF-IDF матриця «терм-на-документ» |
Кількість сторінок: | 10 |
Короткий огляд (реферат): | В дипломній роботі магістра виконано дослідження алгоритмічного та програмного забезпечення побудови корпусів мов CAT-засобів. В роботі розглянуто метод латентно-семантичного аналізу для дослідження релевантних зв’язків термів і документів. Розглянуто сфери застосування, компанії світового рівня що вже розглядають цю технологію. Було описано створення матриці «терм-на-документ», застосування методу латентно-семантичного аналізу (LSA) для аналізу корпусу, що складається із повного набору статей англомовної Вікіпедії. Розглянуто використання Spark для попередньої обробки даних: читання, очищення та приведення в числову форму. Показано, як вираховується сингулярний розклад матриці (SVD), пояснено, як його інтерпретувати і використовувати. Проведено вирахування вагових коефіцієнтів за допомогою показника TF-IDF. Показано варіанти запитів простого пошуку по вихідній матриці, та щодо релевантності терма до терма, документа до документа, терма до документа, та багатьох термів одночасно. |
URI (Уніфікований ідентифікатор ресурсу): | http://elartu.tntu.edu.ua/handle/lib/26878 |
Перелік літератури: | Михалюк В. Алгоритмічне та програмне забезпечення побудови корпусів мов САТ-засобів. [Електронний ресурс] / А. Луцків, В. Михалюк // Матеріали VI науково-технічної конференції „Інформаційні моделі, системи та технології“ – 2018. – Режим доступу до ресурсу: http://elartu.tntu.edu.ua/handle/lib/25390. |
Тип вмісту: | Master Thesis |
Розташовується у зібраннях: | 123 — комп’ютерна інженерія |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
Михалюк.pdf | 294,99 kB | Adobe PDF | Переглянути/відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.
Інструменти адміністратора