霂瑞霂��撘����迨��辣:
http://elartu.tntu.edu.ua/handle/lib/52593| Title: | Розробка системи голосового введення тексту в активне поле українською мовою з підтримкою орфографічного аналізу |
| Other Titles: | Development of a system for voice text input into the active field in the Ukrainian language with spelling analysis support |
| Authors: | Гладиш, Дмитро Олександрович Hladysh, Dmytro |
| Affiliation: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра програмної інженерії, м. Тернопіль, Україна |
| Bibliographic reference (2015): | Гладиш Д. О. Розробка системи голосового введення тексту в активне поле українською мовою з підтримкою орфографічного аналізу : робота на здобуття кваліфікаційного ступеня бакалавра : 121 - інженерія програмного забезпечення / наук. кер. П. О. Тимків. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 57 с. |
| Issue Date: | 六月-2026 |
| Date of entry: | 23-六月-2026 |
| Publisher: | Тернопільський національний технічний університет імені Івана Пулюя |
| Country (code): | UA |
| Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя, факультет ФІС |
| Supervisor: | Тимків, Павло Олександрович |
| Committee members: | Загородна, Наталія Володимирівна |
| UDC: | 004.9 |
| Keywords: | інженерія програмного забезпечення голосове введення тексту розпізнавання мовлення орфографічний аналіз software engineering voice text input speech recognition spelling analysis |
| Number of pages: | 67 |
| Abstract: | Кваліфікаційна робота бакалавра присвячена розробці десктопного застосунку для голосового введення тексту українською мовою з підтримкою орфографічного аналізу, що функціонує в повністю офлайн-режимі. Метою роботи є створення системи, яка розпізнає українське мовлення та автоматично вставляє результат в активне поле введення будь-якого застосунку операційної системи Windows. У першому розділі проведено аналіз предметної області, розглянуто існуючі рішення для голосового введення тексту, сформульовано функціональні та нефункціональні вимоги до системи, визначено актора та двадцять чотири варіанти використання. У другому розділі описано проєктування та розробку програмної системи: обґрунтовано вибір модульної архітектури, побудовано UML-діаграми, реалізовано офлайн-розпізнавання мовлення на базі моделі OpenAI Whisper з апаратним прискоренням CUDA та інтегровано орфографічну перевірку через LanguageTool. У третьому розділі описано тестування системи, розгортання та верифікацію відповідності вимогам. У четвертому розділі розглянуто питання безпеки життєдіяльності та охорони праці. Об'єктом дослідження є процес голосового введення тексту в комп'ютерних системах. Предметом дослідження є методи офлайн-розпізнавання мовлення українською мовою та автоматичної вставки розпізнаного тексту в активні поля введення. The bachelor's qualification work is dedicated to the development of a desktop application for voice text input in the Ukrainian language with spelling analysis support, operating entirely in offline mode. The purpose of the work is to create a system that recognizes Ukrainian speech and automatically inserts the result into the active input field of any application on the Windows operating system. The first section analyzes the subject area, reviews existing voice input solutions, formulates functional and non-functional system requirements, and identifies one actor and twenty-four use cases. The second section describes the design and development of the software system: the choice of modular architecture is justified, UML diagrams are constructed, offline speech recognition based on the OpenAI Whisper model with CUDA hardware acceleration is implemented, and spelling checking via LanguageTool is integrated. The third section covers system testing, deployment, and verification of requirements compliance. The fourth section addresses occupational safety and health issues. The object of research is the process of voice text input in computer systems. The subject of research is the methods of offline speech recognition in the Ukrainian language and automatic insertion of recognized text into active input fields. |
| Content: | АНОТАЦІЯ.......................................................................................................................4 ABSTRACT......................................................................................................................6 ВСТУП............................................................................................................................10 1 АНАЛІЗ ВИМОГ ДО ПРОГРАМНОЇ СИСТЕМИ..................................................12 1.1 Аналіз предметної області.................................................................................12 1.2 Постановка задачі та цілей................................................................................13 1.3 Пошук акторів та варіантів використання........................................................15 1.4 Опис ключових варіантів використання...........................................................16 1.5 Висновки до розділу 1........................................................................................18 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ...........................20 2.1 Вибір процесу розробки.....................................................................................20 2.2 Проєктування архітектури системи..................................................................21 2.2.1 Загальна архітектура..................................................................................21 2.2.2 Опис модулів системи................................................................................22 2.3 Побудова схем бази даних.................................................................................25 2.4 Побудова UML-діаграм......................................................................................26 2.5 Вибір мови та середовища розробки................................................................29 2.6 Реалізація основних класів та методів..............................................................31 2.7 Розробка інтерфейсу користувача.....................................................................34 2.8 Висновки до розділу 2........................................................................................38 3 ТЕСТУВАННЯ, ВПРОВАДЖЕННЯ ТА ПІДТРИМКА..........................................39 3.1 Тестування програмної системи........................................................................39 3.1.1 Види та план тестування............................................................................39 3.1.2 Розробка тестових сценаріїв......................................................................40 3.2 Розгортання програмної системи та системні вимоги....................................41 3.3 Верифікація програмної системи......................................................................43 3.4 Висновки до розділу 3........................................................................................45 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ..........................47 4.1 Безпека життєдіяльності....................................................................................47 4.2 Основи охорони праці........................................................................................49 4.3 Висновки до розділу 4........................................................................................51 ВИСНОВКИ...................................................................................................................52 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ......................................................................54 ДОДАТКИ…………………………………………………………..……………….…57 ДОДАТОК А. Тези конференції ДОДАТОК Б. Лістинги програмного коду ДОДАТОК В. Ілюстрації інтерфейсу користувача ДОДАТОК Д. UML-діаграми |
| URI: | http://elartu.tntu.edu.ua/handle/lib/52593 |
| Copyright owner: | © Гладиш Дмитро Олександрович, 2026 |
| References (Ukraine): | [1] A. Radford, J. W. Kim, T. Xu, G. Brockman, C. McLeavey, and I. Sutskever, "Robust Speech Recognition via Large-Scale Weak Supervision," in Proc. 40th Int. Conf. Machine Learning (ICML), Honolulu, Hawaii, 2023, pp. 28492–28518. [Online]. Available: https://arxiv.org/abs/2212.04356 [2] OpenAI, "Whisper: Open Source Speech Recognition," GitHub repository, 2022. [Online]. Available: https://github.com/openai/whisper [3] I. Sommerville, Software Engineering, 10th ed. Boston, MA: Pearson, 2016. 816 p. [4] R. Hipp, D. Kennedy, and J. Mistachkin, SQLite Documentation, SQLite Consortium, 2023. [Online]. Available: https://www.sqlite.org/docs.html [5] G. van Rossum and F. L. Drake, Python 3 Reference Manual. Scotts Valley, CA: CreateSpace, 2009. 242 p. [6] H. Washizaki, Ed., Guide to the Software Engineering Body of Knowledge (SWEBOK Guide), Version 4.0. IEEE Computer Society, 2024. 411 p. [Online]. Available: https://ieeecs-media.computer.org/media/education/swebok/swebok-v4.pdf [7] B. Beizer, Black-Box Testing: Techniques for Functional Testing of Software and Systems. New York, NY: Wiley, 1995. 320 p. [8] О. І. Запорожець, М. С. Fel, Н. С. Протоєрейський, Безпека життєдіяльності. Київ: Центр учбової літератури, 2013. 448 с. [9] В. Ц. Жидецький, Основи охорони праці. Львів: Афіша, 2002. 320 с. [10] ДСанПіН 3.3.2.007-98. Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин. Київ: МОЗ України, 1998. [11] ДСН 3.3.6.037-99. Санітарні норми виробничого шуму, ультразвуку та інфразвуку. Київ: МОЗ України, 1999. [12] D. Naber, "A Rule-Based Style and Grammar Checker," Diploma thesis, Bielefeld University, 2003. [Online]. Available: https://languagetool.org/papers/naber-2003-rule-based-grammar-checker.pdf [13] A. Paszke et al., "PyTorch: An Imperative Style, High-Performance Deep Learning Library," in Advances in Neural Information Processing Systems, vol. 32, 2019. [Online]. Available: https://arxiv.org/abs/1912.01703 [14] W. Chan, N. Jaitly, Q. Le, and O. Vinyals, "Listen, Attend and Spell: A Neural Network for Large Vocabulary Conversational Speech Recognition," in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing (ICASSP), 2016, pp. 4960–4964. [15] T. N. Sainath and B. Li, "Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for DBLSTM Acoustic Models," in Proc. Interspeech, 2016, pp. 813–817. |
| Content type: | Bachelor Thesis |
| �蝷箔����: | 121 — Інженерія програмного забезпечення, F2 Інженерія програмного забезпечення (бакалаври) |
��辣銝剔�﹝獢�:
| 獢�獢� | ��膩 | 憭批�� | �撘� | |
|---|---|---|---|---|
| dyplom_Hladysh_D_2026.pdf | 2,36 MB | Adobe PDF | 璉�閫�/撘�� |
�DSpace銝剜�������★��������雿��.
蝞∠�極�