Empreu aquest identificador per citar o enllaçar aquest ítem:
http://elartu.tntu.edu.ua/handle/lib/50561| Títol: | Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry |
| Altres títols: | Development of a Small Language Model for Systems with Limited Computational Resources Based on Azure ML and AI Foundry |
| Autor: | Містерман, Петро Михайлович Misterman, Petro |
| Bibliographic description (Ukraine): | Містерман П. М. Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „121 — інженерія програмного забезпечення“ / П. М. Містерман. — Тернопіль: ТНТУ, 2025. — 73 с. |
| Data de publicació: | de -2025 |
| Date of entry: | 23-de -2025 |
| Editorial: | Тернопільський національний технічний університет імені Івана Пулюя |
| Country (code): | UA |
| Place of the edition/event: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
| Supervisor: | Петрик, Михайло Романович |
| UDC: | 004.8 |
| Paraules clau: | 121 інженерія програмного забезпечення штучний інтелект малі мовні моделі класифікація голосової пошти Azure Machine Learning software engineering artificial intelligence small language models voicemail classification |
| Resum: | Метою роботи є розробка програмної системи класифікації голосової пошти
на основі малої мовної моделі для використання в умовах обмежених
обчислювальних ресурсів із застосуванням платформи Azure Machine Learning.
Об’єктом дослідження є процес автоматизованої класифікації голосових
повідомлень у програмних системах з використанням технологій штучного
інтелекту. Предметом дослідження є методи та засоби розробки програмної
системи класифікації голосової пошти на основі малих мовних моделей.
У роботі проаналізовано підходи до використання великих і малих мовних
моделей та реалізовано життєвий цикл малої мовної моделі, включаючи підготовку
синтетичних даних, тонке налаштування, розгортання та тестування. Проведено
експериментальне оцінювання якості класифікації та навантажувальне тестування
системи.
Результати дослідження показали, що тонко налаштована мала мовна модель
забезпечує точність класифікації понад 96 % та ефективне масштабування при
нижчих експлуатаційних витратах у порівнянні з великою мовною моделлю.
Отримані результати підтверджують доцільність використання малих мовних
моделей у системах з обмеженими обчислювальними ресурсами.
Практичне значення роботи полягає у можливості використання розробленої
системи для автоматизованої класифікації голосової пошти в реальних
інформаційних системах. The aim of this thesis is to develop a voicemail classification system based on a small language model suitable for operation in environments with limited computational resources using the Azure Machine Learning platform. The object of the research is the process of automated classification of voice messages in software systems using artificial intelligence technologies. The subject of the research is the methods and tools for developing a voicemail classification system based on small language models. The thesis analyzes existing approaches to the use of large and small language models for natural language processing tasks and implements the full lifecycle of a small language model, including synthetic data preparation, fine-tuning, deployment, and testing. Experimental evaluation of classification quality and load testing of the system were conducted. The results of the study demonstrate that the fine-tuned small language model achieves classification accuracy above 96% and supports effective horizontal scaling while maintaining lower operational costs compared to a large language model. These results confirm the feasibility and efficiency of using small language models in systems with limited computational resources. The practical significance of the work lies in the possibility of applying the developed system in real-world information systems for automated voicemail classification. |
| Content: | ПЕРЕЛІК СКОРОЧЕНЬ...............................................................................................8 ВСТУП..........................................................................................................................9 1 АНАЛІЗ ВИМОГ ДО ПРОГРАМНОЇ СИСТЕМИ ................................................ 11 1.1 Аналіз предметної області ............................................................................... 11 1.2 Аналіз існуючих рішень та підходів до використання великих і малих мовних моделей ................................................................................................................... 12 1.3 Постановка завдання та цілей програмної системи........................................ 14 1.4 Вимоги до програмної системи ....................................................................... 15 1.4.1 Функціональні вимоги............................................................................... 16 1.4.2 Нефункціональні вимоги........................................................................... 17 1.5 Аналіз обмежень обчислювальних ресурсів та економічної доцільності ..... 18 1.6 Висновки до першого розділу.......................................................................... 19 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ ......................... 21 2.1 Вибір процесу розробки програмної системи................................................. 21 2.2 Проєктування архітектури системи класифікації голосової пошти .............. 22 2.3 Організація зберігання даних та ML-артефактів у Azure AI Foundry ........... 24 2.4 Формування та підготовка синтетичних тренувальних даних....................... 26 2.5 Тонке налаштування SLM у середовищі Azure AI Foundry ........................... 30 2.5.1 Serverless fine-tuning як початковий етап навчання................................. 30 2.5.2 Навчання моделі на керованих обчислювальних ресурсах Azure ML.... 32 2.6 Реєстрація моделі та розгортання endpoint для інференсу............................. 38 2.7 Опис програмного інтерфейсу взаємодії з моделлю ...................................... 40 2.8 Висновки до другого розділу........................................................................... 423 ТЕСТУВАННЯ, ОЦІНЮВАННЯ ТА НАВАНТАЖУВАЛЬНИЙ АНАЛІЗ ПРОГРАМНОЇ СИСТЕМИ........................................................................................ 44 3.1 Загальна методологія тестування програмної системи .................................. 44 3.2 Оцінювання якості класифікації голосової пошти ......................................... 45 3.3 Порівняльний аналіз використання малих та великих мовних моделей....... 47 3.4 Навантажувальне тестування програмної системи та аналіз масштабування ................................................................................................................................. 51 3.5 Висновки до третього розділу ......................................................................... 56 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ ............. 58 4.1 Охорона праці................................................................................................... 58 4.2 Стійкість роботи обчислювальної системи під час НС воєнного часу ......... 60 4.3 Висновки до четвертого розділу...................................................................... 62 ВИСНОВКИ ............................................................................................................... 63 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ................................................................... 65 ДОДАТКИ .................................................................................................................. 68 ДОДАТОК А – Тези конференції.......................................................................... 69 ДОДАТОК Б – Лістинги коду системи ................................................................. 70 |
| URI: | http://elartu.tntu.edu.ua/handle/lib/50561 |
| Copyright owner: | @ Містерман Петро Михайлович, 2025 |
| References (Ukraine): | 1. Brown T. et al. Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems (NeurIPS). 2020. 2. Bommasani R. et al. On the Opportunities and Risks of Foundation Models. Stanford: Center for Research on Foundation Models, 2021. 3. Beck K. et al. Manifesto for Agile Software Development. 2001. URL: https://agilemanifesto.org (дата звернення: 20.12.2025). 4. Sommerville I. Software Engineering. 10th Edition. Boston: Pearson, 2016. 768 p 5. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020. 6. Microsoft. Azure Machine Learning Documentation. 2024. URL: https://learn.microsoft.com/azure/machine-learning 7. Microsoft. Azure AI Foundry Overview. 2024. URL: https://learn.microsoft.com/azure/ai-foundry 8. Azure Machine Learning Architecture Overview. URL: https://learn.microsoft.com/en-us/azure/machine-learning/concept-azuremachine-learning-architecture 9. Azure AI Foundry Documentation. URL: https://learn.microsoft.com/uk-ua/azure/ai-foundry 10. Sculley D. et al. Hidden Technical Debt in Machine Learning Systems. Proceedings of the Neural Information Processing Systems Conference (NIPS). 2015. 11. Buyya R. et al. Cloud Computing: Principles and Paradigms. Hoboken: Wiley, 2019. 637 p. 12. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020. 13. Fine-tune models using serverless APIs in Azure AI Foundry. URL:66 https://learn.microsoft.com/en-us/azure/ai-foundry/how-to/fine-tuneserverless?view=foundry-classic&tabs=chat-completion&pivots=foundryportal#prepare-data-for-fine-tuning 35. Методичні вказівки до виконання кваліфікаційної роботи магістра. URL: https://dl.tntu.edu.ua/content.php?cid=534814 |
| Content type: | Master Thesis |
| Apareix a les col·leccions: | 121 — інженерія програмного забезпечення |
Arxius per aquest ítem:
| Arxiu | Descripció | Mida | Format | |
|---|---|---|---|---|
| dyplom_Misterman_2025.pdf | 1,34 MB | Adobe PDF | Veure/Obrir |
Els ítems de DSpace es troben protegits per copyright, amb tots els drets reservats, sempre i quan no s’indiqui el contrari.
Eines d'Administrador