Empreu aquest identificador per citar o enllaçar aquest ítem: http://elartu.tntu.edu.ua/handle/lib/50561
Títol: Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry
Altres títols: Development of a Small Language Model for Systems with Limited Computational Resources Based on Azure ML and AI Foundry
Autor: Містерман, Петро Михайлович
Misterman, Petro
Bibliographic description (Ukraine): Містерман П. М. Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „121 — інженерія програмного забезпечення“ / П. М. Містерман. — Тернопіль: ТНТУ, 2025. — 73 с.
Data de publicació: de -2025
Date of entry: 23-de -2025
Editorial: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Supervisor: Петрик, Михайло Романович
UDC: 004.8
Paraules clau: 121
інженерія програмного забезпечення
штучний інтелект
малі мовні моделі
класифікація голосової пошти
Azure Machine Learning
software engineering
artificial intelligence
small language models
voicemail classification
Resum: Метою роботи є розробка програмної системи класифікації голосової пошти на основі малої мовної моделі для використання в умовах обмежених обчислювальних ресурсів із застосуванням платформи Azure Machine Learning. Об’єктом дослідження є процес автоматизованої класифікації голосових повідомлень у програмних системах з використанням технологій штучного інтелекту. Предметом дослідження є методи та засоби розробки програмної системи класифікації голосової пошти на основі малих мовних моделей. У роботі проаналізовано підходи до використання великих і малих мовних моделей та реалізовано життєвий цикл малої мовної моделі, включаючи підготовку синтетичних даних, тонке налаштування, розгортання та тестування. Проведено експериментальне оцінювання якості класифікації та навантажувальне тестування системи. Результати дослідження показали, що тонко налаштована мала мовна модель забезпечує точність класифікації понад 96 % та ефективне масштабування при нижчих експлуатаційних витратах у порівнянні з великою мовною моделлю. Отримані результати підтверджують доцільність використання малих мовних моделей у системах з обмеженими обчислювальними ресурсами. Практичне значення роботи полягає у можливості використання розробленої системи для автоматизованої класифікації голосової пошти в реальних інформаційних системах.
The aim of this thesis is to develop a voicemail classification system based on a small language model suitable for operation in environments with limited computational resources using the Azure Machine Learning platform. The object of the research is the process of automated classification of voice messages in software systems using artificial intelligence technologies. The subject of the research is the methods and tools for developing a voicemail classification system based on small language models. The thesis analyzes existing approaches to the use of large and small language models for natural language processing tasks and implements the full lifecycle of a small language model, including synthetic data preparation, fine-tuning, deployment, and testing. Experimental evaluation of classification quality and load testing of the system were conducted. The results of the study demonstrate that the fine-tuned small language model achieves classification accuracy above 96% and supports effective horizontal scaling while maintaining lower operational costs compared to a large language model. These results confirm the feasibility and efficiency of using small language models in systems with limited computational resources. The practical significance of the work lies in the possibility of applying the developed system in real-world information systems for automated voicemail classification.
Content: ПЕРЕЛІК СКОРОЧЕНЬ...............................................................................................8 ВСТУП..........................................................................................................................9 1 АНАЛІЗ ВИМОГ ДО ПРОГРАМНОЇ СИСТЕМИ ................................................ 11 1.1 Аналіз предметної області ............................................................................... 11 1.2 Аналіз існуючих рішень та підходів до використання великих і малих мовних моделей ................................................................................................................... 12 1.3 Постановка завдання та цілей програмної системи........................................ 14 1.4 Вимоги до програмної системи ....................................................................... 15 1.4.1 Функціональні вимоги............................................................................... 16 1.4.2 Нефункціональні вимоги........................................................................... 17 1.5 Аналіз обмежень обчислювальних ресурсів та економічної доцільності ..... 18 1.6 Висновки до першого розділу.......................................................................... 19 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ ......................... 21 2.1 Вибір процесу розробки програмної системи................................................. 21 2.2 Проєктування архітектури системи класифікації голосової пошти .............. 22 2.3 Організація зберігання даних та ML-артефактів у Azure AI Foundry ........... 24 2.4 Формування та підготовка синтетичних тренувальних даних....................... 26 2.5 Тонке налаштування SLM у середовищі Azure AI Foundry ........................... 30 2.5.1 Serverless fine-tuning як початковий етап навчання................................. 30 2.5.2 Навчання моделі на керованих обчислювальних ресурсах Azure ML.... 32 2.6 Реєстрація моделі та розгортання endpoint для інференсу............................. 38 2.7 Опис програмного інтерфейсу взаємодії з моделлю ...................................... 40 2.8 Висновки до другого розділу........................................................................... 423 ТЕСТУВАННЯ, ОЦІНЮВАННЯ ТА НАВАНТАЖУВАЛЬНИЙ АНАЛІЗ ПРОГРАМНОЇ СИСТЕМИ........................................................................................ 44 3.1 Загальна методологія тестування програмної системи .................................. 44 3.2 Оцінювання якості класифікації голосової пошти ......................................... 45 3.3 Порівняльний аналіз використання малих та великих мовних моделей....... 47 3.4 Навантажувальне тестування програмної системи та аналіз масштабування ................................................................................................................................. 51 3.5 Висновки до третього розділу ......................................................................... 56 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ ............. 58 4.1 Охорона праці................................................................................................... 58 4.2 Стійкість роботи обчислювальної системи під час НС воєнного часу ......... 60 4.3 Висновки до четвертого розділу...................................................................... 62 ВИСНОВКИ ............................................................................................................... 63 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ................................................................... 65 ДОДАТКИ .................................................................................................................. 68 ДОДАТОК А – Тези конференції.......................................................................... 69 ДОДАТОК Б – Лістинги коду системи ................................................................. 70
URI: http://elartu.tntu.edu.ua/handle/lib/50561
Copyright owner: @ Містерман Петро Михайлович, 2025
References (Ukraine): 1. Brown T. et al. Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems (NeurIPS). 2020.
2. Bommasani R. et al. On the Opportunities and Risks of Foundation Models. Stanford: Center for Research on Foundation Models, 2021.
3. Beck K. et al. Manifesto for Agile Software Development. 2001. URL: https://agilemanifesto.org (дата звернення: 20.12.2025).
4. Sommerville I. Software Engineering. 10th Edition. Boston: Pearson, 2016. 768 p
5. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020.
6. Microsoft. Azure Machine Learning Documentation. 2024. URL: https://learn.microsoft.com/azure/machine-learning
7. Microsoft. Azure AI Foundry Overview. 2024. URL: https://learn.microsoft.com/azure/ai-foundry
8. Azure Machine Learning Architecture Overview. URL: https://learn.microsoft.com/en-us/azure/machine-learning/concept-azuremachine-learning-architecture
9. Azure AI Foundry Documentation. URL: https://learn.microsoft.com/uk-ua/azure/ai-foundry
10. Sculley D. et al. Hidden Technical Debt in Machine Learning Systems. Proceedings of the Neural Information Processing Systems Conference (NIPS). 2015.
11. Buyya R. et al. Cloud Computing: Principles and Paradigms. Hoboken: Wiley, 2019. 637 p.
12. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020.
13. Fine-tune models using serverless APIs in Azure AI Foundry. URL:66 https://learn.microsoft.com/en-us/azure/ai-foundry/how-to/fine-tuneserverless?view=foundry-classic&tabs=chat-completion&pivots=foundryportal#prepare-data-for-fine-tuning
35. Методичні вказівки до виконання кваліфікаційної роботи магістра. URL: https://dl.tntu.edu.ua/content.php?cid=534814
Content type: Master Thesis
Apareix a les col·leccions:121 — інженерія програмного забезпечення

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
dyplom_Misterman_2025.pdf1,34 MBAdobe PDFVeure/Obrir


Els ítems de DSpace es troben protegits per copyright, amb tots els drets reservats, sempre i quan no s’indiqui el contrari.

Eines d'Administrador