Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry

Містерман, Петро Михайлович; Misterman, Petro

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/50561

Назва:	Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry
Інші назви:	Development of a Small Language Model for Systems with Limited Computational Resources Based on Azure ML and AI Foundry
Автори:	Містерман, Петро Михайлович Misterman, Petro
Бібліографічний опис:	Містерман П. М. Розробка малої мовної моделі для системи з обмеженими обчислювальними ресурсами на базі Azure ML та AI Foundry : робота на здобуття кваліфікаційного ступеня магістра : спец.„121 — інженерія програмного забезпечення“ / наук. кер. М. Р. Петрик. Тернопіль: ТНТУ, 2025. 73 с.
Дата публікації:	гру-2025
Дата внесення:	23-гру-2025
Видавництво:	Тернопільський національний технічний університет імені Івана Пулюя
Країна (код):	UA
Місце видання, проведення:	ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Науковий керівник:	Петрик, Михайло Романович
УДК:	004.8
Теми:	121 інженерія програмного забезпечення штучний інтелект малі мовні моделі класифікація голосової пошти Azure Machine Learning software engineering artificial intelligence small language models voicemail classification
Короткий огляд (реферат):	Метою роботи є розробка програмної системи класифікації голосової пошти на основі малої мовної моделі для використання в умовах обмежених обчислювальних ресурсів із застосуванням платформи Azure Machine Learning. Об’єктом дослідження є процес автоматизованої класифікації голосових повідомлень у програмних системах з використанням технологій штучного інтелекту. Предметом дослідження є методи та засоби розробки програмної системи класифікації голосової пошти на основі малих мовних моделей. У роботі проаналізовано підходи до використання великих і малих мовних моделей та реалізовано життєвий цикл малої мовної моделі, включаючи підготовку синтетичних даних, тонке налаштування, розгортання та тестування. Проведено експериментальне оцінювання якості класифікації та навантажувальне тестування системи. Результати дослідження показали, що тонко налаштована мала мовна модель забезпечує точність класифікації понад 96 % та ефективне масштабування при нижчих експлуатаційних витратах у порівнянні з великою мовною моделлю. Отримані результати підтверджують доцільність використання малих мовних моделей у системах з обмеженими обчислювальними ресурсами. Практичне значення роботи полягає у можливості використання розробленої системи для автоматизованої класифікації голосової пошти в реальних інформаційних системах. The aim of this thesis is to develop a voicemail classification system based on a small language model suitable for operation in environments with limited computational resources using the Azure Machine Learning platform. The object of the research is the process of automated classification of voice messages in software systems using artificial intelligence technologies. The subject of the research is the methods and tools for developing a voicemail classification system based on small language models. The thesis analyzes existing approaches to the use of large and small language models for natural language processing tasks and implements the full lifecycle of a small language model, including synthetic data preparation, fine-tuning, deployment, and testing. Experimental evaluation of classification quality and load testing of the system were conducted. The results of the study demonstrate that the fine-tuned small language model achieves classification accuracy above 96% and supports effective horizontal scaling while maintaining lower operational costs compared to a large language model. These results confirm the feasibility and efficiency of using small language models in systems with limited computational resources. The practical significance of the work lies in the possibility of applying the developed system in real-world information systems for automated voicemail classification.
Зміст:	ПЕРЕЛІК СКОРОЧЕНЬ...8 ВСТУП...9 1 АНАЛІЗ ВИМОГ ДО ПРОГРАМНОЇ СИСТЕМИ ...11 1.1 Аналіз предметної області ...11 1.2 Аналіз існуючих рішень та підходів до використання великих і малих мовних моделей ... 12 1.3 Постановка завдання та цілей програмної системи...14 1.4 Вимоги до програмної системи ...15 1.4.1 Функціональні вимоги...16 1.4.2 Нефункціональні вимоги...17 1.5 Аналіз обмежень обчислювальних ресурсів та економічної доцільності ... 18 1.6 Висновки до першого розділу...19 2 ПРОЄКТУВАННЯ ТА РОЗРОБКА ПРОГРАМНОЇ СИСТЕМИ ...21 2.1 Вибір процесу розробки програмної системи...21 2.2 Проєктування архітектури системи класифікації голосової пошти ...22 2.3 Організація зберігання даних та ML-артефактів у Azure AI Foundry ...24 2.4 Формування та підготовка синтетичних тренувальних даних...26 2.5 Тонке налаштування SLM у середовищі Azure AI Foundry ...30 2.5.1 Serverless fine-tuning як початковий етап навчання...0 2.5.2 Навчання моделі на керованих обчислювальних ресурсах Azure ML...32 2.6 Реєстрація моделі та розгортання endpoint для інференсу...38 2.7 Опис програмного інтерфейсу взаємодії з моделлю ...40 2.8 Висновки до другого розділу...423 ТЕСТУВАННЯ, ОЦІНЮВАННЯ ТА НАВАНТАЖУВАЛЬНИЙ АНАЛІЗ ПРОГРАМНОЇ СИСТЕМИ...44 3.1 Загальна методологія тестування програмної системи ...44 3.2 Оцінювання якості класифікації голосової пошти ...45 3.3 Порівняльний аналіз використання малих та великих мовних моделей...47 3.4 Навантажувальне тестування програмної системи та аналіз масштабування ...51 3.5 Висновки до третього розділу ...56 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ ...58 4.1 Охорона праці...58 4.2 Стійкість роботи обчислювальної системи під час НС воєнного часу ...60 4.3 Висновки до четвертого розділу...62 ВИСНОВКИ ...63 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ...65 ДОДАТКИ .... 68 ДОДАТОК А – Тези конференції...69 ДОДАТОК Б – Лістинги коду системи ...70
URI (Уніфікований ідентифікатор ресурсу):	http://elartu.tntu.edu.ua/handle/lib/50561
Власник авторського права:	@ Містерман Петро Михайлович, 2025
Перелік літератури:	1. Brown T. et al. Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems (NeurIPS). 2020. 2. Bommasani R. et al. On the Opportunities and Risks of Foundation Models. Stanford: Center for Research on Foundation Models, 2021. 3. Beck K. et al. Manifesto for Agile Software Development. 2001. URL: https://agilemanifesto.org (дата звернення: 20.12.2025). 4. Sommerville I. Software Engineering. 10th Edition. Boston: Pearson, 2016. 768 p 5. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020. 6. Microsoft. Azure Machine Learning Documentation. 2024. URL: https://learn.microsoft.com/azure/machine-learning 7. Microsoft. Azure AI Foundry Overview. 2024. URL: https://learn.microsoft.com/azure/ai-foundry 8. Azure Machine Learning Architecture Overview. URL: https://learn.microsoft.com/en-us/azure/machine-learning/concept-azuremachine-learning-architecture 9. Azure AI Foundry Documentation. URL: https://learn.microsoft.com/uk-ua/azure/ai-foundry 10. Sculley D. et al. Hidden Technical Debt in Machine Learning Systems. Proceedings of the Neural Information Processing Systems Conference (NIPS). 2015. 11. Buyya R. et al. Cloud Computing: Principles and Paradigms. Hoboken: Wiley, 2019. 637 p. 12. Zhang S. et al. MLOps: Continuous Delivery and Automation Pipelines in Machine Learning. IEEE Software. 2020. 13. Fine-tune models using serverless APIs in Azure AI Foundry. URL:66 https://learn.microsoft.com/en-us/azure/ai-foundry/how-to/fine-tuneserverless?view=foundry-classic&tabs=chat-completion&pivots=foundryportal#prepare-data-for-fine-tuning 35. Методичні вказівки до виконання кваліфікаційної роботи магістра. URL: https://dl.tntu.edu.ua/content.php?cid=534814
Тип вмісту:	Master Thesis
Розташовується у зібраннях:	121 — інженерія програмного забезпечення, F2 Інженерія програмного забезпечення

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
dyplom_Misterman_2025.pdf		1,34 MB	Adobe PDF	Переглянути/відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора