Utilizza questo identificativo per citare o creare un link a questo documento:
http://elartu.tntu.edu.ua/handle/lib/50851| Titolo: | Дослідження та розробка AI-асистента на основі моделі Mistral для середовища університету |
| Titoli alternativi: | Research and Development of an AI Assistant Based on the Mistral Model for the University Environment |
| Autori: | Попович, Валерій Валерійович Popovych, Valerii |
| Affiliation: | ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна |
| Bibliographic description (Ukraine): | Попович В. В. Дослідження та розробка AI-асистента на основі моделі Mistral для середовища університету : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 - комп’ютерні науки / наук. кер. В. А. Готович. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2025. 85 с. |
| Bibliographic reference (2015): | Попович В. В. Дослідження та розробка AI-асистента на основі моделі Mistral для середовища університету : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 «Комп’ютерні науки» / наук. кер. В. А. Готович. Тернопіль : ТНТУ, 2025. 85 с. |
| Data: | 22-dic-2025 |
| Submitted date: | 8-dic-2025 |
| Date of entry: | 2-gen-2026 |
| Editore: | ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна |
| Country (code): | UA |
| Place of the edition/event: | Тернопіль |
| Supervisor: | Готович, Володимир Анатолійович Gotovych, Volodymyr |
| Committee members: | Ясній, Олег Петрович Yasniy, Oleg |
| UDC: | 004.89:378.4 |
| Parole chiave: | 122 комп’ютерні науки векторна база даних великі мовні моделі інтелектуальний асистент локальне розгортання нейронні мережі освіта штучний інтелект ai assistant artificial intelligence education intelligent assistant langchain llm local deployment mistral neural networks rag vector database |
| Page range: | 85 |
| Abstract: | Кваліфікаційна робота присвячена дослідженню та розробці інтелектуального AI-асистента для підтримки навчального процесу в університеті. В основу системи покладено велику мовну модель Mistral, розгорнуту локально для забезпечення приватності даних. У першому розділі проаналізовано сучасні тренди використання генеративного ШІ в освіті та оглянуто архітектурні підходи до створення чат-ботів. Другий розділ містить опис технології RAG (Retrieval-Augmented Generation), яка дозволяє асистенту надавати точні відповіді на основі внутрішньої документації університету та навчальних матеріалів. У третьому розділі представлено практичну реалізацію системи з використанням LangChain та векторної бази даних, а також результати тестування якості відповідей та швидкодії. Робота включає обґрунтування економічної доцільності проекту, заходи з охорони праці та аналіз екологічного впливу обчислювальних систем The qualification work is devoted to the research and development of an intelligent AI assistant to support the educational process at the university. The system is based on the Mistral large language model, deployed locally to ensure data privacy. The first chapter analyzes modern trends in the use of generative AI in education and reviews architectural approaches to creating chatbots. The second chapter describes the RAG (Retrieval-Augmented Generation) technology, which allows the assistant to provide accurate answers based on the university's internal documentation and educational materials. The third chapter presents the practical implementation of the system using LangChain and a vector database, as well as the results of testing the response quality and performance. The work includes economic feasibility justification, labor protection measures, and an analysis of the environmental impact of computing systems |
| Descrizione: | Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 22.12.2025р. на засіданні екзаменаційної комісії №32 у Тернопільському національному технічному університеті імені Івана Пулюя |
| Content: | ВСТУП 6 1 ТЕОРЕТИЧНІ ОСНОВИ ТА АНАЛІЗ СУЧАСНИХ ТЕХНОЛОГІЙ ШІ В ОСВІТІ 9 1.1 Роль генеративного штучного інтелекту у вищій освіті 9 1.2 Огляд архітектур великих мовних моделей (LLM) 14 1.3 Порівняльний аналіз відкритих моделей: Mistral, Llama, Falcon 19 Висновок до першого розділу 24 2 ПРОЕКТУВАННЯ СИСТЕМИ AI-АСИСТЕНТА 25 2.1 Концепція Retrieval-Augmented Generation (RAG) 25 2.2 Архітектура системи та вибір технологічного стеку 30 2.3 Розробка стратегії індексації та пошуку в базі знань 35 Висновок до другого розділу 40 3 ПРАКТИЧНА РЕАЛІЗАЦІЯ ТА ДОСЛІДЖЕННЯ МОДЕЛІ 41 3.1 Розгортання моделі Mistral та налаштування оточення 41 3.2 Реалізація програмних модулів на базі LangChain 46 3.3 Експериментальна оцінка точності та продуктивності 51 3.4 Інтерфейс взаємодії та тестування сценаріїв підтримки 56 Висновок до третього розділу 61 4 ОБҐРУНТУВАННЯ ЕКОНОМІЧНОЇ ЕФЕКТИВНОСТІ 62 5 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 76 6 ЕКОЛОГІЯ 82 ЗАГАЛЬНІ ВИСНОВКИ 84 СПИСОК ЛІТЕРАТУРИ 85 |
| URI: | http://elartu.tntu.edu.ua/handle/lib/50851 |
| Copyright owner: | © Попович Валерій Валерійович, 2025 |
| References (Ukraine): | 1. Vaswani A., Shazeer N., Parmar N. et al. Attention Is All You Need // Advances in Neural Information Processing Systems. 2017. Vol. 30. P. 5998–6008. 2. Lewis P., Perez E., Piktus A. et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks // Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 9459–9474. 3. Zhao W. X., Zhou K., Li J. et al. A Survey of Large Language Models // arXiv preprint arXiv:2303.18223. 2023. DOI: 10.48550/arXiv.2303.18223. 4. Manning C. D., Raghavan P., Schütze H. Introduction to Information Retrieval. Cambridge : Cambridge University Press, 2008. 482 p. 5. Reimers N., Gurevych I. Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks // Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing. 2019. P. 3982–3992. 6. Bang Y. et al. A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity // arXiv preprint arXiv:2302.04023. 2023. 7. Jiang A. Q., Sablayrolles A., Mensch A. et al. Mistral 7B // arXiv preprint arXiv:2310.06825. 2023. DOI: 10.48550/arXiv.2310.06825. 8. Ollama Documentation [Електронний ресурс]. – Режим доступу: https://ollama.ai/docs (дата звернення: 10.05.2024). 9. LangChain AI. LangChain Documentation [Електронний ресурс]. – Режим доступу: https://python.langchain.com/ (дата звернення: 12.05.2024). 10. ChromaDB Documentation. The AI-native open-source embedding database [Електронний ресурс]. – Режим доступу: https://docs.trychroma.com/ (дата звернення: 12.05.2024). 11. PyMuPDF Documentation. PDF processing in Python [Електронний ресурс]. – Режим доступу: https://pymupdf.readthedocs.io/ (дата звернення: 15.05.2024). 12. Open LLM Leaderboard. Hugging Face [Електронний ресурс]. – Режим доступу: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard (дата звернення: 01.05.2024). 13. Kocmi T., Federmann C. Large Language Models Are State-of-the-Art Evaluators of Translation Quality // arXiv preprint arXiv:2302.14520. 2023. 14. Chen D. Building an Educational Chatbot: Challenges and Opportunities // Journal of Educational Technology Systems. 2023. Vol. 51, Issue 2. P. 125–138. 15. Глибоке навчання: підручник / І. В. Крак, О. В. Бармак, С. О. Тернов. – Київ : ВПЦ «Київський університет», 2022. – 368 с. 16. Touvron H., Martin L., Stone K. et al. Llama 2: Open Foundation and Fine-Tuned Chat Models // arXiv preprint arXiv:2307.09288. 2023. 17. НПАОП 0.00-7.15-18. Вимоги до безпеки та захисту здоров’я працівників під час роботи з екранними пристроями : затв. Наказом Міністерства соціальної політики України від 14.02.2018 № 207. Офіційний вісник України. 2018. № 34. Ст. 1216. 18. ДСТУ EN ISO 9241-5:2022. Ергономіка взаємодії людина-система. Частина 5. Схема робочої станції та вимоги до постави (EN ISO 9241-5:1999, IDT; ISO 9241-5:1998, IDT). Київ : ДП «УкрНДНЦ», 2023. 19. Johnson J., Douze M., Jégou H. Billion-scale similarity search with GPUs // IEEE Transactions on Big Data. 2019. Vol. 7, no. 3. P. 535–547. 20. Malkov Y. A., Yashunin D. A. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2018. Vol. 42, no. 4. P. 824–836. 21. Zhang Y., Li Y., Cui L. et al. Siren's Song in the AI Ocean: A Survey on Hallucination in Large Language Models // arXiv preprint arXiv:2309.01219. 2023. 22. Liu Y. et al. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing // ACM Computing Surveys. 2023. Vol. 55, no. 9. P. 1–35. 23. Radford A., Wu J., Child R. et al. Language Models are Unsupervised Multitask Learners // OpenAI Blog. 2019. Vol. 1, no. 8. P. 9. 24. Висоцька В. А., Чирун Л. Б. Технології обробки природної мови : навч. посіб. – Львів : Видавництво Львівської політехніки, 2020. – 312 с. 25. Ситник В. А. Інтелектуальні системи підтримки прийняття рішень : навч. посіб. – Харків : ХНУРЕ, 2019. – 264 с. 26. Bubeck S. et al. Sparks of Artificial General Intelligence: Early experiments with GPT-4 // arXiv preprint arXiv:2303.12712. 2023. 27. Wei J. et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models // Advances in Neural Information Processing Systems. 2022. Vol. 35. 28. Gao Y. et al. Retrieval-Augmented Generation for Large Language Models: A Survey // arXiv preprint arXiv:2312.10997. 2023. 29. Beautiful Soup Documentation. Crummy [Електронний ресурс]. – Режим доступу: https://www.crummy.com/software/BeautifulSoup/bs4/doc/ (дата звернення: 18.05.2024). 30. Requests: HTTP for Humans. Documentation [Електронний ресурс]. – Режим доступу: https://requests.readthedocs.io/ (дата звернення: 18.05.2024). 31. Van Rossum G., Drake F. L. Python 3 Reference Manual. Scotts Valley, CA: CreateSpace, 2009. 242 p. 32. Купріянов О. В. Використання штучного інтелекту в освітньому процесі закладів вищої освіти // Інформаційні технології і засоби навчання. 2023. Т. 95, № 3. С. 1–15. 33. Salton G., McGill M. J. Introduction to Modern Information Retrieval. New York : McGraw-Hill, 1983. 448 p. 34. Robertson S., Zaragoza H. The Probabilistic Relevance Framework: BM25 and Beyond // Foundations and Trends in Information Retrieval. 2009. Vol. 3, no. 4. P. 333–389. 35. Raffel C. et al. Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer // Journal of Machine Learning Research. 2020. Vol. 21. P. 1–67. 36. Dettmers T. et al. QLoRA: Efficient Finetuning of Quantized LLMs // arXiv preprint arXiv:2305.14314. 2023. 37. Kwon W. et al. Efficient Memory Management for Large Language Model Serving with PagedAttention // Proceedings of the 29th Symposium on Operating Systems Principles. 2023. 38. Ouyang L. et al. Training language models to follow instructions with human feedback // Advances in Neural Information Processing Systems. 2022. Vol. 35. P. 27730–27744. 39. Wolf T. et al. Transformers: State-of-the-Art Natural Language Processing // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing. 2020. P. 38–45. 40. Бісікало О. В., Ковальчук О. М. Методи та засоби NLP для аналізу текстового контенту // Вісник Вінницького політехнічного інституту. 2021. № 2. С. 65–72. 41. Тимочко В. О., Касянчук М. М. Архітектура чат-бота для інформаційної підтримки навчального процесу // Комп’ютерно-інтегровані технології: освіта, наука, виробництво. 2022. № 47. С. 112–118. 42. Мельник А. О., Кіт І. В. Застосування великих мовних моделей для автоматизації обробки звернень // Вісник Національного університету "Львівська політехніка". Серія: Інформаційні системи та мережі. 2023. № 13. С. 45–54. 43. Papineni K., Roukos S., Ward T., Zhu W. J. BLEU: a method for automatic evaluation of machine translation // Proceedings of the 40th annual meeting on association for computational linguistics. 2002. P. 311–318. 44. Lin C. Y. ROUGE: A package for automatic evaluation of summaries // Text summarization branches out. 2004. P. 74–81. 45. Gilardi F., Alizadeh M., Kubli M. ChatGPT outperforms crowd workers for text-annotation tasks // Proceedings of the National Academy of Sciences. 2023. Vol. 120, no. 30. 46. McKinney W. Data Structures for Statistical Computing in Python // Proceedings of the 9th Python in Science Conference. 2010. P. 51–56. 47. Harris C. R. et al. Array programming with NumPy // Nature. 2020. Vol. 585. P. 357–362. 48. Paszke A. et al. PyTorch: An Imperative Style, High-Performance Deep Learning Library // Advances in Neural Information Processing Systems. 2019. Vol. 32. 49. Закон України «Про захист персональних даних» від 01.06.2010 № 2297-VI // Відомості Верховної Ради України. – 2010. – № 34. – Ст. 481. 50. Закон України «Про вищу освіту» від 01.07.2014 № 1556-VII // Відомості Верховної Ради України. – 2014. – № 37-38. – Ст. 2004. 51. Закон України «Про охорону праці» від 14.10.1992 № 2694-XII // Відомості Верховної Ради України. – 1992. – № 49. – Ст. 668. 52. Кодекс цивільного захисту України від 02.10.2012 № 5403-VI // Відомості Верховної Ради України. – 2013. – № 34-35. – Ст. 458. 53. ДСТУ 8302:2015. Інформація та документація. Бібліографічне посилання. Загальні положення та правила складання. – Введ. 2016–07–01. – Київ : ДП «УкрНДНЦ», 2016. – 17 с. 54. ДСТУ 3008:2015. Інформація та документація. Звіти у сфері науки і техніки. Структура та правила оформлення. – Введ. 2017–07–01. – Київ : ДП «УкрНДНЦ», 2016. – 26 с. 55. ДСанПіН 3.3.2.007-98. Державні санітарні правила і норми роботи з візуальними дисплейними терміналами електронно-обчислювальних машин. – Затв. Постановою Головного державного санітарного лікаря України від 10.12.1998 № 7. 56. ДСТУ EN 60950-1:2015. Обладнання інформаційних технологій. Безпека. Частина 1. Загальні вимоги. – Київ : ДП «УкрНДНЦ», 2016. 57. ДСТУ EN ISO 9241-11:2022. Ергономіка взаємодії людина-система. Частина 11. Придатність до використання: визначення та поняття. – Київ : ДП «УкрНДНЦ», 2023. 58. НПАОП 0.00-1.28-10. Правила охорони праці під час експлуатації електронно-обчислювальних машин. – Затв. Наказом Держгірпромнагляду № 65 від 26.03.2010. 59. ISO/IEC 9126-1:2001. Software engineering – Product quality – Part 1: Quality model. Geneva : ISO, 2001. 26 p. 60. ISO/IEC 25010:2011. Systems and software engineering – Systems and software Quality Requirements and Evaluation (SQuaRE) – System and software quality models. Geneva : ISO, 2011. 34 p. 61. Словник української мови : в 11 т. / АН УРСР. Інститут мовознавства; за ред. І. К. Білодіда. – Київ : Наукова думка, 1970–1980. 62. Гнатюк С. О. Кібербезпека та захист інформаційних систем : підручник. – Київ : НАУ, 2020. – 384 с. 63. Л.В. Волинець, Н.А. Гарматюк, В.А. Готович. Великі за обсягом набори біомедичних даних та машинне навчання. Збірник тез доповідей XІI Міжнародної науково-практичної конференції молодих учених та студентів «Актуальні задачі сучасних технологій» – Тернопіль, 6-7 грудня 2023 року. с. 370-371. https://elartu.tntu.edu.ua/handle/lib/43843 64. Петрик М. Р., Петрик О. Ю. Моделювання програмного забезпечення : наук.-метод. посіб. Тернопіль : Вид-во ТНТУ імені Івана Пулюя, 2015. 200 с. 65. Kharchenko A., Bodnarchuk І., Yatcysyn V. The Method for Comparative Evaluation of Software Architecture with Accounting of Trade-offs // American Journal of Information Systems. 2014. Vol. 2, no. 1. P. 20–25. URL: http://pubs.sciepub.com/ajis/2/1/5/. 66. Tymoshchuk D., Yasniy O., Mytnyk M., Zagorodna N., Tymoshchuk V. Detection and classification of DDoS flooding attacks by machine learning method // CEUR Workshop Proceedings. 2024. Vol. 3842. P. 184–195. 67. Konovalenko I., Maruschak P., Brevus V. Steel surface defect detection using an ensemble of deep residual neural networks // Journal of Computing and Information Science in Engineering. 2022. Vol. 22, no. 1. P. 014501. 68. Duda O., Kochan V., Kunanets N., Matsiuk O., Pasichnyk V., Sachenko A., Pytlenko T. Data processing in IoT for smart city systems // Proceedings of the 10th IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications (IDAACS). Metz, France, 2019. Vol. 1. P. 96–99. 69. Матійчук Л., Готович В., Бонар В. Порівняння ефективності методів некерованого машинного навчання для виявлення аномалій в OBD2 даних. Вимірювальна та обчислювальна техніка в технологічних процесах. Хмельницький національний університет. (1), 2025. С. 407–414. https://doi.org/10.31891/2219-9365-2025-81-52 |
| Content type: | Master Thesis |
| È visualizzato nelle collezioni: | 122 — комп’ютерні науки |
File in questo documento:
| File | Descrizione | Dimensioni | Formato | |
|---|---|---|---|---|
| Mag_2025_SNm_61_Popovych_V_V.pdf | Дипломна робота | 2,31 MB | Adobe PDF | Visualizza/apri |
Tutti i documenti archiviati in DSpace sono protetti da copyright. Tutti i diritti riservati.
Strumenti di amministrazione