Дослідження застосування великих мовних моделей для автоматизації генерації модульних тестів та аналізу результатів при перевірці WordPress плагінів

Вінніченко, Олександр Анатолійович; Vinnichenko, Oleksandr

Denne identifikatoren kan du bruke til å sitere eller lenke til denne innførselen: http://elartu.tntu.edu.ua/handle/lib/52127

Tittel:	Дослідження застосування великих мовних моделей для автоматизації генерації модульних тестів та аналізу результатів при перевірці WordPress плагінів
Alternative titler:	Study of the Application of Large Language Models for Automated Unit Test Generation and Result Analysis in WordPress Plugin Testing
Authors:	Вінніченко, Олександр Анатолійович Vinnichenko, Oleksandr
Affiliation:	ТНТУ ім. І. Пулюя, Факультет комп’ютерно-інформаційних систем і програмної інженерії, Кафедра комп’ютерних наук, м. Тернопіль, Україна
Bibliographic description (Ukraine):	{ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с.
Bibliographic reference (2015):	Вінніченко О. А. Дослідження застосування великих мовних моделей для автоматизації генерації модульних тестів та аналізу результатів при перевірці WordPress плагінів : робота на здобуття кваліфікаційного ступеня магістр : спец. 122 - комп’ютерні науки / наук. кер. В. А. Готович. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 87 с.
Utgivelsesdato:	26-mai-2026
Submitted date:	12-mai-2026
Date of entry:	1-jun-2026
Forlag:	ТНТУ ім. І.Пулюя, ФІС, м. Тернопіль, Україна
Country (code):	UA
Place of the edition/event:	Тернопіль
Supervisor:	Готович, Володимир Анатолійович Gotovych, Volodymyr
Committee members:	Савків, Володимир Богданович Savkiv, Volodymyr
UDC:	004.8:004.415.2:004.05
Emneord:	122 комп’ютерні науки автоматизація тестування великі мовні моделі генерація тестів chunking коду code chunking large language models (llms) prompt engineering repair loop test automation test generation wordpress plugins wordpress-плагіни wp unit tests
Page range:	87
Abstrakt:	Кваліфікаційна робота присвячена розробці системи автоматизованої генерації модульних PHPUnit-тестів для WordPress-плагінів на основі великих мовних моделей. У першому розділі проаналізовано сучасний стан тестування плагінів, динаміку вразливостей в екосистемі та ключові проблеми ручного тестування. У другому розділі досліджено інструменти генерації тестів, проведено порівняльний аналіз провідних моделей LLM та обґрунтовано вибір чотирирівневої методики prompt engineering і ітеративного repair loop. У третьому розділі описано архітектуру та реалізацію системи WP-TestLLM, проведено експериментальне дослідження на реальних плагінах, виконано статистичну перевірку гіпотези та оцінено практичну й економічну ефективність рішення. Об’єкт дослідження: процес тестування та забезпечення якості й безпеки WordPress-плагінів у масштабній та динамічній екосистемі відкритої системи управління контентом. Предмет дослідження: методи автоматизації генерації модульних PHPUnit-тестів та аналізу їх результатів за допомогою великих мовних моделей. The master's thesis is devoted to the development of a system for automated generation of unit PHPUnit tests for WordPress plugins based on large language models. The first chapter analyzes the current state of plugin testing, the dynamics of vulnerabilities in the ecosystem, and the key problems of manual testing. The second chapter examines existing test generation tools, provides a comparative analysis of leading LLM models, and substantiates the choice of a four-level prompt engineering methodology combined with an iterative repair loop. The third chapter describes the architecture and technical implementation of the WP-TestLLM system, presents an experimental study conducted on real plugins from the Crocoblock ecosystem, performs a statistical verification of the research hypothesis, and evaluates the practical and economic efficiency of the proposed solution. Object of research: the process of testing and ensuring the quality and security of WordPress plugins within the large-scale and dynamic ecosystem of an open-source content management system. Subject of research: methods of automating the generation of unit PHPUnit tests and analyzing their results using large language models.
Beskrivelse:	Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 26.05.2026р. на засіданні екзаменаційної комісії №33 у Тернопільському національному технічному університеті імені Івана Пулюя
Content:	Вступ 8 1 ХАРАКТЕРИСТИКА ПРОЦЕСУ ТЕСТУВАННЯ WORDPRESS-ПЛАГІНІВ ТА ЗАДАЧІ ЙОГО АВТОМАТИЗАЦІЇ 10 1.1 Аналіз сучасного стану вирішення задач тестування WordPress-плагінів 10 1.2 Модульне тестування wordpress-плагінів за допомогою phpunit та wp-unittestcase 12 1.3 Основні проблеми ручного тестування WordPress-плагінів 14 1.4 Інноваційні підходи до автоматизації тестування: від шаблонів до генеративного ШІ 16 1.5 Висновки до першого розділу 20 2 АНАЛІТИЧНИЙ ОГЛЯД МЕТОДІВ ГЕНЕРАЦІЇ ТЕСТІВ ЗА ДОПОМОГОЮ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ТА ОБҐРУНТУВАННЯ ВИБРАНОГО ПІДХОДУ 22 2.1 Огляд існуючих інструментів генерації тестів 22 2.2 Застосування LLM для генерації коду та тестів: сучасний стан досліджень (2023-2026) 24 2.3 Порівняльний аналіз доступних великих мовних моделей 25 2.4 Особливості інтеграції LLM з php/WordPress-екосистемою 27 2.5 Обґрунтування вибору архітектури та підходу 30 2.6 Висновки до другого розділу 36 3 РЕАЛІЗАЦІЯ, ЕКСПЕРИМЕНТАЛЬНЕ ДОСЛІДЖЕННЯ ТА ОЦІНКА ЕФЕКТИВНОСТІ СИСТЕМИ WP-TestLLM 38 3.1 Архітектура та технічна реалізація системи Wp-TestLLM 38 3.2 Методологія експериментального дослідження 49 3.3 Підготовка тестової вибірки плагінів та формування експериментальних даних 50 3.4 Порівняльний аналіз великих мовних моделей 52 3.5 Результати експериментів та їх інтерпретація 56 3.6 Оцінка ефективності системи та перевірка гіпотез 60 3.7 Практична та економічна доцільність впровадження системи Wp-TestLLM63 3.8 Обмеження дослідження та загрози валідності 65 3.9 Висновки до розділу 3 67 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 69 4.1 Охорона праці 69 4.2 Безпека в надзвичайних ситуаціях 72 4.3 Висновки до четвертого розділу 75 Висновки 77 Перелік джерел 80 Додатки
URI:	http://elartu.tntu.edu.ua/handle/lib/52127
ISBN:	{ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с. {ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с. {ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с. {ВІДКОРЕГУЙТЕ!!!} Прізвище І. Б. Назва : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „122 — комп’ютерні науки“ / І. Б. Прізвище. — Тернопіль: ТНТУ, РІК. — ХХ с.
Copyright owner:	© Вінніченко Олександр Анатолійович, 2026
References (Ukraine):	1. Chu, Bei, et al. Large Language Models for Unit Test Generation: Achievements, Challenges, and Opportunities. arXiv preprint arXiv:2511.21382 (2025). 2. Yang, Lin, et al. On the evaluation of large language models in unit test generation. Proceedings of the 39th IEEE/ACM International Conference on Automated Software Engineering. 2024. 3. Andrzejewski, Marcin, et al. Automated Test Generation Using Large Language Models. Data 10.10 (2025): 156. 4. Augusto, Cristian, et al. Large language models for software testing: A research roadmap. arXiv preprint arXiv:2509.25043 (2025). 5. Lops, A., et al. A system for automated unit test generation using large language models and assessment of generated test suites. arXiv 2024. arXiv preprint arXiv:2408.07846. 6. Ouédraogo, Wendkûuni C., et al. Prompt engineering in LLMs for automated unit test generation: A large-scale study. Empirical Software Engineering 31.4 (2026): 103. 7. Papachristou, Ioannis, Grigoris Dimitroulakos, and Costas Vassilakis. Automated Test Generation and Marking Using LLMs. Electronics 14.14 (2025): 2835. 8. Deo, Akhil. QAagent: A Multiagent System for Unit Test Generation via Natural Language Pseudocode (Student Abstract). Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 39. No. 28. 2025. 9. Silva, Esdras Caleb Oliveira, Roberta de Souza Coelho, and Lyrene Fernandes da Silva. LLMs as Test Generators: A Comparative Benchmarking Study. Simpósio Brasileiro de Engenharia de Software (SBES). SBC, 2025. 10. Brownlee, Alexander EI, et al. Large language model based mutations in genetic improvement. Automated Software Engineering 32.1 (2025): 15. 11. Dhaneshkumar, Tejaswini. Enhancing Security of WordPress Containers on AWS: A Multitool Vulnerability Analysis. Diss. Dublin, National College of Ireland, 2026. 12. Щоквартальний звіт про розвідку загроз WordPress – 4 квартал 2025 року. WordFence. URL: https://www.wordfence.com/blog/2026/02/quarterly-wordpress-threat-intelligence-report-q4-2025/. 13. Lin, Jiahuei, Mohammed Sayagh, and Ahmed E. Hassan. The Co-evolution of the WordPress Platform and its Plugins. ACM Transactions on Software Engineering and Methodology 32.1 (2023): 1-24. 14. Стан PHP 2025. JetBrains Blog. URL: https://blog.jetbrains.com/phpstorm/2025/10/state-of-php-2025/. 15. Георгінова, Тетяна. Інструменти для зниження вразливості від гібридних загроз. IX Науково-професійна конференція «Безпека та кризове управління – теорія та практика» (SeCMan) . Регіональна асоціація безпеки та кризового управління – RASEC S4 GLOSEC Global Security, 2023. 16. Звіт про вразливості WordPress за середину 2025 року. Patchstack. URL: https://patchstack.com/whitepaper/2025-mid-year-vulnerability-report/. 17. Martinez, Matias, and Xavier Franch. What's in a Benchmark? The Case of SWE-Bench in Automated Program Repair. arXiv preprint arXiv:2602.04449 (2026). 18. Liang, Jacky. The Novelty Bottleneck: A Framework for Understanding Human Effort Scaling in AI-Assisted Work.arXiv preprint arXiv:2603.27438 (2026). 19. Cavero, Francisco Javier, Juan C. Alonso, and Antonio Ruiz-Cortés. From static to intelligent: evolving SaaS pricing with LLMs. International Conference on Service-Oriented Computing. Singapore: Springer Nature Singapore, 2024. 20. Weber, Thomas, et al. Significant productivity gains through programming with large language models. Proceedings of the ACM on Human-Computer Interaction 8.EICS (2024): 1-29. 21. Gallone, Lorenzo. TIGER: Testing and Improving Generated Code with LLMs. MS thesis. University of Illinois at Chicago, 2025. 22. Schäfer, Max, et al. An empirical evaluation of using large language models for automated unit test generation. IEEE Transactions on Software Engineering 50.1 (2023): 85-105. 23. Le, Hung, et al. Coderl: Mastering code generation through pretrained models and deep reinforcement learning. Advances in Neural Information Processing Systems 35 (2022): 21314-21328. 24. Pornprasit, Chanathip, and Chakkrit Tantithamthavorn. Fine-tuning and prompt engineering for large language models-based code review automation. Information and Software Technology 175 (2024): 107523. 25. Adhikari, Divya Mani, et al. Exploring llms for automated generation and adaptation of questionnaires. Proceedings of the 7th ACM Conference on Conversational User Interfaces. 2025. 26. Examples of using LLM in PHP. GitHub. URL: https://github.com/ezimuel/php-llm-examples. 27. The best AI prompts for PHP developers – 2025 edition. Medium. URL: https://roman-huliak.medium.com/the-best-ai-prompts-for-developers-2025-edition-b72ba44345e2. 28. Wang, Chung-Yu. Application and Optimization of Prompt Engineering Techniques for Code Generation in Large Language Models. (2025). 29. He, Keyu, Max Li, and Joseph Liu. Enhancing Debugging Skills of LLMs with Prompt Engineering. (2024). 30. Cowan, Brendan, Yutaka Watanobe, and Atsushi Shirafuji. Enhancing programming learning with llms: Prompt engineering and flipped interaction. Proceedings of the 2023 4th Asia service sciences and software engineering conference. 2023. 31. SWE-bench Leaderboard. SWE-bench, 2026, www.swebench.com/. 32. Best AI Models for Coding in 2026 (Real-World Reviews). Faros AI, 29 Jan. 2026, www.faros.ai/blog/best-ai-model-for-coding-2026. 33. Guinness, Harry. The Best Large Language Models (LLMs) in 2026. Zapier, 5 Mar. 2026, zapier.com/blog/best-llm 34. Adhikari, Divya Mani, et al. Exploring LLMs for Automated Generation and Adaptation of Questionnaires. Proceedings of the 7th ACM Conference on Conversational User Interfaces, 2025, pp. 1–15. 35. Bladowski, Marcin. Testing LLM Outputs in PHPUnit – A Comprehensive Guide for PHP Developers. 2025. 36. Patel, S. Automated Code Generation with Large Language Models (LLMs). Medium, 2025, medium.com/@patel/automated-code-generation-with-llms. 37. A Guide to LLM Retrieval-Augmented Generation with PHP. Medium, 2025. 38. Dietrich, T. Generate Production-Ready Automation Code with AI (PHP Workflow Architect Prompt). 2025. 39. Kahur, K., and J. Su. Java Unit Testing with AI: An AI-Driven Prototype for Unit Test Generation. 2023. Updated 2025. 40. Application of Large Language Models in PHP Code Generation and Testing: Current State and Prospects. Proceedings of the International Conference on Software Engineering and AI, 2026. 41. W3Techs. Usage Statistics and Market Share of WordPress, May 2026. W3Techs, 2026. 42. Patchstack. 2025 Mid-Year WordPress Vulnerability Report. Patchstack, 2025. 43. Wordfence. Quarterly WordPress Threat Intelligence Report – Q4 2025. Wordfence, 2026. 44. WordPress Core Handbook. Writing PHP Tests. Make WordPress Core, 2017. 45. Schäfer, Max, Sarah Nadi, Aryaz Eghbali, and Frank Tip. An Empirical Evaluation of Using Large Language Models for Automated Unit Test Generation. IEEE Transactions on Software Engineering 50.1 (2024): 85–105. 46. Chu, Bei, Yang Feng, Kui Liu, Zifan Nan, Zhaoqiang Guo, and Baowen Xu. Large Language Models for Unit Test Generation: Achievements, Challenges, and the Road Ahead. arXiv preprint arXiv:2511.21382 (2025). 47. Chen, Mark, et al. Evaluating Large Language Models Trained on Code. arXiv preprint arXiv:2107.03374 (2021). 48. Li, Yujia, et al. Competition-Level Code Generation with AlphaCode. Science 378.6624 (2022): 1092–1097. 49. Le, Hung, Yue Wang, Akhilesh Deepak Gotmare, Silvio Savarese, and Steven C. H. Hoi. CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning. Advances in Neural Information Processing Systems 35 (2022): 21314–21328. 50. Yang, Lin, et al. On the Evaluation of Large Language Models in Unit Test Generation. Proceedings of the 39th IEEE/ACM International Conference on Automated Software Engineering (2024). 51. Augusto, Cristian, Antonia Bertolino, Guglielmo De Angelis, Francesca Lonetti, and Jesús Morán. Large Language Models for Software Testing: A Research Roadmap. arXiv preprint arXiv:2509.25043 (2025). 52. OWASP. OWASP Top 10 for Large Language Model Applications.”OWASP Foundation, 2025. 53. National Institute of Standards and Technology. Artificial Intelligence Risk Management Framework (AI RMF 1.0). NIST AI 100-1, 2023. 54. Wei, Jason, et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. Advances in Neural Information Processing Systems 35 (2022): 24824–24837. 55. Madaan, Aman, et al. Self-Refine: Iterative Refinement with Self-Feedback. Advances in Neural Information Processing Systems 36 (2023). 56. Yao, Shunyu, et al. ReAct: Synergizing Reasoning and Acting in Language Models. Proceedings of the 11th International Conference on Learning Representations (2023). 57. Lops, Andrea, Fedelucio Narducci, Azzurra Ragone, Michelantonio Trizio, and Claudio Bartolini. A System for Automated Unit Test Generation Using Large Language Models and Assessment of Generated Test Suites. arXiv preprint arXiv:2408.07846 (2024). 58. Jimenez, Carlos E., John Yang, Alexander Wettig, Shunyu Yao, Kexin Pei, Ofir Press, and Karthik Narasimhan. SWE-bench: Can Language Models Resolve Real-World GitHub Issues? Proceedings of the International Conference on Learning Representations (2024). 59. Weber, Thomas, et al. Significant Productivity Gains through Programming with Large Language Models. Proceedings of the ACM on Human-Computer Interaction 8.EICS (2024): 1–29. 60. NIST. Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile. NIST AI 600-1, 2024. 61. Санітарні норми мікроклімату виробничих приміщень: ДСН 3.3.6.042-99: затв. постановою Головного державного санітарного лікаря України від 01.12.1999 № 42. Київ: МОЗ України, 1999. 28 с. 62. Дизайн і ергономіка. Робоче місце для виконання робіт у положенні сидячи. Загальні ергономічні вимоги: ДСТУ 8604:2015. Київ: ДП «УкрНДНЦ», 2016. 18 с. 63. Ергономічні вимоги до роботи з відеотерміналами в офісі. Частина 5. Вимоги до компонування робочого місця та робочої пози: ДСТУ ISO 9241-5:2004 (ISO 9241-5:1998, IDT). Київ: ДП «УкрНДНЦ», 2005. 32 с. 64. Правила охорони праці під час експлуатації електронно-обчислювальних машин: затв. наказом Держгірпромнагляду України від 26.03.2010 № 65. Київ, 2010. 45 с. 65. Ергономіка робочого місця: як створити комфортні умови для роботи [Електронний ресурс] // Профпреса. 2024. URL: https://profpressa.com/news/ergonomika-robochogo-mistsia-iak-stvoriti-komfortni-umovi-dlia-roboti (дата звернення: 30.04.2026). 66. Кодекс цивільного захисту України: від 02.10.2012 № 5403-VI (зі змінами станом на 2026 рік) // Верховна Рада України. URL: https://zakon.rada.gov.ua/laws/show/5403-17 (дата звернення: 30.04.2026). 67. Про внесення змін до деяких законів України щодо захисту інформації та кіберзахисту державних інформаційних ресурсів, об’єктів критичної інформаційної інфраструктури: Закон України № 4336-IX від 27.03.2025 // Верховна Рада України. URL: https://zakon.rada.gov.ua/laws/show/4336-20 (дата звернення: 30.04.2026). 68. Інформаційна безпека, кібербезпека та захист конфіденційності. Системи керування інформаційною безпекою: ДСТУ ISO/IEC 27001:2023. Київ: ДП «УкрНДНЦ», 2023. 78 с. 69. Правила охорони праці під час експлуатації електронно-обчислювальних машин: затв. наказом Держгірпромнагляду України від 26.03.2010 № 65 (зі змінами). Київ, 2010. 45 с. 70. Готович, В. А., and В. А. Курян. "Дослідження ефективності розпізнавання рухів людини за координатами mediapipe pose." Матеріали ⅩⅣ Міжнародної науково-технічної конференції молодих учених та студентів „Актуальні задачі сучасних технологій “ (2025): 247-249. 71. Готович В., Попович В. Дослідження та розробка AI-асистента на основі моделі Mistral для середовища університету. Матеріали XIII науково-технічної конференції «Інформаційні моделі, системи та технології», 17-18 грудня 2025 року. – Т. : ТНТУ, 2025. – С. 40. – (Математичне моделювання) 72. Бонар В., Готович В. Методи машинного навчання для завчасного передбачення несправностей транспортного засобу на основі OBD-2 даних. Матеріали XIII науково-технічної конференції «Інформаційні моделі, системи та технології», 17-18 грудня 2025 року. – Т. : ТНТУ, 2025. – С. 25–26. – (Математичне моделювання) 73. Матійчук Л., Готович В., Бонар В. Порівняння ефективності методів некерованого машинного навчання для виявлення аномалій в OBD2 даних. Вимірювальна та обчислювальна техніка в технологічних процесах. Хмельницький національний університет. (1), 2025. С. 407–414. Галузь науки: технічні (28.12.2019) Категорiя: Б https://doi.org/10.31891/2219-9365-2025-81-52 74. Готович, В. А., Мачужак А В. Застосування методології CI/CD для автоматизації процесів тестування та розгортання програмного забезпечення. Матеріали XІ Міжнародної науково-практичної конференції молодих учених та студентів «АКТУАЛЬНІ ЗАДАЧІ СУЧАСНИХ ТЕХНОЛОГІЙ» – Тернопіль, 7-8 грудня 2022 року. С.131-132.
Content type:	Master Thesis
Vises i samlingene:	122 — комп’ютерні науки, F3 Комп’ютерні науки

Tilhørende filer:

Fil	Beskrivelse	Størrelse	Format
2026_KRM_SNnm-61_Vinnichenko_OA.pdf	Дипломна робота	2,14 MB	Adobe PDF	Vis/Åpne

Vis fullstendig innførsel

Alle innførsler i DSpace er beskyttet av copyright

Administrasjonsverktøy