Методи та засоби створення і розгортання інфраструктури комп'ютерних систем за допомогою генеративних алгоритмів машинного навчання

Островський, Андрій Ярославович; Ostrivskyi, Andrii

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/43332

Назва:	Методи та засоби створення і розгортання інфраструктури комп'ютерних систем за допомогою генеративних алгоритмів машинного навчання
Інші назви:	Methods and tools for creating and deploying computer system infrastructures using generative machine learning algorithms
Автори:	Островський, Андрій Ярославович Ostrivskyi, Andrii
Приналежність:	Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University
Бібліографічний опис:	Островський А. Я. Методи та засоби створення і розгортання інфраструктури комп'ютерних систем за допомогою генеративних алгоритмів машинного навчання : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „123 — комп’ютерна інженерія“ / А. Я. Островський. — Тернопіль: ТНТУ, 2023. — 85 с.
Bibliographic description:	Ostrivskyi A. Methods and tools for creating and deploying computer system infrastructures using generative machine learning algorithms : Master Thesis „123 — Computer Engineering“ / Andrii Ostrivskyi - Ternopil, TNTU, 2023 – 85 p.
Дата публікації:	17-гру-2023
Дата подання:	27-чер-2023
Дата внесення:	3-січ-2024
Видавництво:	Тернопільський національний технічний університет імені Івана Пулюя
Країна (код):	UA
Місце видання, проведення:	Тернопільський національний технічний університет імені Івана Пулюя
Науковий керівник:	Луцків, Андрій Мирославович Lutskiv, Andriy
Члени комітету:	Мудрик, Іван Ярославович Mudryk, Ivan
УДК:	004.048
Теми:	123 комп’ютерна інженерія інфраструктура метод розгортання машинне навчання method tool infrastructure algorithm deployment machine learning засіб алгоритм
Кількість сторінок:	85
Короткий огляд (реферат):	У кваліфікаційній роботі магістра проаналізовано життєвий цикл великих даних та визначено особливості етапів і процесів, характерних при опрацюванні великих даних. Визначено базові концепції великих мовних моделей з реалізацією генеративних алгоритмів і встановлено, що вони які дають змогу досліджувати статистичні шаблони, граматику та семантику людської мови та використовують потужні набори даних і відповідно значні апаратно-програмні ресурси. Запропоновано критерії продуктивності у процесі попереднього опрацювання запитів до моделей з генеративними алгоритмами: час формування першого токену, час генерації вихідного токену для кожного користувача, прихована затримка формування відповіді користувачам та пропускної здатності моделі. Розроблено метод та показники оптимізації використання ресурсів пам’яті та графічних процесорних ядер при формуванні висновків (відповідей) великими мовними моделями. Програмно імплементовано механізми прямого доступу до моделей з генеративними алгоритмами машинного навчання та експериментально доведено їх ефективність. The Master's thesis analyzed the life cycle of big data and identified the features of the stages and processes characteristic of big data processing. The basic concepts of large language models with the implementation of generative algorithms are defined and it is established that they enable the study of statistical patterns, grammar and semantics of human language and use powerful data sets and, accordingly, significant hardware and software resources. Performance criteria in the process of pre-processing requests to models with generative algorithms are proposed: the time of generating the first token, the time of generating the initial token for each user, the hidden delay of generating a response to users and the bandwidth of the model. The method and indicators for optimizing the use of memory resources and graphic processor cores when forming conclusions (answers) using large language models have been developed. Mechanisms of direct access to models with generative machine learning algorithms were implemented in software and their effectiveness was experimentally proven.
Зміст:	ВСТУП 8 РОЗДІЛ 1 АНАЛІЗ СУЧАСНОГО СТАНУ РОЗВИТКУ ТА ОРГАНІЗАЦІЇ ВЕЛИКИХ ДАНИХ 12 1.1. Аналіз базових понять і властивостей великих даних 12 1.2. Аналіз особливостей сучасного життєвого циклу інженерії великих даних 18 1.3. Аналіз базових концепцій LLM 21 1.4. Висновки до розділу 24 РОЗДІЛ 2 КРИТЕРІЇ ТА МЕТОДИ ЗАБЕЗПЕЧЕННЯ ОПТИМАЛЬНОСТІ ФУНКЦІОНУВАННЯ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ 25 2.1. Процес генерації тексту у великих мовних моделях 25 2.2. Визначення критеріїв обслуговування великих мовних моделей 26 2.3. Генерації висновків у LLM моделях 28 2.4. Пропускна здатність пам'яті 29 2.5. Використання пропускної здатності моделі 30 2.6. Порівняльний аналіз показників ефективності LLM моделей та ресурсів програмно-апаратної інфраструктури 34 2.7. Висновки до розділу 44 РОЗДІЛ 3 ОРГАНІЗАЦІЯ ЕКСПЕРИМЕНТІВ ЗАСТОСУВАННЯ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ З ГЕНЕРАТИВНИМИ АЛГОРИТМАМИ 46 3.1. Архітектура трансформерів 46 3.2. Принципи організації, налаштування і застосування попередньо навчених моделей машинного навчання 56 3.3. Імплементація прямого доступу до різних LLM 58 3.4. Модель GPT-3 58 3.5. Модель Text-to-Text Transfer Transformer 60 3.6. Модель BERT 62 3.7. Висновки до розділу 63 РОЗДІЛ 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 65 4.1. Охорона праці 65 4.2. Застосування основних способів та засобів в ході проведення невідкладних аварійно-рятувальних робіт на промисловому підприємстві 68 4.3. Вплив електромагнітного імпульсу (ЕМІ) ядерного вибуху на елементи виробництва та заходи захисту 71 ВИСНОВКИ 75 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 77 Додаток А Тези конференцій 80
URI (Уніфікований ідентифікатор ресурсу):	http://elartu.tntu.edu.ua/handle/lib/43332
Власник авторського права:	© Островський Андрій Ярославович, 2023 © Ostrivskyi Andrii, 2023
Перелік літератури:	1. What is a large language model (LLM)? URL: https://www.elastic.co/what-is/large-language-models (дата звернення: 10.09.2023). 2. API Reference. URL: https://platform.openai.com/docs/api-reference (дата звернення 10.09.2023). 3. Welcome to the OpenAI developer platform. URL: https://platform.openai.com/docs/overview (дата звернення: 10.09.2023). 4. Smolan R., Erwitt J. The Human Face of Big Data. Against All Odds Productions. 2012. P. 223. 5. Kleppmann M. Designing Data-intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. O'Reilly Media. 2017. P.590. 6. Popovych N., Lutskiv A., Mitsa O., Lyntvar O., Ivanova A. Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitalization and Text Corpora Platform Generation. Part I. CEUR Workshop Proceedings.2023. pp. 266–278. 7. Lutskiv A., Lutsyshyn R. Corpus-based translation automation of adaptable corpus translation module. CEUR Workshop Proceedings. 2021. pp. 511–527. 8. Lutskiv A., Popovych N. Big data-based approach to automated linguistic analysis effectiveness. Proceedings of the 2020 IEEE 3rd International Conference on Data Stream Mining and Processing, DSMP 2020. 2020. pp. 438– 443. 9. Lutskiv A., Popovych N. Big data approach to developing adaptable corpus tools. CEUR Workshop Proceedings. 2020. pp. 374–395. 10. Lutskiv A., Popovych N. Adaptable text corpus development for specific linguistic research. 2019 IEEE International Scientific-Practical Conference: Problems of Infocommunications Science and Technology, PIC S and T 2019 – Proceedings. 2019. pp. 217–223. 11. Технологія BERT від Google: що це, і як із цим жити? URL: https://sprava.ua/blog/tehnologija-bert (дата звернення: 28.09.2023). 12. Devlin J., Ming-Wei Chang, Lee K., Toutanova K.. BERT: Pre- training of Deep Bidirectional Transformers for Language Understanding. URL: https://arxiv.org/abs/1810.04805 (дата звернення: 02.10.2023). 13. Reference for built-in BERT algorithm. URL: https://cloud.google.com/ai-platform/training/docs/algorithms/reference/bert (дата звернення 30.09.2023). 14. Qiurui Chen. T5: a detailed explanation. URL: https://medium.com/analytics-vidhya/t5-a-detailed-explanation-a0ac9bc53e51 (дата звернення: 04.10.2023). 15. Exploring Transfer Learning with T5: the Text-To-Text Transfer Transformer. URL: https://blog.research.google/2020/02/exploring-transfer- learning-with-t5.html (дата звернення: 10.10.2023). 16. Паламар М.І., Стрембіцький М.О., Паламар А.М. Проектування комп’ютеризованих вимірювальних систем і комплексів. Навчальний посібник. Тернопіль: ТНТУ. 2019. 150 с. 17. Луцків А.М., Островський А.Я. Характеристики та сфера застосування великих мовних моделей. Матеріали ХІІ міжнародної науково-практичної конференції молодих учених та студентів «Актуальні задачі сучасних технологій» (6-7 грудня 2023 року). Тернопіль: ТНТУ. 2022. C. 452. 18. Луцків А.М., Островський А.Я. Організація доступу до моделі GPT-3 засобами мови Python. Матеріали ХІ науково-технічної конференції Тернопільського національного технічного університету імені Івана Пулюя «Інформаційні моделі, системи та технології» (13-14 грудня 2023 року). Тернопіль: ТНТУ. 2022. C. 168. 19. Shabliy N., Lupenko S., Lutsyk N., Yasniy O., Malyshevska O. Keystroke dynamics analysis using machine learning methods. Applied Computer Science. 2021. Vol. 17, No. 4. P. 75-83. 20. Лупенко С.А., Луцик Н.С., Луцків А.М., Осухівська Г.М., Тиш Є.В. Методичні вказівки до виконання кваліфікаційної роботи магістра для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль, ТНТУ. 2021. 34 с. 21. Palamar A., Karpinski M., Palamar M., Osukhivska H., Mytnyk M. Remote Air Pollution Monitoring System Based on Internet of Things. CEUR Workshop Proceedings, 2nd International Workshop on Information Technologies: Theoretical and Applied Problems (ITTAP 2022), Ternopil, Ukraine, November 22–24, 2022. Vol. 3309. P. 194-204. 22. T5 Finetuning Tips. URL: https://discuss.huggingface.co/t/t5- finetuning-tips/684 (дата звернення: 06.10.2023 р). 23. Жидецький В.Ц. Охорона праці користувачів комп´ютерів. Львів: Афіша, 2011. 176 с. 24. Желібо Е.Н. Безпека життєдіяльності: Навчальний посібник/ За редакцією Е.П. Желібо, В.М. Пічі. – Київ: «Караве-ла», Львів: «Новий світ - 2000», 2011. 320с. 25. Стадник І.Я., Зварич Н.М. Оцінка хімічної обстановки при аваріях на хімічно небезпечних об’єктах викидом (виливом) небезпечних хімічних речовин та застосуванні хімічної зброї. ТНТУ. 2020. 36 С.
Тип вмісту:	Master Thesis
Розташовується у зібраннях:	123 — комп’ютерна інженерія

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
Author_Notes_Andrii_Ostrivskyi.docx		10,54 kB	Microsoft Word XML	Переглянути/відкрити
Andrii_Ostrivskyi.pdf		2,26 MB	Adobe PDF	Переглянути/відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора