Please use this identifier to cite or link to this item: http://elartu.tntu.edu.ua/handle/lib/43332
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorЛуцків, Андрій Мирославович-
dc.contributor.advisorLutskiv, Andriy-
dc.contributor.authorОстровський, Андрій Ярославович-
dc.contributor.authorOstrivskyi, Andrii-
dc.date.accessioned2024-01-03T10:25:01Z-
dc.date.available2024-01-03T10:25:01Z-
dc.date.issued2023-12-17-
dc.date.submitted2023-06-27-
dc.identifier.citationОстровський А. Я. Методи та засоби створення і розгортання інфраструктури комп'ютерних систем за допомогою генеративних алгоритмів машинного навчання : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „123 — комп’ютерна інженерія“ / А. Я. Островський. — Тернопіль: ТНТУ, 2023. — 85 с.uk_UA
dc.identifier.urihttp://elartu.tntu.edu.ua/handle/lib/43332-
dc.description.abstractУ кваліфікаційній роботі магістра проаналізовано життєвий цикл великих даних та визначено особливості етапів і процесів, характерних при опрацюванні великих даних. Визначено базові концепції великих мовних моделей з реалізацією генеративних алгоритмів і встановлено, що вони які дають змогу досліджувати статистичні шаблони, граматику та семантику людської мови та використовують потужні набори даних і відповідно значні апаратно-програмні ресурси. Запропоновано критерії продуктивності у процесі попереднього опрацювання запитів до моделей з генеративними алгоритмами: час формування першого токену, час генерації вихідного токену для кожного користувача, прихована затримка формування відповіді користувачам та пропускної здатності моделі. Розроблено метод та показники оптимізації використання ресурсів пам’яті та графічних процесорних ядер при формуванні висновків (відповідей) великими мовними моделями. Програмно імплементовано механізми прямого доступу до моделей з генеративними алгоритмами машинного навчання та експериментально доведено їх ефективність.uk_UA
dc.description.abstractThe Master's thesis analyzed the life cycle of big data and identified the features of the stages and processes characteristic of big data processing. The basic concepts of large language models with the implementation of generative algorithms are defined and it is established that they enable the study of statistical patterns, grammar and semantics of human language and use powerful data sets and, accordingly, significant hardware and software resources. Performance criteria in the process of pre-processing requests to models with generative algorithms are proposed: the time of generating the first token, the time of generating the initial token for each user, the hidden delay of generating a response to users and the bandwidth of the model. The method and indicators for optimizing the use of memory resources and graphic processor cores when forming conclusions (answers) using large language models have been developed. Mechanisms of direct access to models with generative machine learning algorithms were implemented in software and their effectiveness was experimentally proven.uk_UA
dc.description.tableofcontentsВСТУП 8 РОЗДІЛ 1 АНАЛІЗ СУЧАСНОГО СТАНУ РОЗВИТКУ ТА ОРГАНІЗАЦІЇ ВЕЛИКИХ ДАНИХ 12 1.1. Аналіз базових понять і властивостей великих даних 12 1.2. Аналіз особливостей сучасного життєвого циклу інженерії великих даних 18 1.3. Аналіз базових концепцій LLM 21 1.4. Висновки до розділу 24 РОЗДІЛ 2 КРИТЕРІЇ ТА МЕТОДИ ЗАБЕЗПЕЧЕННЯ ОПТИМАЛЬНОСТІ ФУНКЦІОНУВАННЯ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ 25 2.1. Процес генерації тексту у великих мовних моделях 25 2.2. Визначення критеріїв обслуговування великих мовних моделей 26 2.3. Генерації висновків у LLM моделях 28 2.4. Пропускна здатність пам'яті 29 2.5. Використання пропускної здатності моделі 30 2.6. Порівняльний аналіз показників ефективності LLM моделей та ресурсів програмно-апаратної інфраструктури 34 2.7. Висновки до розділу 44 РОЗДІЛ 3 ОРГАНІЗАЦІЯ ЕКСПЕРИМЕНТІВ ЗАСТОСУВАННЯ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ З ГЕНЕРАТИВНИМИ АЛГОРИТМАМИ 46 3.1. Архітектура трансформерів 46 3.2. Принципи організації, налаштування і застосування попередньо навчених моделей машинного навчання 56 3.3. Імплементація прямого доступу до різних LLM 58 3.4. Модель GPT-3 58 3.5. Модель Text-to-Text Transfer Transformer 60 3.6. Модель BERT 62 3.7. Висновки до розділу 63 РОЗДІЛ 4 ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 65 4.1. Охорона праці 65 4.2. Застосування основних способів та засобів в ході проведення невідкладних аварійно-рятувальних робіт на промисловому підприємстві 68 4.3. Вплив електромагнітного імпульсу (ЕМІ) ядерного вибуху на елементи виробництва та заходи захисту 71 ВИСНОВКИ 75 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 77 Додаток А Тези конференцій 80uk_UA
dc.language.isoukuk_UA
dc.publisherТернопільський національний технічний університет імені Івана Пулюяuk_UA
dc.subject123 комп’ютерна інженеріяuk_UA
dc.subjectінфраструктураuk_UA
dc.subjectметодuk_UA
dc.subjectрозгортанняuk_UA
dc.subjectмашинне навчанняuk_UA
dc.subjectmethoduk_UA
dc.subjecttooluk_UA
dc.subjectinfrastructureuk_UA
dc.subjectalgorithmuk_UA
dc.subjectdeploymentuk_UA
dc.subjectmachine learninguk_UA
dc.subjectзасіб-
dc.subjectалгоритм-
dc.titleМетоди та засоби створення і розгортання інфраструктури комп'ютерних систем за допомогою генеративних алгоритмів машинного навчанняuk_UA
dc.title.alternativeMethods and tools for creating and deploying computer system infrastructures using generative machine learning algorithmsuk_UA
dc.typeMaster Thesis-
dc.rights.holder© Островський Андрій Ярославович, 2023uk_UA
dc.rights.holder© Ostrivskyi Andrii, 2023uk_UA
dc.contributor.committeeMemberМудрик, Іван Ярославович-
dc.contributor.committeeMemberMudryk, Ivan-
dc.coverage.placenameТернопільський національний технічний університет імені Івана Пулюяuk_UA
dc.format.pages85-
dc.subject.udc004.048uk_UA
dc.relation.references1. What is a large language model (LLM)? URL: https://www.elastic.co/what-is/large-language-models (дата звернення: 10.09.2023).uk_UA
dc.relation.references2. API Reference. URL: https://platform.openai.com/docs/api-reference (дата звернення 10.09.2023).uk_UA
dc.relation.references3. Welcome to the OpenAI developer platform. URL: https://platform.openai.com/docs/overview (дата звернення: 10.09.2023).uk_UA
dc.relation.references4. Smolan R., Erwitt J. The Human Face of Big Data. Against All Odds Productions. 2012. P. 223.uk_UA
dc.relation.references5. Kleppmann M. Designing Data-intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. O'Reilly Media. 2017. P.590.uk_UA
dc.relation.references6. Popovych N., Lutskiv A., Mitsa O., Lyntvar O., Ivanova A. Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitalization and Text Corpora Platform Generation. Part I. CEUR Workshop Proceedings.2023. pp. 266–278.uk_UA
dc.relation.references7. Lutskiv A., Lutsyshyn R. Corpus-based translation automation of adaptable corpus translation module. CEUR Workshop Proceedings. 2021. pp. 511–527.uk_UA
dc.relation.references8. Lutskiv A., Popovych N. Big data-based approach to automated linguistic analysis effectiveness. Proceedings of the 2020 IEEE 3rd International Conference on Data Stream Mining and Processing, DSMP 2020. 2020. pp. 438– 443.uk_UA
dc.relation.references9. Lutskiv A., Popovych N. Big data approach to developing adaptable corpus tools. CEUR Workshop Proceedings. 2020. pp. 374–395.uk_UA
dc.relation.references10. Lutskiv A., Popovych N. Adaptable text corpus development for specific linguistic research. 2019 IEEE International Scientific-Practical Conference: Problems of Infocommunications Science and Technology, PIC S and T 2019 – Proceedings. 2019. pp. 217–223.uk_UA
dc.relation.references11. Технологія BERT від Google: що це, і як із цим жити? URL: https://sprava.ua/blog/tehnologija-bert (дата звернення: 28.09.2023).uk_UA
dc.relation.references12. Devlin J., Ming-Wei Chang, Lee K., Toutanova K.. BERT: Pre- training of Deep Bidirectional Transformers for Language Understanding. URL: https://arxiv.org/abs/1810.04805 (дата звернення: 02.10.2023).uk_UA
dc.relation.references13. Reference for built-in BERT algorithm. URL: https://cloud.google.com/ai-platform/training/docs/algorithms/reference/bert (дата звернення 30.09.2023).uk_UA
dc.relation.references14. Qiurui Chen. T5: a detailed explanation. URL: https://medium.com/analytics-vidhya/t5-a-detailed-explanation-a0ac9bc53e51 (дата звернення: 04.10.2023).uk_UA
dc.relation.references15. Exploring Transfer Learning with T5: the Text-To-Text Transfer Transformer. URL: https://blog.research.google/2020/02/exploring-transfer- learning-with-t5.html (дата звернення: 10.10.2023).uk_UA
dc.relation.references16. Паламар М.І., Стрембіцький М.О., Паламар А.М. Проектування комп’ютеризованих вимірювальних систем і комплексів. Навчальний посібник. Тернопіль: ТНТУ. 2019. 150 с.uk_UA
dc.relation.references17. Луцків А.М., Островський А.Я. Характеристики та сфера застосування великих мовних моделей. Матеріали ХІІ міжнародної науково-практичної конференції молодих учених та студентів «Актуальні задачі сучасних технологій» (6-7 грудня 2023 року). Тернопіль: ТНТУ. 2022. C. 452.uk_UA
dc.relation.references18. Луцків А.М., Островський А.Я. Організація доступу до моделі GPT-3 засобами мови Python. Матеріали ХІ науково-технічної конференції Тернопільського національного технічного університету імені Івана Пулюя «Інформаційні моделі, системи та технології» (13-14 грудня 2023 року). Тернопіль: ТНТУ. 2022. C. 168.uk_UA
dc.relation.references19. Shabliy N., Lupenko S., Lutsyk N., Yasniy O., Malyshevska O. Keystroke dynamics analysis using machine learning methods. Applied Computer Science. 2021. Vol. 17, No. 4. P. 75-83.uk_UA
dc.relation.references20. Лупенко С.А., Луцик Н.С., Луцків А.М., Осухівська Г.М., Тиш Є.В. Методичні вказівки до виконання кваліфікаційної роботи магістра для студентів спеціальності 123 «Комп’ютерна інженерія» другого (магістерського) рівня вищої освіти усіх форм навчання. Тернопіль, ТНТУ. 2021. 34 с.uk_UA
dc.relation.references21. Palamar A., Karpinski M., Palamar M., Osukhivska H., Mytnyk M. Remote Air Pollution Monitoring System Based on Internet of Things. CEUR Workshop Proceedings, 2nd International Workshop on Information Technologies: Theoretical and Applied Problems (ITTAP 2022), Ternopil, Ukraine, November 22–24, 2022. Vol. 3309. P. 194-204.uk_UA
dc.relation.references22. T5 Finetuning Tips. URL: https://discuss.huggingface.co/t/t5- finetuning-tips/684 (дата звернення: 06.10.2023 р).uk_UA
dc.relation.references23. Жидецький В.Ц. Охорона праці користувачів комп´ютерів. Львів: Афіша, 2011. 176 с.uk_UA
dc.relation.references24. Желібо Е.Н. Безпека життєдіяльності: Навчальний посібник/ За редакцією Е.П. Желібо, В.М. Пічі. – Київ: «Караве-ла», Львів: «Новий світ - 2000», 2011. 320с.uk_UA
dc.relation.references25. Стадник І.Я., Зварич Н.М. Оцінка хімічної обстановки при аваріях на хімічно небезпечних об’єктах викидом (виливом) небезпечних хімічних речовин та застосуванні хімічної зброї. ТНТУ. 2020. 36 С.-
dc.identifier.citationenOstrivskyi A. Methods and tools for creating and deploying computer system infrastructures using generative machine learning algorithms : Master Thesis „123 — Computer Engineering“ / Andrii Ostrivskyi - Ternopil, TNTU, 2023 – 85 p.uk_UA
dc.contributor.affiliationТернопільський національний технічний університет імені Івана Пулюяuk_UA
dc.contributor.affiliationTernopil Ivan Puluj National Technical Universityuk_UA
dc.coverage.countryUAuk_UA
Appears in Collections:123 — комп’ютерна інженерія

Files in This Item:
File Description SizeFormat 
Author_Notes_Andrii_Ostrivskyi.docx10,54 kBMicrosoft Word XMLView/Open
Andrii_Ostrivskyi.pdf2,26 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Admin Tools