Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://elartu.tntu.edu.ua/handle/lib/45992
Назва: | Kubernetes кластер в гібридній хмарі для виконання завдань Big Data |
Інші назви: | Kubernetes cluster in a hybrid cloud for Big Data tasks |
Автори: | Андруньків, Сергій Романович Andrunkiv, Serhii |
Приналежність: | Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University |
Бібліографічний опис: | Андруньків С. Р. Kubernetes кластер в гібридній хмарі для виконання завдань Big Data : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 123 — комп’ютерна інженерія / наук. кер. А. М. Луцків. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2024. 88 с. |
Дата публікації: | 17-чер-2024 |
Дата подання: | 24-чер-2024 |
Дата внесення: | 9-лип-2024 |
Видавництво: | Тернопільський національний технічний університет імені Івана Пулюя |
Країна (код): | UA |
Місце видання, проведення: | Тернопільський національний технічний університет імені Івана Пулюя |
Науковий керівник: | Луцків, Андрій Мирославович Lutskiv, Andriy |
Члени комітету: | Гладьо, Юрій Богданович Gladio, Yurii |
УДК: | 004.4 |
Теми: | КластерKubernetes Ansible Kubespray Helm YAML Terraform інфраструктура POD гібридна хмара Anthos GCP GKE AWS EKS контейнер Docker Big Data Spark Scala. Cluster infrastructure hybrid cloud container Scala |
Кількість сторінок: | 88 |
Короткий огляд (реферат): | В ході виконання кваліфікаційної роботи бакалавра було створено гібридну хмару на інфраструктурах Google та Amazon з використанням Google Anthos, на якій розгорнуто та налаштовано Kubernetes кластер для запуску Spark-задач у Docker-контейнерах.
Пояснювальна записка кваліфікаційної роботи містить чотири розділи.
У першому розділі обгрунтовується актуальність теми, визначаються потреби до розгортання Kubernetes кластера у гібридній хмарі. Визначаються вимоги до його продуктивності, масштабування, вибір Big Data технологій, а також коротко описуються принципи роботи використовуваних технологій
Другий розділ присвячений розробці архітектури та функціонування Kubernetes кластера на гібридній хмарній інфраструктурі, враховуючи специфіку задач Big Data. Крім цього, тут розглядаються конкретні інструменти для створення хмари, розгортання кластера та написання додатків із врахуванням особливостей роботи з ними та їх обгрунтованому виборі.
У третьому розділі реалізовується розгортання Kubernetes кластера у гібридній хмарі провайдерів GCP та AWS і написання додатків для кластера.
Четвертий розділ присвячений аспектам безпеки життєдіяльності та основи охорони праці. In the course of the bachelor's thesis, a hybrid cloud was created on Google and Amazon infrastructures using Google Anthos, on which a Kubernetes cluster was deployed and configured to run Spark tasks in Docker containers. The explanatory note of the qualification work contains four sections. The first section substantiates the relevance of the topic, identifies the needs for deploying a Kubernetes cluster in a hybrid cloud. It defines the requirements for its performance, scaling, choice of Big Data technologies, and briefly describes the principles of operation of the technologies used. The second section is devoted to the development of the architecture and operation of a Kubernetes cluster on a hybrid cloud infrastructure, taking into account the specifics of Big Data tasks. In addition, it discusses specific tools for creating a cloud, deploying a cluster, and writing applications, taking into account the peculiarities of working with them and their reasonable choice. The third section describes how to deploy a Kubernetes cluster in a hybrid cloud of GCP and AWS providers and write applications for the cluster. The fourth section is devoted to the aspects of life safety and the basics of labor protection. |
Зміст: | ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ 8 ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ ТЕХНІЧНОГО ЗАВДАННЯ 11 1.1 Аналіз вимог до гібридної хмарної системи 11 1.2 Загальні принципи розгортання Kubernetes кластера 12 1.3 Створення гібридної хмари та розгортання у ній кластера 14 1.4 Реалізація та розгортання додатків Big Data 17 РОЗДІЛ 2 ПРОЄКТНА ЧАСТИНА 20 2.1 Загальна архітектура роботи кластера 20 2.2 Обґрунтування вибору інструментів для розгортання кластера 22 2.2.1 Платформа Kubernetes 22 2.2.2 Мова розмітки та опису даних YAML 23 2.2.3 Утиліта Terraform 23 2.2.4 Kubernetes Dashboard 25 2.3 Огляд інструментів для розгортання кластера у гібридній хмарі 25 2.3.1 Платформи GCP та GKE 26 2.3.2 Сховище Google Cloud Storage 26 2.3.3 Платформи AWS та EKS 26 2.3.4 Платформа Google Anthos 27 2.4 Принципи роботи Apache Spark у Kubernetes 29 2.5 Загальна послідовність розгортання кластера та інтеграції Spark-додатків 32 РОЗДІЛ 3 ПРАКТИЧНА ЧАСТИНА 35 3.1 Проєкти, ролі і правила для платформ GCP та AWS 35 3.2 Розгортання кластера у гібридній хмарі 39 3.3 Створення та налаштування сховища даних GCS 49 3.4 Створення Spark-додатків та формування образів Docker 51 3.5 Розгортання і запуск Spark додатків у гібридному кластері 56 3.6 Розгортання Kubernetes Dashboard всередині кластера 63 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 68 4.1 Заходи безпеки у дата-центрах 68 4.2 Управління охороною праці 71 ВИСНОВКИ 74 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 76 ДОДАТОК А. Технічне завдання 78 |
URI (Уніфікований ідентифікатор ресурсу): | http://elartu.tntu.edu.ua/handle/lib/45992 |
Власник авторського права: | © Андруньків Сергій Романович, 2024 © Andrunkiv Serhii, 2024 |
Перелік літератури: | Lutskiv A. Adaptable Text Corpus Development for SpecLutskiv A. Big Data Approach to Developing Adaptable Corpus Tools /Andriy Lutskiv, Nataliya Popovych// Computational Linguistics and Intelligent Systems. Proc. 4thInt. Conf. COLINS 2020. Volume I:Workshop. Lviv, Ukraine, April23-24, 2020, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.ific Linguistic Research / Andriy Lutskiv, Nataliya Popovych // International Scientific-Practical Conference «Problems of Infocommunications. Science and Technology» (October 8-11, 2019), 2019. - C.217-223. Lutskiv A. Big data-based approach to automated linguistic analysis effectiveness.//A. Lutskiv, N. Popovych/ IEEE Third International Conference on Data Stream Mining & Processing August 21-25, 2020, Lviv, Ukraine pp.438–443. DSMP 2020. Lutskiv A. Corpus-Based Translation Automation in Adaptable Corpus Translation Module /Andriy Lutskiv, Roman Lutsyshyn// Computational Linguistics and Intelligent Systems. Proc. 5th Int. Conf. COLINS 2021. Volume I: Workshop. Lviv, Ukraine, April 22-23, 2021, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/. Yatsyshyn V. A Risks management method based on the quality requirements communication method in agile approaches / Vasyl Yatsyshyn, Oleh Pastukh, Andriy Lutskiv, Viktor Tsymbalistyy, Nataliia Martsenko //Information Technologies: Theoretical and Applied Problems 2022 (ITTAP 2022), Ternopil, Ukraine, November 22-24, 2022. pp.1-10. Осухівська Г. М., Тиш Є. В., Луцик Н. С., Паламар А. М. Методичні вказівки до виконання кваліфікаційних робіт здобувачів першого (бакалаврського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль, ТНТУ. 2022. 28 с. Kubernetes Infrastructure - Infrastructure Components. URL: https://docs.openshift.com/dedicated/3/architecture/infrastructure_components/kubernetes_infrastructure.html (дата звернення: 25.04.2024). Deploy to Kubernetes | Docker Docs. URL: https://docs.docker.com/guides/deployment-orchestration/kube-deploy (дата звернення: 25.04.2024). Google Anthos: The First True Multi Cloud Platform? URL: https://bluexp.netapp.com/blog/gcp-cvo-blg-google-anthos-the-first-true-multi-cloud-platform (дата звернення: 26.04.2024). What is Big Data and Why is it Important? URL: https://www.techtarget.com/searchdatamanagement/definition/big-data (дата звернення: 30.04.2024). What Is Big Data? Definition, How It Works, and Uses. URL: https://www.investopedia.com/terms/b/big-data.asp (дата звернення: 30.04.2024). Apache Spark - Wikiwand. URL: https://wikiwand.com/uk/Apache_Spark (дата звернення: 02.05.2024). Configuration - Spark 3.5.1 Documentation. URL: https://spark.apache.org/docs/latest/configuration.html (дата звернення: 02.05.2024). Terraform Registry. URL: https://registry.terraform.io (дата звернення: 04.05.2024). Build infrastructure | Terraform | HashiCorp Developer. URL: https://developer.hashicorp.com/terraform/tutorials/gcp-get-started/google-cloud-platform-build (дата звернення: 04.05.2024). Леськів Г.З., Верескля М.Р. Безпека життєдіяльності та охорона праці: навчальний посібник / Г.З. Верескля, М.Р. Верескля. - Львів: ЛДУВС, 2018. - 262 с. Грибан В. Г., Фоменко А. Є., Казначеєв Д. Г. Г 82 Безпека життєдіяльності та охорона праці : підруч. / В. Г. Грибан, А. Є. Фоменко, Д. Г. Казначеєв. Дніпро: Дніпроп. держ. ун-т внутр. справ, 2022. 388 с. |
Тип вмісту: | Bachelor Thesis |
Розташовується у зібраннях: | 123 — Комп’ютерна інженерія (бакалаври) |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
Author_Notes_Serhii_Andrunkiv.docx | 10,61 kB | Microsoft Word XML | Переглянути/відкрити | |
Serhii_Andrunkiv.pdf | 6,51 MB | Adobe PDF | Переглянути/відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.
Інструменти адміністратора