Por favor, use este identificador para citar o enlazar este ítem:
http://elartu.tntu.edu.ua/handle/lib/45992
Título : | Kubernetes кластер в гібридній хмарі для виконання завдань Big Data |
Otros títulos : | Kubernetes cluster in a hybrid cloud for Big Data tasks |
Autor : | Андруньків, Сергій Романович Andrunkiv, Serhii |
Affiliation: | Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University |
Bibliographic description (Ukraine): | Андруньків С. Р. Kubernetes кластер в гібридній хмарі для виконання завдань Big Data : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 123 — комп’ютерна інженерія / наук. кер. А. М. Луцків. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2024. 88 с. |
Fecha de publicación : | 17-jun-2024 |
Submitted date: | 24-jun-2024 |
Date of entry: | 9-jul-2024 |
Editorial : | Тернопільський національний технічний університет імені Івана Пулюя |
Country (code): | UA |
Place of the edition/event: | Тернопільський національний технічний університет імені Івана Пулюя |
Supervisor: | Луцків, Андрій Мирославович Lutskiv, Andriy |
Committee members: | Гладьо, Юрій Богданович Gladio, Yurii |
UDC: | 004.4 |
Palabras clave : | КластерKubernetes Ansible Kubespray Helm YAML Terraform інфраструктура POD гібридна хмара Anthos GCP GKE AWS EKS контейнер Docker Big Data Spark Scala. Cluster infrastructure hybrid cloud container Scala |
Number of pages: | 88 |
Resumen : | В ході виконання кваліфікаційної роботи бакалавра було створено гібридну хмару на інфраструктурах Google та Amazon з використанням Google Anthos, на якій розгорнуто та налаштовано Kubernetes кластер для запуску Spark-задач у Docker-контейнерах.
Пояснювальна записка кваліфікаційної роботи містить чотири розділи.
У першому розділі обгрунтовується актуальність теми, визначаються потреби до розгортання Kubernetes кластера у гібридній хмарі. Визначаються вимоги до його продуктивності, масштабування, вибір Big Data технологій, а також коротко описуються принципи роботи використовуваних технологій
Другий розділ присвячений розробці архітектури та функціонування Kubernetes кластера на гібридній хмарній інфраструктурі, враховуючи специфіку задач Big Data. Крім цього, тут розглядаються конкретні інструменти для створення хмари, розгортання кластера та написання додатків із врахуванням особливостей роботи з ними та їх обгрунтованому виборі.
У третьому розділі реалізовується розгортання Kubernetes кластера у гібридній хмарі провайдерів GCP та AWS і написання додатків для кластера.
Четвертий розділ присвячений аспектам безпеки життєдіяльності та основи охорони праці. In the course of the bachelor's thesis, a hybrid cloud was created on Google and Amazon infrastructures using Google Anthos, on which a Kubernetes cluster was deployed and configured to run Spark tasks in Docker containers. The explanatory note of the qualification work contains four sections. The first section substantiates the relevance of the topic, identifies the needs for deploying a Kubernetes cluster in a hybrid cloud. It defines the requirements for its performance, scaling, choice of Big Data technologies, and briefly describes the principles of operation of the technologies used. The second section is devoted to the development of the architecture and operation of a Kubernetes cluster on a hybrid cloud infrastructure, taking into account the specifics of Big Data tasks. In addition, it discusses specific tools for creating a cloud, deploying a cluster, and writing applications, taking into account the peculiarities of working with them and their reasonable choice. The third section describes how to deploy a Kubernetes cluster in a hybrid cloud of GCP and AWS providers and write applications for the cluster. The fourth section is devoted to the aspects of life safety and the basics of labor protection. |
Content: | ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ 8 ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ ТЕХНІЧНОГО ЗАВДАННЯ 11 1.1 Аналіз вимог до гібридної хмарної системи 11 1.2 Загальні принципи розгортання Kubernetes кластера 12 1.3 Створення гібридної хмари та розгортання у ній кластера 14 1.4 Реалізація та розгортання додатків Big Data 17 РОЗДІЛ 2 ПРОЄКТНА ЧАСТИНА 20 2.1 Загальна архітектура роботи кластера 20 2.2 Обґрунтування вибору інструментів для розгортання кластера 22 2.2.1 Платформа Kubernetes 22 2.2.2 Мова розмітки та опису даних YAML 23 2.2.3 Утиліта Terraform 23 2.2.4 Kubernetes Dashboard 25 2.3 Огляд інструментів для розгортання кластера у гібридній хмарі 25 2.3.1 Платформи GCP та GKE 26 2.3.2 Сховище Google Cloud Storage 26 2.3.3 Платформи AWS та EKS 26 2.3.4 Платформа Google Anthos 27 2.4 Принципи роботи Apache Spark у Kubernetes 29 2.5 Загальна послідовність розгортання кластера та інтеграції Spark-додатків 32 РОЗДІЛ 3 ПРАКТИЧНА ЧАСТИНА 35 3.1 Проєкти, ролі і правила для платформ GCP та AWS 35 3.2 Розгортання кластера у гібридній хмарі 39 3.3 Створення та налаштування сховища даних GCS 49 3.4 Створення Spark-додатків та формування образів Docker 51 3.5 Розгортання і запуск Spark додатків у гібридному кластері 56 3.6 Розгортання Kubernetes Dashboard всередині кластера 63 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 68 4.1 Заходи безпеки у дата-центрах 68 4.2 Управління охороною праці 71 ВИСНОВКИ 74 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 76 ДОДАТОК А. Технічне завдання 78 |
URI : | http://elartu.tntu.edu.ua/handle/lib/45992 |
Copyright owner: | © Андруньків Сергій Романович, 2024 © Andrunkiv Serhii, 2024 |
References (Ukraine): | Lutskiv A. Adaptable Text Corpus Development for SpecLutskiv A. Big Data Approach to Developing Adaptable Corpus Tools /Andriy Lutskiv, Nataliya Popovych// Computational Linguistics and Intelligent Systems. Proc. 4thInt. Conf. COLINS 2020. Volume I:Workshop. Lviv, Ukraine, April23-24, 2020, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.ific Linguistic Research / Andriy Lutskiv, Nataliya Popovych // International Scientific-Practical Conference «Problems of Infocommunications. Science and Technology» (October 8-11, 2019), 2019. - C.217-223. Lutskiv A. Big data-based approach to automated linguistic analysis effectiveness.//A. Lutskiv, N. Popovych/ IEEE Third International Conference on Data Stream Mining & Processing August 21-25, 2020, Lviv, Ukraine pp.438–443. DSMP 2020. Lutskiv A. Corpus-Based Translation Automation in Adaptable Corpus Translation Module /Andriy Lutskiv, Roman Lutsyshyn// Computational Linguistics and Intelligent Systems. Proc. 5th Int. Conf. COLINS 2021. Volume I: Workshop. Lviv, Ukraine, April 22-23, 2021, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/. Yatsyshyn V. A Risks management method based on the quality requirements communication method in agile approaches / Vasyl Yatsyshyn, Oleh Pastukh, Andriy Lutskiv, Viktor Tsymbalistyy, Nataliia Martsenko //Information Technologies: Theoretical and Applied Problems 2022 (ITTAP 2022), Ternopil, Ukraine, November 22-24, 2022. pp.1-10. Осухівська Г. М., Тиш Є. В., Луцик Н. С., Паламар А. М. Методичні вказівки до виконання кваліфікаційних робіт здобувачів першого (бакалаврського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль, ТНТУ. 2022. 28 с. Kubernetes Infrastructure - Infrastructure Components. URL: https://docs.openshift.com/dedicated/3/architecture/infrastructure_components/kubernetes_infrastructure.html (дата звернення: 25.04.2024). Deploy to Kubernetes | Docker Docs. URL: https://docs.docker.com/guides/deployment-orchestration/kube-deploy (дата звернення: 25.04.2024). Google Anthos: The First True Multi Cloud Platform? URL: https://bluexp.netapp.com/blog/gcp-cvo-blg-google-anthos-the-first-true-multi-cloud-platform (дата звернення: 26.04.2024). What is Big Data and Why is it Important? URL: https://www.techtarget.com/searchdatamanagement/definition/big-data (дата звернення: 30.04.2024). What Is Big Data? Definition, How It Works, and Uses. URL: https://www.investopedia.com/terms/b/big-data.asp (дата звернення: 30.04.2024). Apache Spark - Wikiwand. URL: https://wikiwand.com/uk/Apache_Spark (дата звернення: 02.05.2024). Configuration - Spark 3.5.1 Documentation. URL: https://spark.apache.org/docs/latest/configuration.html (дата звернення: 02.05.2024). Terraform Registry. URL: https://registry.terraform.io (дата звернення: 04.05.2024). Build infrastructure | Terraform | HashiCorp Developer. URL: https://developer.hashicorp.com/terraform/tutorials/gcp-get-started/google-cloud-platform-build (дата звернення: 04.05.2024). Леськів Г.З., Верескля М.Р. Безпека життєдіяльності та охорона праці: навчальний посібник / Г.З. Верескля, М.Р. Верескля. - Львів: ЛДУВС, 2018. - 262 с. Грибан В. Г., Фоменко А. Є., Казначеєв Д. Г. Г 82 Безпека життєдіяльності та охорона праці : підруч. / В. Г. Грибан, А. Є. Фоменко, Д. Г. Казначеєв. Дніпро: Дніпроп. держ. ун-т внутр. справ, 2022. 388 с. |
Content type: | Bachelor Thesis |
Aparece en las colecciones: | 123 — Комп’ютерна інженерія (бакалаври) |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Author_Notes_Serhii_Andrunkiv.docx | 10,61 kB | Microsoft Word XML | Visualizar/Abrir | |
Serhii_Andrunkiv.pdf | 6,51 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
Herramientas de Administrador