Моля, използвайте този идентификатор за цитиране или линк към този публикация: http://elartu.tntu.edu.ua/handle/lib/45992
Заглавие: Kubernetes кластер в гібридній хмарі для виконання завдань Big Data
Други Заглавия: Kubernetes cluster in a hybrid cloud for Big Data tasks
Автори: Андруньків, Сергій Романович
Andrunkiv, Serhii
Affiliation: Тернопільський національний технічний університет імені Івана Пулюя
Ternopil Ivan Puluj National Technical University
Bibliographic description (Ukraine): Андруньків С.Р. Kubernetes кластер в гібридній хмарі для виконання завдань Big Data : робота на здобуття кваліфікаційна ступеня бакалавр: спец. 123 — комп’ютерна інженерія / наук.кер. А.М. Луцків. — Тернопіль: ТНТУ, 2024. — 88 с.
Bibliographic description (International): Andrunkiv S. Kubernetes cluster in a hybrid cloud for Big Data tasks : Bachelor Thesis „123 — Computer Engineering“ / Serhii Andrunkiv - Ternopil, TNTU, 2024 – 88 p.
Дата на Публикуване: 17-Юни-2024
Submitted date: 24-Юни-2024
Date of entry: 9-Юли-2024
Издател: Тернопільський національний технічний університет імені Івана Пулюя
Country (code): UA
Place of the edition/event: Тернопільський національний технічний університет імені Івана Пулюя
Supervisor: Луцків, Андрій Мирославович
Lutskiv, Andriy
Committee members: Гладьо, Юрій Богданович
Gladio, Yurii
UDC: 004.4
Ключови Думи: КластерKubernetes
Ansible
Kubespray
Helm
YAML
Terraform
інфраструктура
POD
гібридна хмара
Anthos
GCP
GKE
AWS
EKS
контейнер
Docker
Big Data
Spark
Scala.
Cluster
infrastructure
hybrid cloud
container
Scala
Number of pages: 88
Резюме: В ході виконання кваліфікаційної роботи бакалавра було створено гібридну хмару на інфраструктурах Google та Amazon з використанням Google Anthos, на якій розгорнуто та налаштовано Kubernetes кластер для запуску Spark-задач у Docker-контейнерах. Пояснювальна записка кваліфікаційної роботи містить чотири розділи. У першому розділі обгрунтовується актуальність теми, визначаються потреби до розгортання Kubernetes кластера у гібридній хмарі. Визначаються вимоги до його продуктивності, масштабування, вибір Big Data технологій, а також коротко описуються принципи роботи використовуваних технологій Другий розділ присвячений розробці архітектури та функціонування Kubernetes кластера на гібридній хмарній інфраструктурі, враховуючи специфіку задач Big Data. Крім цього, тут розглядаються конкретні інструменти для створення хмари, розгортання кластера та написання додатків із врахуванням особливостей роботи з ними та їх обгрунтованому виборі. У третьому розділі реалізовується розгортання Kubernetes кластера у гібридній хмарі провайдерів GCP та AWS і написання додатків для кластера. Четвертий розділ присвячений аспектам безпеки життєдіяльності та основи охорони праці.
In the course of the bachelor's thesis, a hybrid cloud was created on Google and Amazon infrastructures using Google Anthos, on which a Kubernetes cluster was deployed and configured to run Spark tasks in Docker containers. The explanatory note of the qualification work contains four sections. The first section substantiates the relevance of the topic, identifies the needs for deploying a Kubernetes cluster in a hybrid cloud. It defines the requirements for its performance, scaling, choice of Big Data technologies, and briefly describes the principles of operation of the technologies used. The second section is devoted to the development of the architecture and operation of a Kubernetes cluster on a hybrid cloud infrastructure, taking into account the specifics of Big Data tasks. In addition, it discusses specific tools for creating a cloud, deploying a cluster, and writing applications, taking into account the peculiarities of working with them and their reasonable choice. The third section describes how to deploy a Kubernetes cluster in a hybrid cloud of GCP and AWS providers and write applications for the cluster. The fourth section is devoted to the aspects of life safety and the basics of labor protection.
Content: ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ 8 ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ ТЕХНІЧНОГО ЗАВДАННЯ 11 1.1 Аналіз вимог до гібридної хмарної системи 11 1.2 Загальні принципи розгортання Kubernetes кластера 12 1.3 Створення гібридної хмари та розгортання у ній кластера 14 1.4 Реалізація та розгортання додатків Big Data 17 РОЗДІЛ 2 ПРОЄКТНА ЧАСТИНА 20 2.1 Загальна архітектура роботи кластера 20 2.2 Обґрунтування вибору інструментів для розгортання кластера 22 2.2.1 Платформа Kubernetes 22 2.2.2 Мова розмітки та опису даних YAML 23 2.2.3 Утиліта Terraform 23 2.2.4 Kubernetes Dashboard 25 2.3 Огляд інструментів для розгортання кластера у гібридній хмарі 25 2.3.1 Платформи GCP та GKE 26 2.3.2 Сховище Google Cloud Storage 26 2.3.3 Платформи AWS та EKS 26 2.3.4 Платформа Google Anthos 27 2.4 Принципи роботи Apache Spark у Kubernetes 29 2.5 Загальна послідовність розгортання кластера та інтеграції Spark-додатків 32 РОЗДІЛ 3 ПРАКТИЧНА ЧАСТИНА 35 3.1 Проєкти, ролі і правила для платформ GCP та AWS 35 3.2 Розгортання кластера у гібридній хмарі 39 3.3 Створення та налаштування сховища даних GCS 49 3.4 Створення Spark-додатків та формування образів Docker 51 3.5 Розгортання і запуск Spark додатків у гібридному кластері 56 3.6 Розгортання Kubernetes Dashboard всередині кластера 63 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 68 4.1 Заходи безпеки у дата-центрах 68 4.2 Управління охороною праці 71 ВИСНОВКИ 74 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 76 ДОДАТОК А. Технічне завдання 78
URI: http://elartu.tntu.edu.ua/handle/lib/45992
Copyright owner: © Андруньків Сергій Романович, 2024
© Andrunkiv Serhii, 2024
References (Ukraine): Lutskiv A. Adaptable Text Corpus Development for SpecLutskiv A. Big Data Approach to Developing Adaptable Corpus Tools /Andriy Lutskiv, Nataliya Popovych// Computational Linguistics and Intelligent Systems. Proc. 4thInt. Conf. COLINS 2020. Volume I:Workshop. Lviv, Ukraine, April23-24, 2020, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.ific Linguistic Research / Andriy Lutskiv, Nataliya Popovych // International Scientific-Practical Conference «Problems of Infocommunications. Science and Technology» (October 8-11, 2019), 2019. - C.217-223.
Lutskiv A. Big data-based approach to automated linguistic analysis effectiveness.//A. Lutskiv, N. Popovych/ IEEE Third International Conference on Data Stream Mining & Processing August 21-25, 2020, Lviv, Ukraine pp.438–443. DSMP 2020.
Lutskiv A. Corpus-Based Translation Automation in Adaptable Corpus Translation Module /Andriy Lutskiv, Roman Lutsyshyn// Computational Linguistics and Intelligent Systems. Proc. 5th Int. Conf. COLINS 2021. Volume I: Workshop. Lviv, Ukraine, April 22-23, 2021, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.
Yatsyshyn V. A Risks management method based on the quality requirements communication method in agile approaches / Vasyl Yatsyshyn, Oleh Pastukh, Andriy Lutskiv, Viktor Tsymbalistyy, Nataliia Martsenko //Information Technologies: Theoretical and Applied Problems 2022 (ITTAP 2022), Ternopil, Ukraine, November 22-24, 2022. pp.1-10.
Осухівська Г. М., Тиш Є. В., Луцик Н. С., Паламар А. М. Методичні вказівки до виконання кваліфікаційних робіт здобувачів першого (бакалаврського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль, ТНТУ. 2022. 28 с.
Kubernetes Infrastructure - Infrastructure Components. URL: https://docs.openshift.com/dedicated/3/architecture/infrastructure_components/kubernetes_infrastructure.html (дата звернення: 25.04.2024).
Deploy to Kubernetes | Docker Docs. URL: https://docs.docker.com/guides/deployment-orchestration/kube-deploy (дата звернення: 25.04.2024).
Google Anthos: The First True Multi Cloud Platform? URL: https://bluexp.netapp.com/blog/gcp-cvo-blg-google-anthos-the-first-true-multi-cloud-platform (дата звернення: 26.04.2024).
What is Big Data and Why is it Important? URL: https://www.techtarget.com/searchdatamanagement/definition/big-data (дата звернення: 30.04.2024).
What Is Big Data? Definition, How It Works, and Uses. URL: https://www.investopedia.com/terms/b/big-data.asp (дата звернення: 30.04.2024).
Apache Spark - Wikiwand. URL: https://wikiwand.com/uk/Apache_Spark (дата звернення: 02.05.2024).
Configuration - Spark 3.5.1 Documentation. URL: https://spark.apache.org/docs/latest/configuration.html (дата звернення: 02.05.2024).
Terraform Registry. URL: https://registry.terraform.io (дата звернення: 04.05.2024).
Build infrastructure | Terraform | HashiCorp Developer. URL: https://developer.hashicorp.com/terraform/tutorials/gcp-get-started/google-cloud-platform-build (дата звернення: 04.05.2024).
Леськів Г.З., Верескля М.Р. Безпека життєдіяльності та охорона праці: навчальний посібник / Г.З. Верескля, М.Р. Верескля. - Львів: ЛДУВС, 2018. - 262 с.
Грибан В. Г., Фоменко А. Є., Казначеєв Д. Г. Г 82 Безпека життєдіяльності та охорона праці : підруч. / В. Г. Грибан, А. Є. Фоменко, Д. Г. Казначеєв. Дніпро: Дніпроп. держ. ун-т внутр. справ, 2022. 388 с.
Content type: Bachelor Thesis
Показва се в Колекции:123 — Комп’ютерна інженерія (бакалаври)

Файлове в Този Публикация:
Файл Описание РазмерФормат 
Author_Notes_Serhii_Andrunkiv.docx10,61 kBMicrosoft Word XMLИзглед/Отваряне
Serhii_Andrunkiv.pdf6,51 MBAdobe PDFИзглед/Отваряне


Публикацияте в DSpace са защитени с авторско право, с всички права запазени, освен ако не е указно друго.

Админ Инструменти