Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/45992
Назва: Kubernetes кластер в гібридній хмарі для виконання завдань Big Data
Інші назви: Kubernetes cluster in a hybrid cloud for Big Data tasks
Автори: Андруньків, Сергій Романович
Andrunkiv, Serhii
Приналежність: Тернопільський національний технічний університет імені Івана Пулюя
Ternopil Ivan Puluj National Technical University
Бібліографічний опис: Андруньків С.Р. Kubernetes кластер в гібридній хмарі для виконання завдань Big Data : робота на здобуття кваліфікаційна ступеня бакалавр: спец. 123 — комп’ютерна інженерія / наук.кер. А.М. Луцків. — Тернопіль: ТНТУ, 2024. — 88 с.
Bibliographic description: Andrunkiv S. Kubernetes cluster in a hybrid cloud for Big Data tasks : Bachelor Thesis „123 — Computer Engineering“ / Serhii Andrunkiv - Ternopil, TNTU, 2024 – 88 p.
Дата публікації: 17-чер-2024
Дата подання: 24-чер-2024
Дата внесення: 9-лип-2024
Видавництво: Тернопільський національний технічний університет імені Івана Пулюя
Країна (код): UA
Місце видання, проведення: Тернопільський національний технічний університет імені Івана Пулюя
Науковий керівник: Луцків, Андрій Мирославович
Lutskiv, Andriy
Члени комітету: Гладьо, Юрій Богданович
Gladio, Yurii
УДК: 004.4
Теми: КластерKubernetes
Ansible
Kubespray
Helm
YAML
Terraform
інфраструктура
POD
гібридна хмара
Anthos
GCP
GKE
AWS
EKS
контейнер
Docker
Big Data
Spark
Scala.
Cluster
infrastructure
hybrid cloud
container
Scala
Кількість сторінок: 88
Короткий огляд (реферат): В ході виконання кваліфікаційної роботи бакалавра було створено гібридну хмару на інфраструктурах Google та Amazon з використанням Google Anthos, на якій розгорнуто та налаштовано Kubernetes кластер для запуску Spark-задач у Docker-контейнерах. Пояснювальна записка кваліфікаційної роботи містить чотири розділи. У першому розділі обгрунтовується актуальність теми, визначаються потреби до розгортання Kubernetes кластера у гібридній хмарі. Визначаються вимоги до його продуктивності, масштабування, вибір Big Data технологій, а також коротко описуються принципи роботи використовуваних технологій Другий розділ присвячений розробці архітектури та функціонування Kubernetes кластера на гібридній хмарній інфраструктурі, враховуючи специфіку задач Big Data. Крім цього, тут розглядаються конкретні інструменти для створення хмари, розгортання кластера та написання додатків із врахуванням особливостей роботи з ними та їх обгрунтованому виборі. У третьому розділі реалізовується розгортання Kubernetes кластера у гібридній хмарі провайдерів GCP та AWS і написання додатків для кластера. Четвертий розділ присвячений аспектам безпеки життєдіяльності та основи охорони праці.
In the course of the bachelor's thesis, a hybrid cloud was created on Google and Amazon infrastructures using Google Anthos, on which a Kubernetes cluster was deployed and configured to run Spark tasks in Docker containers. The explanatory note of the qualification work contains four sections. The first section substantiates the relevance of the topic, identifies the needs for deploying a Kubernetes cluster in a hybrid cloud. It defines the requirements for its performance, scaling, choice of Big Data technologies, and briefly describes the principles of operation of the technologies used. The second section is devoted to the development of the architecture and operation of a Kubernetes cluster on a hybrid cloud infrastructure, taking into account the specifics of Big Data tasks. In addition, it discusses specific tools for creating a cloud, deploying a cluster, and writing applications, taking into account the peculiarities of working with them and their reasonable choice. The third section describes how to deploy a Kubernetes cluster in a hybrid cloud of GCP and AWS providers and write applications for the cluster. The fourth section is devoted to the aspects of life safety and the basics of labor protection.
Зміст: ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ 8 ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ ТЕХНІЧНОГО ЗАВДАННЯ 11 1.1 Аналіз вимог до гібридної хмарної системи 11 1.2 Загальні принципи розгортання Kubernetes кластера 12 1.3 Створення гібридної хмари та розгортання у ній кластера 14 1.4 Реалізація та розгортання додатків Big Data 17 РОЗДІЛ 2 ПРОЄКТНА ЧАСТИНА 20 2.1 Загальна архітектура роботи кластера 20 2.2 Обґрунтування вибору інструментів для розгортання кластера 22 2.2.1 Платформа Kubernetes 22 2.2.2 Мова розмітки та опису даних YAML 23 2.2.3 Утиліта Terraform 23 2.2.4 Kubernetes Dashboard 25 2.3 Огляд інструментів для розгортання кластера у гібридній хмарі 25 2.3.1 Платформи GCP та GKE 26 2.3.2 Сховище Google Cloud Storage 26 2.3.3 Платформи AWS та EKS 26 2.3.4 Платформа Google Anthos 27 2.4 Принципи роботи Apache Spark у Kubernetes 29 2.5 Загальна послідовність розгортання кластера та інтеграції Spark-додатків 32 РОЗДІЛ 3 ПРАКТИЧНА ЧАСТИНА 35 3.1 Проєкти, ролі і правила для платформ GCP та AWS 35 3.2 Розгортання кластера у гібридній хмарі 39 3.3 Створення та налаштування сховища даних GCS 49 3.4 Створення Spark-додатків та формування образів Docker 51 3.5 Розгортання і запуск Spark додатків у гібридному кластері 56 3.6 Розгортання Kubernetes Dashboard всередині кластера 63 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 68 4.1 Заходи безпеки у дата-центрах 68 4.2 Управління охороною праці 71 ВИСНОВКИ 74 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 76 ДОДАТОК А. Технічне завдання 78
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/45992
Власник авторського права: © Андруньків Сергій Романович, 2024
© Andrunkiv Serhii, 2024
Перелік літератури: Lutskiv A. Adaptable Text Corpus Development for SpecLutskiv A. Big Data Approach to Developing Adaptable Corpus Tools /Andriy Lutskiv, Nataliya Popovych// Computational Linguistics and Intelligent Systems. Proc. 4thInt. Conf. COLINS 2020. Volume I:Workshop. Lviv, Ukraine, April23-24, 2020, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.ific Linguistic Research / Andriy Lutskiv, Nataliya Popovych // International Scientific-Practical Conference «Problems of Infocommunications. Science and Technology» (October 8-11, 2019), 2019. - C.217-223.
Lutskiv A. Big data-based approach to automated linguistic analysis effectiveness.//A. Lutskiv, N. Popovych/ IEEE Third International Conference on Data Stream Mining & Processing August 21-25, 2020, Lviv, Ukraine pp.438–443. DSMP 2020.
Lutskiv A. Corpus-Based Translation Automation in Adaptable Corpus Translation Module /Andriy Lutskiv, Roman Lutsyshyn// Computational Linguistics and Intelligent Systems. Proc. 5th Int. Conf. COLINS 2021. Volume I: Workshop. Lviv, Ukraine, April 22-23, 2021, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/.
Yatsyshyn V. A Risks management method based on the quality requirements communication method in agile approaches / Vasyl Yatsyshyn, Oleh Pastukh, Andriy Lutskiv, Viktor Tsymbalistyy, Nataliia Martsenko //Information Technologies: Theoretical and Applied Problems 2022 (ITTAP 2022), Ternopil, Ukraine, November 22-24, 2022. pp.1-10.
Осухівська Г. М., Тиш Є. В., Луцик Н. С., Паламар А. М. Методичні вказівки до виконання кваліфікаційних робіт здобувачів першого (бакалаврського) рівня вищої освіти спеціальності 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль, ТНТУ. 2022. 28 с.
Kubernetes Infrastructure - Infrastructure Components. URL: https://docs.openshift.com/dedicated/3/architecture/infrastructure_components/kubernetes_infrastructure.html (дата звернення: 25.04.2024).
Deploy to Kubernetes | Docker Docs. URL: https://docs.docker.com/guides/deployment-orchestration/kube-deploy (дата звернення: 25.04.2024).
Google Anthos: The First True Multi Cloud Platform? URL: https://bluexp.netapp.com/blog/gcp-cvo-blg-google-anthos-the-first-true-multi-cloud-platform (дата звернення: 26.04.2024).
What is Big Data and Why is it Important? URL: https://www.techtarget.com/searchdatamanagement/definition/big-data (дата звернення: 30.04.2024).
What Is Big Data? Definition, How It Works, and Uses. URL: https://www.investopedia.com/terms/b/big-data.asp (дата звернення: 30.04.2024).
Apache Spark - Wikiwand. URL: https://wikiwand.com/uk/Apache_Spark (дата звернення: 02.05.2024).
Configuration - Spark 3.5.1 Documentation. URL: https://spark.apache.org/docs/latest/configuration.html (дата звернення: 02.05.2024).
Terraform Registry. URL: https://registry.terraform.io (дата звернення: 04.05.2024).
Build infrastructure | Terraform | HashiCorp Developer. URL: https://developer.hashicorp.com/terraform/tutorials/gcp-get-started/google-cloud-platform-build (дата звернення: 04.05.2024).
Леськів Г.З., Верескля М.Р. Безпека життєдіяльності та охорона праці: навчальний посібник / Г.З. Верескля, М.Р. Верескля. - Львів: ЛДУВС, 2018. - 262 с.
Грибан В. Г., Фоменко А. Є., Казначеєв Д. Г. Г 82 Безпека життєдіяльності та охорона праці : підруч. / В. Г. Грибан, А. Є. Фоменко, Д. Г. Казначеєв. Дніпро: Дніпроп. держ. ун-т внутр. справ, 2022. 388 с.
Тип вмісту: Bachelor Thesis
Розташовується у зібраннях:123 — Комп’ютерна інженерія (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
Author_Notes_Serhii_Andrunkiv.docx10,61 kBMicrosoft Word XMLПереглянути/відкрити
Serhii_Andrunkiv.pdf6,51 MBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора