Розподілена компʼютерна система агрегації та аналізу даних з IoT-пристроїв

Баландюк, Юрій Русланович; Balandiuk, Yurii

กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้: http://elartu.tntu.edu.ua/handle/lib/52741

ชื่อเรื่อง:	Розподілена компʼютерна система агрегації та аналізу даних з IoT-пристроїв
ชื่อเรื่องอื่นๆ:	Distributed Computer System for Aggregation and Analysis of Data from IoT Devices
ผู้แต่ง:	Баландюк, Юрій Русланович Balandiuk, Yurii
Affiliation:	Тернопільський національний технічний університет імені Івана Пулюя Ternopil Ivan Puluj National Technical University
Bibliographic reference (2015):	Баландюк Ю.Р. Розподілена компʼютерна система агрегації та аналізу даних з IoT-пристроїв : кваліфікаційна робота на здобуття ступеня бакалавр: спец. 123 — комп’ютерна інженерія / наук.кер. А.М. Луцків. — Тернопіль: ТНТУ, 2026. — 118 с.
Bibliographic description (International):	Balandiuk Y. Distributed Computer System for Aggregation and Analysis of Data from IoT Devices : Bachelor Thesis „123 — Computer Engineering“ / Yurii Balandiuk - Ternopil, TNTU, 2026 – 118 p.
วันที่เผยแพร่:	12-มิถ-2026
Submitted date:	22-มิถ-2026
Date of entry:	26-มิถ-2026
สำนักพิมพ์:	Тернопільський національний технічний університет імені Івана Пулюя
Country (code):	UA
Place of the edition/event:	Тернопільський національний технічний університет імені Івана Пулюя
Supervisor:	Луцків, Андрій Мирославович Lutskiv, Andriy
Committee members:	Литвиненко, Ярослав Володимирович Litvinenko, Yaroslav
UDC:	004.75:004.62
คำสำคัญ:	великі дані потокова обробка інфраструктура On-premise рішення контейнер Apache Kafka Apache Spark SparkSQL MinIO Apache Iceberg Apache Thrift Server Apache Superset Docker Big Data stream processing infrastructure On-premise solution container Big Data.
Number of pages:	118
บทคัดย่อ:	Баландюк Ю.Р. Розподілена компʼютерна система агрегації та аналізу даних з IoT-пристроїв: робота на здобуття кваліфікаційного ступеня бакалавра: спец. 123 — комп’ютерна інженерія. Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2026. Ключові слова: великі дані, потокова обробка, інфраструктура, On-premise рішення, контейнер, Apache Kafka, Apache Spark, SparkSQL, MinIO, Apache Iceberg, Apache Thrift Server, Apache Superset, Docker, Big Data В ході виконання кваліфікаційної роботи бакалавра було спроєктовано та реалізовано розподілену компʼютерну систему агрегації та аналізу даних з IoT-пристроїв. Архітектура системи базується на використанні брокера повідомлень Apache Kafka для збору телеметричних даних, кластера Apache Spark для обробки потоків у реальному часі та об’єктного сховища MinIO під керуванням формату Apache Iceberg. Візуалізація результатів аналізу забезпечується BI-платформою Apache Superset, а цілісність та масштабованість системи досягнута шляхом контейнеризації компонентів за допомогою Docker. Пояснювальна записка кваліфікаційної роботи містить чотири розділи. В першому розділі обґрунтовується актуальність теми розробки розподіленої компʼютерної системи агрегації та аналізу даних з IoT-пристроїв. Визначаються вимоги до продуктивності та масштабування архітектури, здійснюється обґрунтований вибір стеку технологій. Також коротко описуються принципи роботи використовуваних технологій та концепція об’єктного зберігання даних. Другий розділ присвячений розробці архітектури системи агрегації та функціонуванню конвеєра обробки даних у контейнеризованому середовищі. Розглядається специфіка побудови мікросервісної структури за допомогою Docker, інтеграція брокера повідомлень Apache Kafka, системи розподілених обчислень Apache Spark та об’єктного сховища MinIO з табличним форматом Apache Iceberg, а також проєктування схеми передачі телеметрії від джерела до засобів візуалізації. Також розглядається роль Spark Thrift Server у забезпеченні доступу до даних та обґрунтовується вибір Apache Superset як інструменту бізнес-аналітики. В третьому розділі реалізовується практичне розгортання розробленої розподіленої системи. Описано процес налаштування брокерів Kafka, конфігурування Spark-кластера для потокової обробки та створення структурованого сховища на базі MinIO, а також налаштуванню інтерактивних дашбордів для візуалізації аналітичних даних. Четвертий розділ присвячений аспектам безпеки життєдіяльності та основи охорони праці. Balandiuk Y.R. Distributed Computer System for Aggregation and Analysis of Data from IoT Devices: Bachelor’s Graduation Thesis: speciality 123 — computer engineering. Ternopil: Ternopil Ivan Puluj National Technical University, 2026. Keywords: Big Data, stream processing, infrastructure, On-premise solution, container, Apache Kafka, Apache Spark, SparkSQL, MinIO, Apache Iceberg, Apache Thrift Server, Apache Superset, Docker, Big Data. During the execution of the bachelor’s qualification thesis, a distributed computer system for aggregation and analysis of data from IoT devices was designed and implemented. The system architecture is based on the use of the Apache Kafka message broker for collecting telemetry data, an Apache Spark cluster for real-time stream processing, and MinIO object storage managed by the Apache Iceberg table format. Visualization of analysis results is provided by the Apache Superset BI platform, while system integrity and scalability are achieved through containerization of components using Docker. The explanatory note of the qualification thesis consists of four sections. The first section substantiates the relevance of developing a distributed computer system for aggregation and analysis of data from IoT devices. Performance and scalability requirements of the architecture are defined, and a justified selection of the technology stack is carried out. The operating principles of the utilized technologies and the concept of object-based data storage are also briefly described. The second section is devoted to the development of the system architecture and the functioning of the data processing pipeline in a containerized environment. It examines the specifics of building a microservice structure using Docker, the integration of the Apache Kafka message broker, the Apache Spark distributed computing system, and MinIO object storage with the Apache Iceberg table format, as well as the design of the telemetry transmission scheme from source to visualization tools. The role of Spark Thrift Server in providing data access is also considered, and the choice of Apache Superset as a business intelligence tool is justified. The third section presents the practical deployment of the developed distributed system. It describes the process of configuring Kafka brokers, setting up the Spark cluster for stream processing, creating structured storage based on MinIO, and configuring interactive dashboards for visualization of analytical data. The fourth section is devoted to occupational safety and health and safety fundamentals.
Content:	ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ, СИМВОЛІВ, ОДИНИЦЬ СКОРОЧЕНЬ І ТЕРМІНІВ 8 ВСТУП 9 РОЗДІЛ 1 АНАЛІЗ ТЕХНІЧНОГО ЗАВДАННЯ 11 1.1 Аналіз вимог до розподіленої комп’ютерної системи агрегації та аналізу даних з IoT-пристроїв 11 1.2 Огляд процесу побудови розподілених архітектур опрацювання потокових IoT-даних 13 1.3 Огляд можливих рішень до організації розподілених комп’ютерних систем агрегації та аналізу IoT-даних 15 1.4 Огляд існуючих сервісів для побудови розподілених комп’ютерних систем агрегації та аналізу IoT-даних 16 РОЗДІЛ 2 ПРОЄКТНА ЧАСТИНА 19 2.1 Загальна архітектура розподіленої комп’ютерної системи обробки IoT-даних 19 2.2 Обгрунтування вибору інструментів для побудови розподіленої комп’ютерної системи обробки IoT-даних 21 2.2.1 Принцип роботи MQTT bridge для отримання IoT-даних 22 2.2.2 Принцип роботи брокера повідомлень Apache Kafka 23 2.2.3 Принцип роботи кластера розподілених обчислень Apache Spark 25 2.2.4 Принцип організації і структурування даних у об’єктному сховищі MinIO та форматі Iceberg 26 2.2.5 Принцип роботи шлюзу Apache Spark SQl Thrift Server 28 2.2.6 Принцип роботи системи візуалізації Apache Superset 30 2.3 Огляд інструментів розгортання сервісів розподіленої комп’ютерної системи обробки IoT-даних 32 2.3.1 Платформа розгортання інфраструктури Docker Compose 33 2.3.2 Платформа розгортання інфраструктури Kubernetes 34 РОЗДІЛ 3 ПРАКТИЧНА ЧАСТИНА 37 3.1 Підготовка інфраструктурного середовища та контейнеризація сервісів 37 3.2 Конфігурування MQTT bridge для отримання IoT-даних 42 3.3 Розгортання та конфігурування кластера Apache Kafka 49 3.4 Розгортання та конфігурування кластера Apache Spark 57 3.5 Налаштування об’єктного сховища MinIO із використанням технології Iceberg та ініціалізація бакетів 67 3.6 Конфігурування шлюзу Spark Thrift Server 72 3.7 Інтеграція системи візуалізації та моніторингу Apache Superset 76 РОЗДІЛ 4 БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 85 4.1 Безпека праці персоналу та експлуатації серверного обладнання 85 4.2 Забезпечення електробезпеки захисту при експлуатації розподіленої серверної інфраструктуриt 89 ВИСНОВКИ 92 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 94 Додаток A Технічне завдання Додаток Б Лістинг коду
URI:	http://elartu.tntu.edu.ua/handle/lib/52741
Copyright owner:	© Баландюк Юрій Русланович, 2026 © Balandiuk Yurii, 2026
References (Ukraine):	Жаровський Р.О., Луцик Н.С., Осухівська Г.М., ПаламЛуцків А., Лупенко С., Пасічник В. Паралельні та розподільнені обчислення. Навчальний посібник. Львів: Видавництво «Магнолія 2006», 2024. 566 с.ар А.М., Тиш Є.В. Методичні вказівки до виконання кваліфікаційної роботи бакалавра для здобувачів першого (бакалаврського) рівня вищої освіти за спеціальністю 123 «Комп’ютерна інженерія» усіх форм навчання. Тернопіль: ТНТУ, 2024. 39 с. Микитишин А.Г., Митник М.М., Стухляк П.Д., Пасічник В.В. Комп’ютерні мережі. Книга Львів: «Магнолія 2006», 2024. 256 с. Микитишин А.Г., Митник М.М., Стухляк П.Д., Пасічник В.В. Комп’ютерні мережі. Книга Львів: «Магнолія 2006», 2024. 328 с. Ковальський В., Тиш Є. Прогнозування мережевих аномалій у хмарному середовищі з використанням генеративних алгоритмів. Матеріали XIII науково-технічної конференції «Інформаційні моделі, системи та технології». Тернопіль: ТНТУ, 2025. С.116. Yatsyshyn V., Pastukh O., Palamar A., Zharovskyy R. Technology of relational database management systems performance evaluation during computer systems design. Scientific Journal of TNTU, Ternopil, Ukraine, 2023. Vol. 109, No 1. P. 54–65. Yatsyshyn V., Pastukh O., Zharovskyi R., Shabliy N.Software tool for productivity metrics measure of relational database management system. Mathematical Modeling. No 1 (48). 2023. P. 7-17. Дячук, О.А.; Жаровський, Р.О Управління потоком за критеріями доступності. Матеріали XІ науково-технічна конференція Тернопільського національного технічного університету імені Івана Пулюя «Інформаційні моделі системи та технології» (13-14 грудня 2023 року). Тернопіль: ТНТУ. 2023. C. 151. Ковтун Н., Жаровський Р. Аналіз засобів протидії вторгненням і атакам на комп’ютерні системи. Матеріали XІI Міжнародна науково-технічна конференція молодих учених та студентів «Актуальні задачі сучасних технологій» (6-7 грудня 2023 року). Тернопіль: ТНТУ. 2023. C. 453-454. Микитишин А. Г., Митник М. М., Стухляк П. Д. Телекомунікаційні системи та мережі. Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2017. 384 с. Свергун С., Жаровський Р. Тестування програмного забезпечення побудованого на мікросервісній архітектурі. Матеріали X науково-технічної конференції Тернопільського національного технічного університету імені Івана Пулюя «Інформаційні моделі системи та технології» (7-8 грудня 2022 року). Тернопіль: ТНТУ. 2022. C. 92. Lutskiv A. Adaptable Text Corpus Development for Specific Linguistic Research / Andriy Lutskiv, Nataliya Popovych // International Scientific-Practical Conference «Problems of Infocommunications. Science and Technology» (October 8-11, 2019), 2019. - C.217-223. Lutskiv A. Big Data Approach to Developing Adaptable Corpus Tools /Andriy Lutskiv, Nataliya Popovych// Computational Linguistics and Intelligent Systems. Proc. 4thInt. Conf. COLINS 2020. Volume I:Workshop. Lviv, Ukraine, April23-24, 2020, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/. Lutskiv A. Big data-based approach to automated linguistic analysis effectiveness.//A. Lutskiv, N. Popovych/ IEEE Third International Conference on Data Stream Mining & Processing August 21-25, 2020, Lviv, Ukraine pp.438–443. DSMP 2020. Lutskiv A. Corpus-Based Translation Automation in Adaptable Corpus Translation Module /Andriy Lutskiv, Roman Lutsyshyn// Computational Linguistics and Intelligent Systems. Proc. 5th Int. Conf. COLINS 2021. Volume I: Workshop. Lviv, Ukraine, April 22-23, 2021, CEUR-WS.org, online. pp.374-395. URL: http://ceur-ws.org/Vol-2604/. Yatsyshyn V. A Risks management method based on the quality requirements communication method in agile approaches / Vasyl Yatsyshyn, Oleh Pastukh, Andriy Lutskiv, Viktor Tsymbalistyy, Nataliia Martsenko //Information Technologies: Theoretical and Applied Problems 2022 (ITTAP 2022), Ternopil, Ukraine, November 22-24, 2022. pp.1-10. ThingSpeak data collection documentation : веб-сайт. URL: https://www.mathworks.com/help/thingspeak/ (дата звернення: 10.03.2026 р.). Docker Desktop for development: веб-сайт. URL: https://docs.docker.com/ (дата звернення: 13.03.2026 р.). Building a Real-Time Data Pipeline with Apache Airflow, Kafka, Spark, and Cassandra: веб-сайт. URL: https://medium.com/@jushijun/building-a-real-time-data-pipeline-with-apache-airflow-kafka-spark-and-cassandra-be4ee5be8843 (дата звернення: 20.03.2026 р.). Setting Up a Kafka Cluster Using Docker Compose(Kraft Mode): A Step-by-Step Guide: веб-сайт. URL: https://medium.com/@darshak.kachchhi/setting-up-a-kafka-cluster-using-docker-compose-a-step-by-step-guide-a1ee5972b122 (дата звернення: 28.03.2026 р.). Setting Up Kafka Connect and Configuring MirrorMaker 2 for Replication: веб-сайт. URL: https://medium.com/@darshak.kachchhi/setting-up-kafka-connect-cluster-and-configuring-mirrormaker-2-for-replication-864123395258 (дата звернення: 05.04.2026 р.). Setting up AWS S3 (Minio) and Spark using Docker Compose: веб-сайт. URL: https://medium.com/@dkalouris/setting-up-aws-s3-minio-and-spark-using-docker-compose-6a22ef26c6b0 (дата звернення: 10.04.2026 р.). Optimizing PySpark Jobs: Best Practices and Techniques: веб-сайт. URL: https://medium.com/@devendra631995/optimizing-pyspark-jobs-best-practices-and-techniques-7308d2a99071 (дата звернення: 20.04.2026 р.). A Deep Dive into Medallion Architecture: Key Principles and Practical Implementation: веб-сайт. URL: https://medium.com/@devendra631995/a-deep-dive-into-medallion-architecture-key-principles-and-practical-implementation-fd9f85be02f5 (дата звернення: 25.04.2026 р.). Apache Spark Configurations Precedence: веб-сайт. URL: https://bigdataenthusiast.medium.com/spark-configurations-precedence-2014535ea5be (дата звернення: 29.04.2026 р.). Apache Spark SQL CLI documentation: веб-сайт. URL: https://spark.apache.org/docs/latest/sql-distributed-sql-engine-spark-sql-cli.html (дата звернення: 03.05.2026 р.). Apache Iceberg documentation: веб-сайт. URL: https://spark.apache.org/docs/latest/sql-distributed-sql-engine-spark-sql-cli.html (дата звернення: 10.05.2026 р.). Bash documentation: веб-сайт. URL: https://www.w3schools.com/bash/index.php (дата звернення: 13.05.2026 р.). Правила улаштування електроустановок. ПУЭ. веб-сайт. URL: https://zakon.rada.gov.ua/rada/show/v0476732-17#Text (дата звернення: 28.05.2026 р.). ДБН В.1.1-7-2016 «Пожежна безпека об’єктів будівництва». веб-сайт. URL: https://e-construction.gov.ua/laws_detail/3080743763845318619 (дата звернення: 28.05.2026 р.). Правила пожежної безпеки в Україні. (від 30.12.2014 р.. №1417). веб-сайт. URL: https://zakon.rada.gov.ua/laws/show/z0252-15#Text (дата звернення: 28.05.2026 р.). Гандзюк М.П., Желібо Є.П., Халімовський М.О. Основи охорони праці. – К.: Каравела, 2008. – 384 с. ДСН 3.3.6.042-99 «Санітарні норми мікроклімату виробничих приміщень». ДБН В.2.5-67:2013 «Опалення, вентиляція та кондиціонування».
ปรากฏในกลุ่มข้อมูล:	123 — Комп’ютерна інженерія, F7 Комп’ютерна інженерія (бакалаври)

แฟ้มในรายการข้อมูลนี้:

แฟ้ม	รายละเอียด	ขนาด	รูปแบบ
Yurii_Balandiuk.pdf		1,73 MB	Adobe PDF	ดู/เปิด

แสดงระเบียนรายการแบบเต็ม

รายการทั้งหมดในระบบคิดีได้รับการคุ้มครองลิขสิทธิ์ มีการสงวนสิทธิ์เว้นแต่ที่ระบุไว้เป็นอื่น

เครื่องมือสำหรับผู้ดูแลระบบ