Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://elartu.tntu.edu.ua/handle/lib/52882
Назва: Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++
Інші назви: Implementation of Parallel Data Clustering Algorithms in Python and C++
Автори: Король, Дмитро Ігорович
Korol, Dmytro
Приналежність: Тернопільський національний технічний університет імені ім. І. Пулюя
Бібліографічне посилання: Король Д. І. Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++ : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Матійчук. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 54 с.
Дата публікації: 23-чер-2026
Дата подання: 9-чер-2026
Дата внесення: 29-чер-2026
Видавництво: Тернопільський національний технічний університет імені ім. І. Пулюя
Країна (код): UA
Місце видання, проведення: Тернопіль
Науковий керівник: Матійчук, Любомир Павлович
Matiichuk, Liubomyr
УДК: 004.82
Теми: 122
комп’ютерні науки
кластеризація
продуктивність
розпаралелювання
dbscan
c-means
k-means
cuda
openmp
clustering
performance
parallelization
Діапазон сторінок: 54
Короткий огляд (реферат): Кваліфікаційна робота присвячена дослідженню алгоритмів кластеризації даних (K-mean, C-means, DBSCAN) з подальшою їх програмною реалізацією та оцінкою якості роботи із проведенням порівняльного аналізу приросту швидкості. У першому розділі викладено основні визначення кластерного аналізу, наведено дві технології для використання паралельних обчислень (OpenMP та CUDA). У другому розділі виконано докладний аналіз та здійснена реалізація паралельних алгоритмів кластеризації на мовах Python i C++. Проведені вимірювання часу роботи алгоритмів із оцінкою якості. У третьому розділі проведено порівняльний аналіз приросту швидкості, зроблено висновки про отримані результати. Експериментально показано, що використання технологій організації паралельних обчислень значно прискорює роботу програмного коду. У четвертому розділі розглянуто питання безпеки життєдіяльності і основ охорони праці.
The Thesis deals with the study of data clustering algorithms (K-mean, C-means, DBSCAN) with their subsequent software implementation and quality assessment of work with a comparative analysis of the speed increase. The first section presents the basic definitions of cluster analysis, two technologies for using parallel computing (OpenMP and CUDA) are presented. The second section provides a detailed analysis and implementation of parallel clustering algorithms in Python and C++. The running time of the algorithms is measured with a quality assessment. The third section provides a comparative analysis of the speed increase, and conclusions are drawn on the results obtained. It is experimentally shown that the use of parallel computing technologies significantly speeds up the work of the program code. The fourth section considers the issues of life safety and the basics of labor protection.
Опис: Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 23.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя
Зміст: ВСТУП 8 РОЗДІЛ 1 ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ 10 1.1 Кластеризація 10 1.1.1 Введення до кластерного аналізу 10 1.1.2 Визначення задач кластеризації 11 1.1.3 Різноманітність задач кластеризації 11 1.1.4 Форми кластерів 12 1.1.5 Методи кластеризації 13 1.1.6 Оцінка якості кластеризації 13 1.2 Пришвидшення обчислень за допомогою паралельного програмування 14 1.2.1 Основні поняття та принципи паралельного програмування 14 1.2.2 Технологія OpenMP 14 1.2.3 Технологія CUDA 15 РОЗДІЛ 2. АНАЛІЗ ТА РЕАЛІЗАЦІЯ ПАРАЛЕЛЬНИХ АЛГОРИТМІВ КЛАСТЕРИЗАЦІЇ 17 2.1 Огляд алгоритмів K-means, C-means, DBSCAN 17 2.1.1 Алгоритм K-means /К-середніх (алгоритм Ллойда) 17 2.1.2 Fuzzy C-means / Алгоритм нечіткої кластеризації С-середніх 18 2.1.3 DBSCAN 20 2.2 Характеристики обчислювальної техніки 21 2.3 Реалізація алгоритмів на Python 22 2.3.1 Дослідження та вимірювання 22 2.3.2 Функції та їх параметри 22 2.3. Перевірка алгоритмів 24 2.3.4 Вимірювання часу роботи алгоритмів 33 2.4 Реалізація алгоритмів на С++ 35 РОЗДІЛ 3. ВИКОРИСТАННЯ ТЕХНОЛОГІЙ РОЗПАРАЛЕЛЮВАННЯ ТА ПОРІВНЯЛЬНИЙ АНАЛІЗ ПРОДУКТИВНОСТІ АЛГОРИТМІВ 37 3.1 Паралелізація програм із використанням технології OpenMP 37 3.2 Обчислення на GPU з використанням технології CUDA 38 3.3 Порівняльний аналіз продуктивності алгоритмів з різними реалізаціями 41 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 46 4.1 Долікарська допомога при ураженні електричним струмом 46 4.2 Вимоги ергономіки до організації робочого місця оператора ПК 48 ВИСНОВКИ 52 ПЕРЕЛІК ДЖЕРЕЛ 53
URI (Уніфікований ідентифікатор ресурсу): http://elartu.tntu.edu.ua/handle/lib/52882
Власник авторського права: © Король Дмитро Ігорович, 2026
Перелік літератури: 1. Everitt, B. S., Landau, S., Leese, M., & Stahl, D. Cluster Analysis. Wiley, 2011. 346 p.
2. Gan, G., Ma, C., & Wu, J. Data Clustering: Theory, Algorithms, and Applications. SIAM, 2007. 466 p..
3. Болюбаш Н. М. Інтелектуальний аналіз даних : навч. посіб. / Н. М. Болюбаш. – Миколаїв : Вид-во ЧНУ ім. Петра Могили, 2023. 320 с.
4. Han, J., Kamber, M., & Pei, J. Data Mining: Concepts and Techniques. - Morgan Kaufmann, 2011. 744 р.
5. Jain, A., Murty, M., Flynn, P. "Data Clustering: A Review." // ACM Computing Surveys, 1999, Vol. 31, No. 3, pp. 264-323.
6. Liu, Y., Li, Z., Xiong, H., Gao, X., & Wu, J. (2010). Understanding of Internal Clustering Validation Measures. In Proceedings of the 2010 IEEE International Conference on Data Mining (pp. 911-916).
7. Rohit Chandra et al. Parallel Programming in OpenMP. Morgan Kaufmann Publisher. 2001. 230 p.
8. Технологія паралельного програмування. Навчальний посібник: для студентів галузі знань «12 Інформаційні технології» спеціальності 123 «Комп’ютерна інженерія» спеціалізації 123.02 «Системне програмування» Муляревич О.В. Львів:/ Видавництво "Магнолія 2006", 2024. 213 с..
9. CUDA Toolkit Documentation. [Електронний ресурс] – Режим доступу: https://docs.nvidia.com/cuda/ (Дата звернення 16.05.2026).
10. scikit-learn: Machine Learning in Python, "Clustering." [Електронний ресурс] – Режим доступу: https://scikit-learn.org/stable/modules/clustering.html (Дата звернення 17.05.2026).
11. Bezdek, James C. "Pattern Recognition with Fuzzy Objective Function Algorithms." Boston, MA: Springer US, 1981. 272 р.
12. Ester, M., Kriegel, H.-P., Sander, J., Xu, X. A Density-Based Algorithm для Discovering Clusters в Великі простірні Databases with Noise // 2D International Conference on Knowledge Discovery and Data Mining (KDD-96). Portland, OR, USA: AAAI Press, 1996. P. 226-231.
13. Методичні вказівки до виконання кваліфікаційної роботи ор Бакалавр для студентів спеціальності 122 – Комп’ютерні науки, всіх форм навчання / укладачі: Готович В.А., Дуда О.М. Никитюк В.В. – Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2024. – 43 с.
14. Lytvynenko, I., Lupenko, S., Nazarevych, O., Shymchuk, G., & Hotovych, V. (2021). Mathematical model of gas consumption process in the form of cyclic random process. 2021 IEEE 16th International Conference on Computer Sciences and Information.
15. Lytvynenko I. V. Method of segmentation of determined cyclic signals for the problems related to their processing and modeling. Scientific journal of the Ternopil National Technical University. No. 4 (88). 2017. ISSN: 2522-4433. Р. 153–169. https://doi.org/10.33108/visnyk_tntu2017.04.153
16. Lupenko, S. A., Lytvynenko, I. V., Sverstiuk, A., Shelestovskyi, B., & Horkunenko, A. (2021). Software for Statistical Processing and Modeling of a Set of Synchronously Registered Cardio Signals of Different Physical Nature. CMIS, 194-205.
17. Bodnarchuk, I., Skorenkyy, Y., Kramar, T., Duda, O., & Nykytyuk, V. (2022). Use of Analytical Hierarchy Process in Scenarios Design for a Digital Museum with XR components. ITTAP, 414–425Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025).
18. Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025).
19. Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної та заочної (дистанційної) форм навчання / укл.: Стручок В. С. Тернопіль: ФОП Паляниця В. А., 2022. 156 с.
Тип вмісту: Bachelor Thesis
Розташовується у зібраннях:122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Файли цього матеріалу:
Файл Опис РозмірФормат 
2026_KRB_SN-41_Korol_DI.pdfДипломна робота1,37 MBAdobe PDFПереглянути/відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

Інструменти адміністратора