Моля, използвайте този идентификатор за цитиране или линк към този публикация:
http://elartu.tntu.edu.ua/handle/lib/52882| Заглавие: | Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++ |
| Други Заглавия: | Implementation of Parallel Data Clustering Algorithms in Python and C++ |
| Автори: | Король, Дмитро Ігорович Korol, Dmytro |
| Affiliation: | Тернопільський національний технічний університет імені ім. І. Пулюя |
| Bibliographic reference (2015): | Король Д. І. Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++ : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Матійчук. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 54 с. |
| Дата на Публикуване: | 23-Юни-2026 |
| Submitted date: | 9-Юни-2026 |
| Date of entry: | 29-Юни-2026 |
| Издател: | Тернопільський національний технічний університет імені ім. І. Пулюя |
| Country (code): | UA |
| Place of the edition/event: | Тернопіль |
| Supervisor: | Матійчук, Любомир Павлович Matiichuk, Liubomyr |
| UDC: | 004.82 |
| Ключови Думи: | 122 комп’ютерні науки кластеризація продуктивність розпаралелювання dbscan c-means k-means cuda openmp clustering performance parallelization |
| Page range: | 54 |
| Резюме: | Кваліфікаційна робота присвячена дослідженню алгоритмів кластеризації даних (K-mean, C-means, DBSCAN) з подальшою їх програмною реалізацією та оцінкою якості роботи із проведенням порівняльного аналізу приросту швидкості. У першому розділі викладено основні визначення кластерного аналізу, наведено дві технології для використання паралельних обчислень (OpenMP та CUDA). У другому розділі виконано докладний аналіз та здійснена реалізація паралельних алгоритмів кластеризації на мовах Python i C++. Проведені вимірювання часу роботи алгоритмів із оцінкою якості. У третьому розділі проведено порівняльний аналіз приросту швидкості, зроблено висновки про отримані результати. Експериментально показано, що використання технологій організації паралельних обчислень значно прискорює роботу програмного коду. У четвертому розділі розглянуто питання безпеки життєдіяльності і основ охорони праці. The Thesis deals with the study of data clustering algorithms (K-mean, C-means, DBSCAN) with their subsequent software implementation and quality assessment of work with a comparative analysis of the speed increase. The first section presents the basic definitions of cluster analysis, two technologies for using parallel computing (OpenMP and CUDA) are presented. The second section provides a detailed analysis and implementation of parallel clustering algorithms in Python and C++. The running time of the algorithms is measured with a quality assessment. The third section provides a comparative analysis of the speed increase, and conclusions are drawn on the results obtained. It is experimentally shown that the use of parallel computing technologies significantly speeds up the work of the program code. The fourth section considers the issues of life safety and the basics of labor protection. |
| Описание: | Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 23.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя |
| Content: | ВСТУП 8 РОЗДІЛ 1 ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ 10 1.1 Кластеризація 10 1.1.1 Введення до кластерного аналізу 10 1.1.2 Визначення задач кластеризації 11 1.1.3 Різноманітність задач кластеризації 11 1.1.4 Форми кластерів 12 1.1.5 Методи кластеризації 13 1.1.6 Оцінка якості кластеризації 13 1.2 Пришвидшення обчислень за допомогою паралельного програмування 14 1.2.1 Основні поняття та принципи паралельного програмування 14 1.2.2 Технологія OpenMP 14 1.2.3 Технологія CUDA 15 РОЗДІЛ 2. АНАЛІЗ ТА РЕАЛІЗАЦІЯ ПАРАЛЕЛЬНИХ АЛГОРИТМІВ КЛАСТЕРИЗАЦІЇ 17 2.1 Огляд алгоритмів K-means, C-means, DBSCAN 17 2.1.1 Алгоритм K-means /К-середніх (алгоритм Ллойда) 17 2.1.2 Fuzzy C-means / Алгоритм нечіткої кластеризації С-середніх 18 2.1.3 DBSCAN 20 2.2 Характеристики обчислювальної техніки 21 2.3 Реалізація алгоритмів на Python 22 2.3.1 Дослідження та вимірювання 22 2.3.2 Функції та їх параметри 22 2.3. Перевірка алгоритмів 24 2.3.4 Вимірювання часу роботи алгоритмів 33 2.4 Реалізація алгоритмів на С++ 35 РОЗДІЛ 3. ВИКОРИСТАННЯ ТЕХНОЛОГІЙ РОЗПАРАЛЕЛЮВАННЯ ТА ПОРІВНЯЛЬНИЙ АНАЛІЗ ПРОДУКТИВНОСТІ АЛГОРИТМІВ 37 3.1 Паралелізація програм із використанням технології OpenMP 37 3.2 Обчислення на GPU з використанням технології CUDA 38 3.3 Порівняльний аналіз продуктивності алгоритмів з різними реалізаціями 41 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 46 4.1 Долікарська допомога при ураженні електричним струмом 46 4.2 Вимоги ергономіки до організації робочого місця оператора ПК 48 ВИСНОВКИ 52 ПЕРЕЛІК ДЖЕРЕЛ 53 |
| URI: | http://elartu.tntu.edu.ua/handle/lib/52882 |
| Copyright owner: | © Король Дмитро Ігорович, 2026 |
| References (Ukraine): | 1. Everitt, B. S., Landau, S., Leese, M., & Stahl, D. Cluster Analysis. Wiley, 2011. 346 p. 2. Gan, G., Ma, C., & Wu, J. Data Clustering: Theory, Algorithms, and Applications. SIAM, 2007. 466 p.. 3. Болюбаш Н. М. Інтелектуальний аналіз даних : навч. посіб. / Н. М. Болюбаш. – Миколаїв : Вид-во ЧНУ ім. Петра Могили, 2023. 320 с. 4. Han, J., Kamber, M., & Pei, J. Data Mining: Concepts and Techniques. - Morgan Kaufmann, 2011. 744 р. 5. Jain, A., Murty, M., Flynn, P. "Data Clustering: A Review." // ACM Computing Surveys, 1999, Vol. 31, No. 3, pp. 264-323. 6. Liu, Y., Li, Z., Xiong, H., Gao, X., & Wu, J. (2010). Understanding of Internal Clustering Validation Measures. In Proceedings of the 2010 IEEE International Conference on Data Mining (pp. 911-916). 7. Rohit Chandra et al. Parallel Programming in OpenMP. Morgan Kaufmann Publisher. 2001. 230 p. 8. Технологія паралельного програмування. Навчальний посібник: для студентів галузі знань «12 Інформаційні технології» спеціальності 123 «Комп’ютерна інженерія» спеціалізації 123.02 «Системне програмування» Муляревич О.В. Львів:/ Видавництво "Магнолія 2006", 2024. 213 с.. 9. CUDA Toolkit Documentation. [Електронний ресурс] – Режим доступу: https://docs.nvidia.com/cuda/ (Дата звернення 16.05.2026). 10. scikit-learn: Machine Learning in Python, "Clustering." [Електронний ресурс] – Режим доступу: https://scikit-learn.org/stable/modules/clustering.html (Дата звернення 17.05.2026). 11. Bezdek, James C. "Pattern Recognition with Fuzzy Objective Function Algorithms." Boston, MA: Springer US, 1981. 272 р. 12. Ester, M., Kriegel, H.-P., Sander, J., Xu, X. A Density-Based Algorithm для Discovering Clusters в Великі простірні Databases with Noise // 2D International Conference on Knowledge Discovery and Data Mining (KDD-96). Portland, OR, USA: AAAI Press, 1996. P. 226-231. 13. Методичні вказівки до виконання кваліфікаційної роботи ор Бакалавр для студентів спеціальності 122 – Комп’ютерні науки, всіх форм навчання / укладачі: Готович В.А., Дуда О.М. Никитюк В.В. – Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2024. – 43 с. 14. Lytvynenko, I., Lupenko, S., Nazarevych, O., Shymchuk, G., & Hotovych, V. (2021). Mathematical model of gas consumption process in the form of cyclic random process. 2021 IEEE 16th International Conference on Computer Sciences and Information. 15. Lytvynenko I. V. Method of segmentation of determined cyclic signals for the problems related to their processing and modeling. Scientific journal of the Ternopil National Technical University. No. 4 (88). 2017. ISSN: 2522-4433. Р. 153–169. https://doi.org/10.33108/visnyk_tntu2017.04.153 16. Lupenko, S. A., Lytvynenko, I. V., Sverstiuk, A., Shelestovskyi, B., & Horkunenko, A. (2021). Software for Statistical Processing and Modeling of a Set of Synchronously Registered Cardio Signals of Different Physical Nature. CMIS, 194-205. 17. Bodnarchuk, I., Skorenkyy, Y., Kramar, T., Duda, O., & Nykytyuk, V. (2022). Use of Analytical Hierarchy Process in Scenarios Design for a Digital Museum with XR components. ITTAP, 414–425Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025). 18. Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025). 19. Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної та заочної (дистанційної) форм навчання / укл.: Стручок В. С. Тернопіль: ФОП Паляниця В. А., 2022. 156 с. |
| Content type: | Bachelor Thesis |
| Показва се в Колекции: | 122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври) |
Файлове в Този Публикация:
| Файл | Описание | Размер | Формат | |
|---|---|---|---|---|
| 2026_KRB_SN-41_Korol_DI.pdf | Дипломна робота | 1,37 MB | Adobe PDF | Изглед/Отваряне |
Публикацияте в DSpace са защитени с авторско право, с всички права запазени, освен ако не е указно друго.
Админ Инструменти