กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้: http://elartu.tntu.edu.ua/handle/lib/52882
Název: Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++
Další názvy: Implementation of Parallel Data Clustering Algorithms in Python and C++
Autoři: Король, Дмитро Ігорович
Korol, Dmytro
Affiliation: Тернопільський національний технічний університет імені ім. І. Пулюя
Bibliographic reference (2015): Король Д. І. Реалізація паралельних алгоритмів кластеризації даних на мовах Python та С++ : робота на здобуття кваліфікаційного ступеня бакалавра : спец. 122 - комп’ютерні науки / наук. кер. Л. П. Матійчук. Тернопіль : Тернопільський національний технічний університет імені Івана Пулюя, 2026. 54 с.
Datum vydání: 23-čer-2026
Submitted date: 9-čer-2026
Date of entry: 29-čer-2026
Nakladatel: Тернопільський національний технічний університет імені ім. І. Пулюя
Country (code): UA
Place of the edition/event: Тернопіль
Supervisor: Матійчук, Любомир Павлович
Matiichuk, Liubomyr
UDC: 004.82
Klíčová slova: 122
комп’ютерні науки
кластеризація
продуктивність
розпаралелювання
dbscan
c-means
k-means
cuda
openmp
clustering
performance
parallelization
Page range: 54
Abstrakt: Кваліфікаційна робота присвячена дослідженню алгоритмів кластеризації даних (K-mean, C-means, DBSCAN) з подальшою їх програмною реалізацією та оцінкою якості роботи із проведенням порівняльного аналізу приросту швидкості. У першому розділі викладено основні визначення кластерного аналізу, наведено дві технології для використання паралельних обчислень (OpenMP та CUDA). У другому розділі виконано докладний аналіз та здійснена реалізація паралельних алгоритмів кластеризації на мовах Python i C++. Проведені вимірювання часу роботи алгоритмів із оцінкою якості. У третьому розділі проведено порівняльний аналіз приросту швидкості, зроблено висновки про отримані результати. Експериментально показано, що використання технологій організації паралельних обчислень значно прискорює роботу програмного коду. У четвертому розділі розглянуто питання безпеки життєдіяльності і основ охорони праці.
The Thesis deals with the study of data clustering algorithms (K-mean, C-means, DBSCAN) with their subsequent software implementation and quality assessment of work with a comparative analysis of the speed increase. The first section presents the basic definitions of cluster analysis, two technologies for using parallel computing (OpenMP and CUDA) are presented. The second section provides a detailed analysis and implementation of parallel clustering algorithms in Python and C++. The running time of the algorithms is measured with a quality assessment. The third section provides a comparative analysis of the speed increase, and conclusions are drawn on the results obtained. It is experimentally shown that the use of parallel computing technologies significantly speeds up the work of the program code. The fourth section considers the issues of life safety and the basics of labor protection.
Popis: Роботу виконано на кафедрі комп'ютерних наук Тернопільського національного технічного університету імені Івана Пулюя. Захист відбудеться 23.06.2026р. на засіданні екзаменаційної комісії №31 у Тернопільському національному технічному університеті імені Івана Пулюя
Content: ВСТУП 8 РОЗДІЛ 1 ОГЛЯД ПРЕДМЕТНОЇ ОБЛАСТІ 10 1.1 Кластеризація 10 1.1.1 Введення до кластерного аналізу 10 1.1.2 Визначення задач кластеризації 11 1.1.3 Різноманітність задач кластеризації 11 1.1.4 Форми кластерів 12 1.1.5 Методи кластеризації 13 1.1.6 Оцінка якості кластеризації 13 1.2 Пришвидшення обчислень за допомогою паралельного програмування 14 1.2.1 Основні поняття та принципи паралельного програмування 14 1.2.2 Технологія OpenMP 14 1.2.3 Технологія CUDA 15 РОЗДІЛ 2. АНАЛІЗ ТА РЕАЛІЗАЦІЯ ПАРАЛЕЛЬНИХ АЛГОРИТМІВ КЛАСТЕРИЗАЦІЇ 17 2.1 Огляд алгоритмів K-means, C-means, DBSCAN 17 2.1.1 Алгоритм K-means /К-середніх (алгоритм Ллойда) 17 2.1.2 Fuzzy C-means / Алгоритм нечіткої кластеризації С-середніх 18 2.1.3 DBSCAN 20 2.2 Характеристики обчислювальної техніки 21 2.3 Реалізація алгоритмів на Python 22 2.3.1 Дослідження та вимірювання 22 2.3.2 Функції та їх параметри 22 2.3. Перевірка алгоритмів 24 2.3.4 Вимірювання часу роботи алгоритмів 33 2.4 Реалізація алгоритмів на С++ 35 РОЗДІЛ 3. ВИКОРИСТАННЯ ТЕХНОЛОГІЙ РОЗПАРАЛЕЛЮВАННЯ ТА ПОРІВНЯЛЬНИЙ АНАЛІЗ ПРОДУКТИВНОСТІ АЛГОРИТМІВ 37 3.1 Паралелізація програм із використанням технології OpenMP 37 3.2 Обчислення на GPU з використанням технології CUDA 38 3.3 Порівняльний аналіз продуктивності алгоритмів з різними реалізаціями 41 РОЗДІЛ 4. БЕЗПЕКА ЖИТТЄДІЯЛЬНОСТІ, ОСНОВИ ОХОРОНИ ПРАЦІ 46 4.1 Долікарська допомога при ураженні електричним струмом 46 4.2 Вимоги ергономіки до організації робочого місця оператора ПК 48 ВИСНОВКИ 52 ПЕРЕЛІК ДЖЕРЕЛ 53
URI: http://elartu.tntu.edu.ua/handle/lib/52882
Copyright owner: © Король Дмитро Ігорович, 2026
References (Ukraine): 1. Everitt, B. S., Landau, S., Leese, M., & Stahl, D. Cluster Analysis. Wiley, 2011. 346 p.
2. Gan, G., Ma, C., & Wu, J. Data Clustering: Theory, Algorithms, and Applications. SIAM, 2007. 466 p..
3. Болюбаш Н. М. Інтелектуальний аналіз даних : навч. посіб. / Н. М. Болюбаш. – Миколаїв : Вид-во ЧНУ ім. Петра Могили, 2023. 320 с.
4. Han, J., Kamber, M., & Pei, J. Data Mining: Concepts and Techniques. - Morgan Kaufmann, 2011. 744 р.
5. Jain, A., Murty, M., Flynn, P. "Data Clustering: A Review." // ACM Computing Surveys, 1999, Vol. 31, No. 3, pp. 264-323.
6. Liu, Y., Li, Z., Xiong, H., Gao, X., & Wu, J. (2010). Understanding of Internal Clustering Validation Measures. In Proceedings of the 2010 IEEE International Conference on Data Mining (pp. 911-916).
7. Rohit Chandra et al. Parallel Programming in OpenMP. Morgan Kaufmann Publisher. 2001. 230 p.
8. Технологія паралельного програмування. Навчальний посібник: для студентів галузі знань «12 Інформаційні технології» спеціальності 123 «Комп’ютерна інженерія» спеціалізації 123.02 «Системне програмування» Муляревич О.В. Львів:/ Видавництво "Магнолія 2006", 2024. 213 с..
9. CUDA Toolkit Documentation. [Електронний ресурс] – Режим доступу: https://docs.nvidia.com/cuda/ (Дата звернення 16.05.2026).
10. scikit-learn: Machine Learning in Python, "Clustering." [Електронний ресурс] – Режим доступу: https://scikit-learn.org/stable/modules/clustering.html (Дата звернення 17.05.2026).
11. Bezdek, James C. "Pattern Recognition with Fuzzy Objective Function Algorithms." Boston, MA: Springer US, 1981. 272 р.
12. Ester, M., Kriegel, H.-P., Sander, J., Xu, X. A Density-Based Algorithm для Discovering Clusters в Великі простірні Databases with Noise // 2D International Conference on Knowledge Discovery and Data Mining (KDD-96). Portland, OR, USA: AAAI Press, 1996. P. 226-231.
13. Методичні вказівки до виконання кваліфікаційної роботи ор Бакалавр для студентів спеціальності 122 – Комп’ютерні науки, всіх форм навчання / укладачі: Готович В.А., Дуда О.М. Никитюк В.В. – Тернопіль: Тернопільський національний технічний університет імені Івана Пулюя, 2024. – 43 с.
14. Lytvynenko, I., Lupenko, S., Nazarevych, O., Shymchuk, G., & Hotovych, V. (2021). Mathematical model of gas consumption process in the form of cyclic random process. 2021 IEEE 16th International Conference on Computer Sciences and Information.
15. Lytvynenko I. V. Method of segmentation of determined cyclic signals for the problems related to their processing and modeling. Scientific journal of the Ternopil National Technical University. No. 4 (88). 2017. ISSN: 2522-4433. Р. 153–169. https://doi.org/10.33108/visnyk_tntu2017.04.153
16. Lupenko, S. A., Lytvynenko, I. V., Sverstiuk, A., Shelestovskyi, B., & Horkunenko, A. (2021). Software for Statistical Processing and Modeling of a Set of Synchronously Registered Cardio Signals of Different Physical Nature. CMIS, 194-205.
17. Bodnarchuk, I., Skorenkyy, Y., Kramar, T., Duda, O., & Nykytyuk, V. (2022). Use of Analytical Hierarchy Process in Scenarios Design for a Digital Museum with XR components. ITTAP, 414–425Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025).
18. Заікіна Д., Глива В. Основи охорони праці та безпека життєдіяльності. 2019. URL: https://doi.org/10.31435/rsglobal/001 (дата звернення: 19.05.2025).
19. Безпека в надзвичайних ситуаціях. Методичний посібник для здобувачів освітнього ступеня «магістр» всіх спеціальностей денної та заочної (дистанційної) форм навчання / укл.: Стручок В. С. Тернопіль: ФОП Паляниця В. А., 2022. 156 с.
Content type: Bachelor Thesis
Vyskytuje se v kolekcích:122 — Компʼютерні науки, F3 Комп’ютерні науки (бакалаври)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
2026_KRB_SN-41_Korol_DI.pdfДипломна робота1,37 MBAdobe PDFZobrazit/otevřít


Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

เครื่องมือสำหรับผู้ดูแลระบบ