Denne identifikatoren kan du bruke til å sitere eller lenke til denne innførselen: http://elartu.tntu.edu.ua/handle/lib/51961

Tittel: Some methodological conclusions about the generative AI model Data Analyst
Alternative titler: Деякі методологічні висновки щодо генеративної моделі ШІ «Data Analyst»
Authors: Лайтарук, Іван
Мамчич, Іван
Laitaruk, Ivan
Mamchych, Ivan
Affiliation: Волинський національний університет імені Лесі Українки, Луцьк, Україна
Lesya Ukrainka Volyn National University, Lutsk, Ukraine
Bibliographic description (Ukraine): Laitaruk I. Some methodological conclusions about the generative AI model Data Analyst / Ivan Laitaruk, Ivan Mamchych // Scientific Journal of TNTU. — Tern. : TNTU, 2025. — Vol 120. — No 4. — P. 130–140.
Bibliographic reference (2015): Laitaruk I., Mamchych I. Some methodological conclusions about the generative AI model Data Analyst // Scientific Journal of TNTU, Ternopil. 2025. Vol 120. No 4. P. 130–140.
Bibliographic citation (APA): Laitaruk, I., & Mamchych, I. (2025). Some methodological conclusions about the generative AI model Data Analyst. Scientific Journal of the Ternopil National Technical University, 120(4), 130-140. TNTU..
Bibliographic citation (CHICAGO): Laitaruk I., Mamchych I. (2025) Some methodological conclusions about the generative AI model Data Analyst. Scientific Journal of the Ternopil National Technical University (Tern.), vol. 120, no 4, pp. 130-140.
Is part of: Вісник Тернопільського національного технічного університету, 4 (120), 2025
Scientific Journal of the Ternopil National Technical University, 4 (120), 2025
Journal/Collection: Вісник Тернопільського національного технічного університету
Issue: 4
Volume: 120
Utgivelsesdato: 23-des-2025
Submitted date: 21-okt-2025
Date of entry: 23-mar-2026
Forlag: ТНТУ
TNTU
Place of the edition/event: Тернопіль
Ternopil
DOI: https://doi.org/10.33108/visnyk_tntu2025.04. 130
UDC: 004.8
Emneord: ШІ
кластеризація
моделювання
статистика
класифікація
навчання
AI
clustering
modelling
statistics
classification
teaching
Number of pages: 11
Page range: 130-140
Start page: 130
End page: 140
Abstrakt: Це дослідження присвячене вивченню можливостей генеративної моделі ШІ (GenAI) ChatGPT-5 Data Analyst (інтегрована в Chat GPT у серпні 2025 року), яка має спеціалізацію в галузі аналізу даних. Наразі використання великих мовних моделей (LLM) для виконання різноманітних завдань є вже досить поширеним явищем. Фахівці з аналізу даних тестують можливості цих технологій у своїй сфері. Наявні публікації та власний досвід авторів показали, що генеративні моделі загального призначення, такі, як ChatGPT, у деяких випадках забезпечують корисний зворотний зв’язок, а в інших – ні. Їхні спільні висновки включають як позитивний досвід застосування цих технологій для низки типових завдань, так і спостереження щодо суттєвих недоліків у певних випадках. Ці публікації надихнули нас провести власне дослідження. Оскільки ці технології розвиваються надзвичайно швидко (з одного боку, алгоритми вдосконалюються, з іншого, – збільшується база та час навчання), було б цікаво з’ясувати поточний стан справ. Мета цього дослідження протестувати можливості моделі Data Analyst, спеціалізованої на виконанні статистичних методів, методів машинного навчання та інших обчислювальних алгоритмів. Також розглянуто питання щодо доцільності залучення цього інструменту до навчання відповідних дисциплін. Проаналізовано придатність моделі ChatGPT-5 Data Analyst для навчання статистичним методам на прикладі застосування цього ресурсу для задачі кластеризації даних. Розглянуто можливості Data Analyst для трьох наборів даних із різним ступенем відокремленості кластерів та із застосуванням різних методів кластеризації, зокрема k-means, ієрархічної кластеризації (single linkage) і нечіткого методу c-means. Також оцінено можливості візуалізації, створення коду мовою R та інтерпретації результатів. Визначено можливості та обмеження цього програмного інструмента для навчання за відповідною тематикою. Було встановлено, що найпростіші базові завдання Data Analyst виконав досить ефективно, тоді як завдання середньої складності наразі можуть бути йому не під силу. Для даних із добре відокремленими кластерами кластеризація ефективно виконана за допомогою методів k-means і single linkage, кластери візуалізовані та надано робочий код мовою R. Завдання для методу c-means не виконано. Щодо інтерпретації результатів та порівняння ефективності різних методів, отримані відповіді можна вважати прийнятними, якщо розглядати їх як консультативні, що підтримують ухвалення рішень людиною. Результатом дослідження є висновок про необхідність навчати студентів використовувати ШІ для аналізу даних разом із обговоренням його обмежень, наслідків, етичних аспектів та викликів для фахівців у цій галузі.
This work is devoted to studying the capabilities of the generative AI (GenAI) ChatGPT-4o model Data Analyst (integrated in Chat GPT in August 2025), which has a specialization in the field of data analysis. Currently, the use of large language models (LLM) for various tasks is already a widespread phenomenon. Data scientists are testing the capabilities of these technologies in their field. Available publications and the authors’ own experience have shown that general-purpose generative models, such as ChatGPT, provide useful feedback in some cases, and in others – not. Their common conclusions are both positive experience in applying these technologies for a number of typical tasks, and also observations about significant shortcomings for certain cases. These publications inspired us to do our own research. Since these technologies are developing extremely rapidly (on the one hand, algorithms are improving, on the other hand, the base and training time are increasing), it would be interesting to find out the current state of affairs. The purpose of this study was to test the capabilities of the Data Analyst model, specialized for performing statistical methods, machine learning methods and other computational algorithms. The question of whether this tool should be involved in teaching relevant disciplines was also studied. In this paper, we analyze the suitability of the ChatGPT-5 Data Analyst model for training in statistical methods using the example of applying this resource to the clustering problem. The capabilities of Data Analyst are considered for three data sets with different degrees of cluster separation and using different clustering methods, including k - means, single linkage, and the fuzzy clustering method c-means. The possibilities of visualization, code creation in the R program, and interpretation of results are also considered. The paper establishes the capabilities and limitations of this software tool for training in this topic. It was found that the simplest basic tasks Data Analyst has performed quite effectively, while tasks of medium complexity may not be within its power at the moment. For clustering well-separated data, clustering was effectively performed using the k- means and single linkage methods, clusters were visualized, and the working code in the R program was provided. The task was not performed for the c-means method. Regarding the interpretation of the results and comparison of the effectiveness of different methods, the obtained answers can be considered acceptable if we consider these answers as advisory, supporting human decision-making. The result of our study is the conclusion about the need to teach students to use AI for data analysis along with a discussion of its limitations, consequences, ethical aspects and challenges for professionals in this field.
URI: http://elartu.tntu.edu.ua/handle/lib/51961
ISSN: 2522-4433
Copyright owner: © Тернопільський національний технічний університет імені Івана Пулюя, 2025
URL for reference material: https://mon.gov.ua/static-objects/mon/sites/1/news/2025/04/24/shi-v-zakladakh-vyshchoi-osvity-24-04-2025.pdf
https://ist.mit.edu/ai
https://ist.mit.edu/ai-guidance
https://www.su.se/institutionen-for-data-och-systemvetenskap/utbildning/under-utbildningen/dsv-s-ai-policy-1.705900
https://www.mit.edu.au/about-mit/institute-publications/policies-procedures-and-guidelines/GenAIinLearningTeachingAndResearch
https://mon.gov.ua/news/bezoplatnyi-richnyi-dostup-do-gemini-z-pidpyskoiu-ai-pro-dlia-ukrainskykh-studentiv-vid-google
https://doi.org/10.1016/j.techsoc.2025.102813
https://doi.org/10.1016/j.chbah.2025.100121
https://doi.org/10.1080/0020739X.2025.2505200
https://doi.org/10.1080/0020739X.2024.2357341
https://neurohive.io/en/ai-apps/code-interpreter-plugin-chatgpt/
https://doi.org/10.1111/test.12398
https://talmo.uk/2025/AIinStats.html
https://doi.org/10.1080/26939169.2023.2223609
https://doi.org/10.3389/feduc.2024.1417900
https://sloanreview.mit.edu/article/five-trends-in-ai-and-data-science-for-2025/
https://doi.org/10.33108/visnyk_tntu2024.01.143
https://chatgpt.com/g/g-HMNcP6w7d-data-analyst
https://tilburg.ai/2023/12/github-copilot-rstudio/
https://tilburgsciencehub.com/topics/automation/ai/gpt-models/github-copilot/
References (International): 1. Ministry of Education and Science and Ministry of Digital Transformation of Ukraine, Recommendations on the responsible implementation and use of artificial intelligence technologies in higher education institutions, Government Report, 2025. URL: https://mon.gov.ua/static-objects/mon/sites/1/news/2025/04/24/shi-v-zakladakh-vyshchoi-osvity-24-04-2025.pdf.
2. The Massachusetts Institute of Technology (MIT), Generative ai use at mit, Institutional Web Page, 2023. URL: https://ist.mit.edu/ai.
3. The Massachusetts Institute of Technology (MIT), Guidance for use of generative ai tools, Institutional Web Page, 2023. URL: https://ist.mit.edu/ai-guidance.
4. Stockholm University. Department of Computer and Systems Sciences, Dsv’s ai policy, Institutional Policy, 2024. URL: https://www.su.se/institutionen-for-data-och-systemvetenskap/utbildning/under-utbildningen/dsv-s-ai-policy-1.705900.
5. Melbourne Institute of Technology, Use of generative artificial intelligence in learning, teaching and research policy and procedure, Institutional Policy, 2024. URL: https://www.mit.edu.au/about-mit/institute-publications/policies-procedures-and-guidelines/GenAIinLearningTeachingAndResearch.
6. Ministry of Education and Science of Ukraine, gem-ini ai pro google, 2025. URL: https://mon.gov.ua/news/bezoplatnyi-richnyi-dostup-do-gemini-z-pidpyskoiu-ai-pro-dlia-ukrainskykh-studentiv-vid-google.
7. Andersen J. P., Degn L., Fishberg R., Graversen E. K., Horbach S. P. J. M., Schmidt E. K., Schneider J. W., M. Sorensen P. (2025) Generative artificial intelligence (genai) in the research process – a survey of researchers’ practices and perceptions, Technology in Society 81, 102813. URL: https://doi.org/10.1016/j.techsoc.2025.102813. https://doi.org/10.1016/j.techsoc.2025.102813
8. McDonald N., Johri A., Ali A., Collier A. H. (2025) Generative artificial intelligence in higher education: Evidence from an analysis of institutional policies and guidelines, Computers in Human Behavior: Artificial Humans 3, 100121. https://doi.org/10.1016/j.chbah.2025.100121
9. Slobodsky P., Durcheva M. (2025) Using chatgpt errors to encourage student exploration and self-learning in mathematics, International Journal of Mathematical Education in Science and Technology 1–25. https://doi.org/10.1080/0020739X.2025.2505200
10. Taani O., Alabidi S. (2024) Chatgpt in education: Benefits and challenges of chatgpt for mathematics and science teaching practices, International Journal of Mathematical Education in Science and Technology, 1–30. https://doi.org/10.1080/0020739X.2024.2357341
11. Apps A., Openai releases code interpreter plugin, significantly expanding chatgpt’s capabilities, Neurohive, 2023. URL: https://neurohive.io/en/ai-apps/code-interpreter-plugin-chatgpt/.
12. Schwarz J., (2025) The use of generative ai in statistical data analysis and its impact on teaching statistics at universities of applied sciences, Teaching Statistics: An International Journal for Statistics and Data Science Teaching, 47, 118–128. https://doi.org/10.1111/test.12398
13. Talmo.uk, Bridging innovation and practice: Integrating modern ai technologies into the statistics curriculum, Workshop, 9 April 2025, Glasgow, 2025. URL: https://talmo.uk/2025/AIinStats.html.
14. Ellis A. R., Slade E., (2023) A new era of learning: Considerations for chatgpt as a tool to enhance statistics and data science education, Journal of Statistics and Data Science Education, 31, 128–133. https://doi.org/10.1080/26939169.2023.2223609
15. Prandner D., Wetzelhutter D., Hese S., (2025) Chatgpt as a data analyst: an exploratory study on ai- supported quantitative data analysis in empirical research, Frontiers in Education, Section Digital Education 9. https://doi.org/10.3389/feduc.2024.1417900
16. Davenport T. H., Bean R., Five trends in ai and data science for 2025, MIT Sloan Management Review (2025). URL: https://sloanreview.mit.edu/article/five-trends-in-ai-and-data-science-for-2025/, published January 08, 2025.
17. Pastukh O., Yatsyshyn V. (2024) Development of software for neuromarketing based on artificial intelligence and data science using high-performance computing and parallel programming technologies. Scientific Journal of TNTU, vol. 113, no. 1, pp. 143–149. https://doi.org/10.33108/visnyk_tntu2024.01.143
18. OpenAI, Chatgpt data analyst, Web Tool, 2025. URL: https://chatgpt.com/g/g-HMNcP6w7d-data-analyst.
19. Tilburg.ai, How to use github copilot in rstudio, Web Article, 2023. URL: https://tilburg.ai/2023/12/github-copilot-rstudio/.
20. Tilburg Science Hub, Github copilot in rstudio and vs code, Web Article, 2023. URL: https://tilburgsciencehub.com/topics/automation/ai/gpt-models/github-copilot/.
Content type: Article
Vises i samlingene:Вісник ТНТУ, 2025, № 4 (120)



Alle innførsler i DSpace er beskyttet av copyright