Tittel: About the approach of solving machine learning problems integrated with data from open source systems of electronic medical records
Alternative titler: Підхід до розв’язування задач машинного навчання інтегрованих з даними систем з відкритим кодом електронних медичних записів
Authors: Марценюк, Василь Петрович
Мілян, Назар Васильович
Martseniuk, Vasyl
Milian, Nazar
Affiliation: Університет Бельсько-Бяла, Бельсько-Бяла, Польща
Тернопільський національний технічний університет імені Івана Пулюя, Тернопіль, Україна
Belsko-Biala University, Belsko-Biala, Poland
Ternopil Ivan Puluj National Technical University, Ternopil, Ukraine
Bibliographic description (Ukraine): Martseniuk V. About the approach of solving machine learning problems integrated with data from open source systems of electronic medical records / Vasyl Martseniuk, Nazar Milian // Scientific Journal of TNTU. — Tern. : TNTU, 2019. — Vol 95. — No 3. — P. 105–115. — (Instrument-making and information-measuring systems).
Bibliographic description (International): Martseniuk V., Milian N. (2019) About the approach of solving machine learning problems integrated with data from open source systems of electronic medical records. Scientific Journal of TNTU (Tern.), vol. 95, no 3, pp. 105-115.
Is part of: Вісник Тернопільського національного технічного університету, 3 (95), 2019
Scientific Journal of the Ternopil National Technical University, 3 (95), 2019
Journal/Collection: Вісник Тернопільського національного технічного університету
Issue: 3
Volume: 95
Utgivelsesdato: 31-okt-2019
Date of entry: 13-mai-2020
Forlag: ТНТУ
Place of the edition/event: Тернопіль
UDC: 004.021
Emneord: машинне навчання
EMR система
machine learning
EMR system
Number of pages: 11
Page range: 105-115
Start page: 105
End page: 115
Abstrakt: В останні десятиліття активно розробляються рішення з охорони здоров'я на основі програмного забезпечення з відкритим кодом, а також комерційні засоби. Найпоширенішими системами електронного медичного обліку з відкритим кодом є WorldVistA, OpenEMR та OpenMRS. Вчені звертали увагу на перспективи програмного забезпечення електронних медичних записів з відкритим кодом та безкоштовних систем для країн з певними фінансовими труднощами й таких, що розвиваються. Постановка задачі машинного навчання в медичних дослідженнях здійснена. На блок-схемі, представленій у роботі, продемонстровано основні кроки для розроблення моделі машинного навчання. Звернено увагу, що задача імпорту тренінгових, тестувальних і прогнозувальних наборів даних із систем EMR у середовищі машинного навчання є не такою тривіальною через ряд причин, які розглянуто в дослідженні. Наведено кілька основних підходів для доступу до даних медичних записів пацієнтів у типових системах EMR. Представлено деякі особливості застосування підходів для двох найпоширеніших систем із відкритим кодом EMR: OpenEMR, OpenMRS. Попри тривалий період розроблення й застосувань, навіть провідні й широко розповсюджені EMR системи (як комерційні, так і безкоштовні з відкритим кодом) мають обмежену або часткову підтримку можливостей HL7. Не зважаючи на проблеми, які розглядають рівні реалізації, існує достатньо аргументів для адаптації використання форматів даних сумісних з HL7 і розроблення інформаційних систем, які орієнтовані на машинне навчання. Експериментальні дослідження, пов’язані з прогнозуванням переломів для жінок середнього віку, підтверджують, що це є на сьогодні актуальною, профілактичною проблемою. Розроблення моделі машинного навчання реалізована в середовищі вільного програмного забезпечення R за допомогою пакета mlr. У результаті отримуємо моделі машинного навчання на основі п’яти методів. Результати ефективності методів, за допомогою міри mmce, показують, що найточнішою моделю відповідно до оцінювання якості прогнозування є метод випадкового лісу (random forest), найгіршим є метод ferms.
In recent decades, open source health solutions and commercial tools have been actively developed. The most common open source electronic health accounting systems are WorldVistA, OpenEMR and OpenMRS. Scientists drew attention to the prospects of open-source electronic health records software and free systems for countries with certain financial difficulties and such developing countries. Setting the task of machine learning in medical research has been carried out. The flowchart presented in the paper demonstrates the main steps for developing a machine learning model. It is noted that the task of importing training, testing and forecasting data sets from EMR systems in the machine learning environment is not so trivial for a number of reasons discussed in the study. Here are some basic approaches for accessing patient medical record data in conventional EMR systems. Some features of approaches for the two most common EMR open source systems are presented: OpenEMR, OpenMRS. Despite a long period of development and applications, even leading and widespread EMR systems (both commercial and free open source) have limited or partial support for HL7 capabilities. Despite the challenges that the implementation level is considering, there are enough arguments to adapt the use of data formats compatible with HL7 and to develop information systems that are machine learning oriented. Experimental studies are related to the prediction of fractures for middle-aged women, confirm that this is a pressing, preventive problem today. The development of the machine learning model is implemented in the free software environment R, using the mlr package. As a result, we get machine learning models based on five methods. The results of the effectiveness of the methods, using the mmce measure, show that the exact model of compliance with the assessment of prediction quality is the random forest method, worst of all is the ferms method.
ISSN: 2522-4433
Copyright owner: © Тернопільський національний технічний університет імені Івана Пулюя, 2019
URL for reference material:
Content type: Article
