استخدام تنقيب البيانات لبناء الخطط العلاجية لمرضى السكرى

Thumbnail Image

Date

2018

Journal Title

Journal ISSN

Volume Title

Publisher

جامعة النيلين

Abstract

مستخلص وجود كميات كبيرة من البيانات عن الامراض المزمنة أدى الى الحوجة الملحة للاستفادة من التقنيات الحديثة لتنظيم هذه البيانات وتحويلها الى معلومات مفيدة يمكن الاستفادة منها. في هذا البحث تم عرض مشكلة كيفية مساعدة الاطباء في بناء الخطط العلاجية لتشخيص مرضى السكري باستخدام تنقيب البيانات. وتطرق هذا البحث لمرض السكر وشمل انواعه المختلفة، مسبباته، اعراضه، مضاعفاته، انواع العلاجات المتاحة، تقنيات تنقيب البيانات المختلفة الوصفية، التنبؤية وكيفية الاستفادة من هذه الخوارزميات في المعرفة عن مرضى السكري. تم بناء نموذج لتشخيص الخطط العلاجية لمرضى السكرى وهم عبارة عن المرضى المسيطرون على مرض السكر وبالتالي تقل المضاعفات لديهم ويشكل المرض بالنسبة لهم اقل خطورة. والمرضى غير المسيطرون على المرض وهم أكثر عرضة للمضاعفات ويشكل المرض خطورة على حياتهم. ولبناء نموذج البحث تم استخدام مجموعة بيانات طبية حقيقية من مراكز طبية حيث شملت 10061 سجل طبي وعدد 28 حقل. ولدعم قرار الاطباء تم استخدام خوارزميات مختلفة من خوارزميات التصنيف والتجميع لبناء نموذج البحث. ومر نموذج البحث بمرحلتين في المرحلة الأولى تم بناء نموذج تصنيف لتشخيص الخطط العلاجية واستخدم فيه خوارزميات التصنيف وهي Decision Tree , Naive Bayes, Logistic . ولوجود تحيز في البيانات تم استخدام منحنى روك Roc Curve لتوضيح مدى جودة خوارزميات التصنيف وبعد عمل عدة تجارب تم اختيار خوارزمية ال Logistic بنتائج: كانت فيها نسبة الدقة 73.36، معدل الخطأ 26.64، Roc 0.644، الضبط 0.696. وتعتبر هذه النتائج هي الأفضل مقارنة مع الخوارزميات الأخرى (Decision Tree , Naive Bayes). وفي المرحلة الثانية تم بناء نموذج تصنيف لتشخيص الخطط العلاجية لمرضى السكري واستخدم فيه خوارزمية التجميع وتم استخدام Simple Kmean واظهرت هذه المرحلة من بناء النموذج نسبة دقة 64%. وباستخدام المرحلتين من النموذجين (التصنيف والتجميع) يستطيع الأطباء تشخيص مدي صلاحية الخطط العلاجية لمرضى جدد. واوصت الدراسة باستخدام تقنية التنقيب عن البيانات في المجالات الطبية لما لديها من امتيازات في تقديم أفضل تشخيص للخطط العلاجية للمرضى. ABSTRACT The existence of large amounts of data on chronic diseases has led to the urgent need to take advantage of modern technologies to organize this data and turn it into useful information can be used. In this research, a problem was presented as to how to help doctors build treatment plans to diagnose diabetics using data mining. The research covered diabetes, its various types, its causes, its symptoms, its complications, types of treatments available, the techniques of exploration of different descriptive data, predictive and how to benefit from these algorithms in knowledge about diabetes patients. A model has been developed to diagnose the treatment plans for diabetics, which are the patients who control diabetes and thus less complications and the disease is less dangerous for them. Patients who are not in control of the disease are more susceptible to complications and the disease is dangerous to their lives. To construct the research model, a real medical data collection was used from medical centers, which included 10061 medical records and 28 fields. To support the doctors' decision various algorithms of classification and clustering algorithms were used to build the research model. The research model went through two phases in the first phase. A classification model was developed to diagnose the treatment plans and used the classification algorithm, Decision Tree, Naive Bayes, Logistic. For a data bias, the Roc Curve curve was used to illustrate the quality of the classification algorithms. After several experiments, the Logistic algorithm was selected with results: accuracy rate was 73.36, , misclassification rate was 26.64, Roc 0.644, precision 0.696. These results are best compared to other logarthm (Decision Tree, Naive Bayes). In the second stage, a classification model was used to diagnose diabetes treatment plans and used clustering algorithmand simple Kmean was used and this phase of the model showed a 64% accuracy. Using the two phases of the two models (classification and clustering), doctors can diagnose the validity of treatment plans for new patients. The study recommended using the technique of data mining in the medical field because of its privileges in providing the best diagnosis of treatment plans for patient.

Description

بحث لنيل درجة الماجستير في تقانة علوم الحاسوب

Keywords

الخطط العلاجية

Citation

Endorsement

Review

Supplemented By

Referenced By