Mwaheb Ali Wais2021-06-242021-06-242020http://hdl.handle.net/123456789/16474A supplementary Research to obtain a master's degree in information technologyAbstract Data mining is the process of finding useful and relevant information from the database .there are several types of mining techniques available and applicable magnificently on various sectors . Data mining process may take important role in health care sector . The health care sector assembles enormous quantity of medical data which cannot extract to uncover hidden information for making effective decision .today heart disease have become one of the leading cause of death in Nation wide . the best prevention for this disease is to have an early system that can predict the early symptoms which can save more life . The use of data mining techniques can help researchers in predicting the probability of getting heart disease among susceptible patient . the objective of this research is to discover association rules to predict heart disease ( identify the associated risk factors of heart disease using data mining techniques ( association rules , Apriory algorithm and fp-growth algorithm )) .However the study use experimental and Descriptive method ( the extraction of significant patterns from the heart disease data set is presented in analysis section , to make the prediction process the reasearche fllow four steps as gathering data set from patien files , do preprocessing to handle missing value and selecting the frequent patterns then applying apriori and fp-growth algorithms to generation association rules . Among the most important results are The highest association between risk factors is FHX and Age with support = 1.0 , confidence=0.8 then followed the association between DM and Age with support = 1.0 , confidence=0.7 . also association rules were found among five symptoms is that : The highest association between chest pain and palpitation with support = 1.0 , confidence=1.0 Then association between chest pain and syncope with support = 1.0 , confidence=0.85 . We recommended that using other mining programs that enables the displa of data and allows the user to place display signs and use graphs .also to increase the efficiency of the results obtained from this research , we recommended that all patient data be added since the hospital wa established . we also recommended that using other algorithms for other purposed such as predicting heart disease by risk factors and disease symptoms . المستخلص التنقيب في البيانات هو عملية استخلاص كمية من البيانات ذات الصلة ، لإيجاد علاقة منطقية تلخص هذه البيانات بطريقة جديدة تكون مفهومة ومفيدة في اتخاذ القرار . يوجد العديد من تقنيات تنقيب البيانات المتاحة و القابلة للتنفيذ في مختلف القطاعات . و تأخذ عملية التنقيب عن البيانات دورًا مهمًا في قطاع الرعاية الصحية.حيث يقوم قطاع الرعاية الصحية بتجميع كمية هائلة من البيانات الطبية التي لا يمكن استخلاص و كشف المعلومات المخفية منها بطريقة يدوية و التي تساهم في اتخاذ القرار بفاعلية . في عصرنا الحالي تعتبر أمراض القلب هي أحد الأسباب الرئيسية للوفاة في العالم . و للوقاية من هذا المرض بطريقة أفضل ينبغي أن يكون هناك نظام مبكر يمكنه التنبؤ بالأعراض المبكرة لمرض القلب التي يمكن أن تنقذ المزيد من الأرواح. يمكن أن يساعد استخدام تقنيات التنقيب عن البيانات الباحثين في التنبؤ باحتمالية الإصابة بأمراض القلب و المرضى المعرضين للإصابة بهذا المرض . تهدف هذه الدراسة لاستخدام قواعد الارتباط لاكتشاف و التنبوء بمرض القلب ( تحديد عوامل الخطر المرتبطة بأمراض القلب باستخدام تقنيات استخراج البيانات (قواعد الارتباط ، خوارزمية Apriory وخوارزمية fp-Growth)). استخدم الباحث المنهج الوصفي و المنهج التحليلي لتنفيذ الدراسة . و تم توضيح كيفية استخلاص الأنماط من بيانات مرضى القلب قي باب التحليل بشكل مفصل . و لإجراء عملية التنبوء و تنفيذ الخوارزميتين اتبع الباحث أربعة خطوات و هي ( تم جمع البيانات يدويا من ملفات المرضى , و بعد ذلك تمت معالجة هذه البيانات لتنظيفها من البيانات الناقصة و المفقودة و من ثم انتقاء الأنماط المتكررة و تنفيذ الخوارزمية لتوليد قواعد الارتباط . من أهم النتائج التي توصلت إليها الدراسة : هي أن أعلى ارتباط بين عوامل الخطر هو FHX ( التاريخ المرضي للعائلة ) والعم, بمعدل الدعم= 1.0 و الثقة = 0.8 ثم يليه الارتباط بين DM ( مرض السكر ) والعمر بمعدل الدعم = 1.0 و الثقة = 0.7. و أيضا علاقة الارتباط بين أعراض مرض القلب الم الصدر و ضربات القلب هي الأعلى درجات الارتباط بمعدل الدعم = 1.0 و الثقة = 1.0 ثم يليه الم الصدر و فقدان الوعي ( الإغماء ) بمعدل الدعم = 1.0 و الثقة 0.85 . يوصي الباحث باستخدام برامج أخرى للتنقيب التي تمكن من عرض البيانات و تسمح للمستخدم بإضافة بيانات جديدة مع واجهة رسومية . و أيضا لزيادة كفاءة النتائج يوصي الباحث بإضافة جميع بيانات مرضى القلب منذ تأسيس المستشفى الى وقتنا الحاضر و فيما بعد . و أيضا استخدام خوارزميات أخرى للتنبوء بمرض القلب .heart diseaseAssociation rules Algorithmالتنقيب في البياناتKnowledge discovery of heart disease using Association rules Algorithm ( apply on Ahmed Gasim hospital )Thesis