صفاء ادم الدود بشير2021-06-142021-06-142020http://hdl.handle.net/123456789/16422بحث تكميلي لنيل درجة الماجستير في نظم المعلوماتالمستخلـــــــص يقدم هذا البحث دراسة تطبيقية في مجال التنقيب عن البيانات (Data Mining) واكتشاف المعرفة في قواعد البيانات( Knowledge Discovery in Database) ان من اكبر المشاكل التي يعاني منها المجتمع إنتشار أمراض الكلازار الذي يعد من الامراض المستوطنة و ذلك لعدم القدره على معرفة اسباب انتشاره وتحديدها بدقه لذا الهدف الرئيسي لهذه الدراسة هو مساعدة الاطباء في تشخيص مرض الكلازار وكذلك معرفة اسباب انتشار المرض وتقليل الوقت اللازم في تحليل بيانات مرض الكلازار واستحراج المعرفة من تلك البيانات . ترتكز منهجية هذا البحث أولاً على تحضير البيانات التي تم الحصول عليها تقارير مرض الكلازار وزارة الصحة ولاية القضارف وبيانات الارصاد الجوي ، ثم تطبيق تقنية التنقيب عن البيانات( Data Mining Techniques ) التي اختيرت و بتسلسل معين بالرجوع لمجموعة من المبررات يمكن إيجازها في محورين هما: مناسبة الطرق لطبيعة البيانات و تلاؤمها مع الهدف من البحث، هذا بالإضافة للكفاءة في اكتشاف الأنماط. هذه الطريقة هي شجرة القرار( Decision Tree )؛ حيث طبقت خوارزمية (J48) في تقنية أشجار القرار. عند إدخال كل بيانات التدريب تم التنبؤ بصوره صحيحة بنسبة 76.1598 % نسبة لعدد البيانات 591 حالة وتم التنبؤ بصوره خاطئه بنسبة 23.8402 % لعدد 185 حالة وكان بالشجرة 40 عقدة والحجم الكلي للشجرة 51 وإستغرق تنفيذ هذه العملية 0.03 seconds.عندما تم تم إختيار مجموعة من البيانات بنسبة 66% (ثلثي البيانات) صنفت 289 حالة بصوره صحيحة بنسبة 76.8939 % لعدد 203 حالة وصنفت 61 حالة بصوره خاطئه بنسبة 23.1061 % واستغرق تنفيذ هذه العملية 0.03 seconds . ولزيادة كفاءة النتائج المتحصل عليها من هذا البحث أوصى بإضافة البيانات التي تعزر الحصول عليها في السنوات الاخيره . و إستخدام طرق عنقدة أخرى مع مجموعة من البيانات للحصول على مزيد من المعلومات . وتطبيق الدراسة بصورة اوسع حتى تشمل كل او بعض ولايات السودان وبأستخدام خوارزميات متعددة ومقارنة النتائج مع نتائج هذه الدراسة. Abstract This research presents an applied study in the field of data mining and knowledge discovery in database. One of the biggest problems faced by society is the spread of kala azar diseases, which is one of the endemic diseases due to the inability to know and determine the causes of its spread. Accurately, therefore, the main goal of this study is to assist doctors in diagnosing kala azar disease, as well as to know the causes of disease spread and reduce the time required in analyzing the data of kala azar disease and the lack of knowledge from that data. The methodology of this research is based first on preparing the data obtained, reports of Clazar disease, Ministry of Health, Gedaref State, and meteorological data, then applying the data mining techniques that were chosen in a specific sequence by referring to a set of justifications that can be summarized in two axes: Methods for the nature of the data and its suitability for the purpose of the research, in addition to the efficiency in detecting patterns. This method is the Decision Tree. Where the algorithm (J48) was applied in the decision trees technique. When entering all training data, a correct forecast was made By 76.1598% for the number of data 591 cases, and it was incorrectly predicted by 23.8402% for 185 cases, and the tree was 40 knots and the total size of the tree was 51, and it took 0.03 seconds to perform this process. Correctly, by 76.8939% for 203 cases, 61 cases were classified incorrectly, at 23.1061%, and it took 0.03 seconds to complete this process. In order to increase the efficiency of the results obtained from this research, it is recommended to add data that could be obtained in recent years. And use other cluster methods with a set of data to obtain more information. And applying the study more broadly to include all or some of the states of Sudan, using multiple algorithms and comparing the results with the results of this study.تنقيب البيانات قواعد البياناتمرض الكلازارإستخدام تقنية التصنيف للتنبؤ بمرض اللشمانيا الحشوي (الكلازار) بإستخدام خوارزمية الـ J48 دراسة حالة ولاية القضارفThesis