تطوير نموذج ذكي لتشخيص مرض سرطان الثدي بإستخدام خوارزميات التعلم الألي( خوارزمية الإنحدار اللوجيستي ، خوارزمية آلة المتجهات الداعمة ، خوارزمية نايف بايز)
Date
2023-03
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
جامعة النيلين
Abstract
المستخلص
إن المعضلة الرئيسية تحدث عندما لا يمكن التعرف على السرطان بشكل صحيح في مراحله المبكرة
تتمثل مشكلة البحث في عدم وجود نماذج قادرة لتشخيص مرض سرطان الثدي بصورة فعالة بالإضافة إلى الأخطاء في التشخيص, أثبت التعلم الآلي في هذا المجال أنه يلعب دورآ حيويآ في توفير الوسائل التي تسهل تشخيص الأمراض بدقة عالية مثل السرطانات .
عليه يهدف هذا البحث على مساعدة الأطباء في اكتشاف سرطان الثدي مبكرآ ولذلك تم تطوير نموذج ذكي لتشخيص مرض سرطان الثدي باستخدام خوارزميات
Logistic regression & Support vector machine & Naïve bayes algorithms التعلم الآلي اعتمدت الدراسة على المنهج التحليلي الوصفي استمدت العينة من قاعدة بيانات سرطان الثدي لجامعة ومشفى ويسكونسيون الأمريكية وتحتوي مجموعة البيانات على 569 حالة،
Python357 حالة ورم حميد و 212 حالة ورم خبيث، تم تطبيق الخوارزميات باستخدام برنامج قام الباحث بمقارنة أداء هذه الخوارزميات الثلاثة من خلال الدقة والاستدعاء والضبط ومقياس استخدمت هذه المقاييس لقياس التقدير للنماذج الثلاثة لأغراض مقارنة الأداء ، أشارت F1 score
Logistic regressionالنتائج بناءآ على متوسط الدقة لمجموعة بيانات سرطان الثدي إلى أن نموذج يعطي أفضل دقة (%97.9 ) مع معدل خطأ ضئيل %0.02 تليها خوارزمية آلة المتجهات الداعمة
Naïve bayse بدقة (%96.9) مع معدل خطأ بنسبة %0.03 وأخيرا خوارزمية نايف بايز SVM بدقة (%92.2) ومعدل خطأ %0.07 ومنه نستنتج أن خوارزمية الإنحدار اللوجيستي هي أفضل خوارزمية في بناء نموذج التعلم الألي لتشخيص مرض سرطان الثدي ، وخلص البحث لعدد من التوصيات أهمها جمع المزيد من بيانات المرضى لتكوين مجموعة بيانات تدريب أكبر لمزيد من الإختبار والتقيم لذيادة معدل إكتشاف الخطورة الناتج من مرض سرطان الثدي وتحسين دقة النموذج.
Abstract
The main dilemma occurs when it cannot To properly identify cancer in its early stages , the research problem is the lack of models To properly identify cancer in its early stages, the research problem is the lack of models Able to effectively diagnose breast cancer in addition to errors in diagnosis, proved Machi learning
in this field plays a vital role in providing means that facilitate the diagnosis of diseases With as much accuracy as cancer, this research aims to help doctors
detect cancer Therefore, an intelligent model was developed to diagnose breast cancer using algorithms Machine learning The study relied the descriptive analytical method, the sample was drawn from a database Breast cancer of the American University and Hospital of Wisconsin, and the data set contains 569 cases, 357 cases of benign tumor and 212 cases of malignant tumor, the algorithms were applied using the Python program , The researcher compared
the performance of these three algorithms through precision, recall, F1 score scale These scales were used to measure estimation of the three models. For the purposes of performance, The result s indicated, based on the average accuracy of the breast cancer dataset ,Thats the logistic regression model gives the best accuracy of (97.9%) with a error rate of 0.02% followed by the Support Vector Machine algorithm with an accuracy of (96.9%) with an error rate of 0.03% and finally Naïve bays algorithm With an accuracy of (92.2%) with an error rate of 0.07%, from which we conclude that the logistic regression algorithm is best .Algorithm in building a machine learning model for the diagnosis of breast cancer, and the research concluded a number of Recommendations, the most important of which is to collect more patient data to form a larger training data set for more Testing and evaluation to increase the risk detection rate resulting
from breast cancer and improve the accuracy of the model.
Description
بحث تكميلي لنيل درجة الماجستير في علوم الحاسوب
Keywords
الخوارزميات, التعلم الالي