Multi-classifier Method based on Normal and Weighted Voting for Breast Cancer Mammogram Images Detection
Date
2019-12
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Neelain University
Abstract
Abstract
Breast cancer is a disease starts when cells in the breast begin to grow out of control, it is still the most invasive cancer in women and the second leading cause of cancer related deaths. The etiologies of this disease are not clear and neither are the reasons for the increased number of cases. Currently there are no methods to prevent breast cancer, the early detection represents as a very important factor in cancer treatment. The process of manually diagnosis the mammography is a most hard work for the specialists and take a lot of time. This research applying Voting technique by using five classifiers (Decision Tree, Support Vector Machine, K-Nearest Neighbors, Artificial Neural Network and Bayes Naïve). We used two methods of voting: the first one is (Normal Voting) method is presented by selecting the majority output from the experimental results of the five algorithms. The second one is (Weighted Voting) method, that each classifier was trained 10 times and the average accuracy was computed and recorded. At the end, the five classifiers were sorted according to the training accuracy percentages, and different weighted values were assigned to each classifier. The proposed solution contains four main stages start with Breast cancer images collection (dataset) contains 119 images, preprocessing (Image Processing: image cropping of ROI) and Extraction (extract six features from each image: mean, standard deviation, smoothness, contract, kurtosis and skewness), followed by Classification (using the five classifiers: SVM, KNN, BNC, ANN, DT ) & Voting Algorithms(normal and weighted voting), and last the process of evaluating the results. The experimental results of the proposed weighted voting methods show that the best result of accuracy 0.945%, while the normal voting is 0.8085%. The results indicate the usefulness of the proposed method.
المستخلص
يحدث سرطان الثدي عندما تبدأ خلايا الثدي بالنمو والإنقسام بصورة غير مفهومة ولا يمكن السيطرة عليها, وهو السرطان الأكثر شيوعا بين النساء, و ثاني مسبب للوفاة بين النساء. لم تكتشف أسباب الإصابة بسرطان الثدي حتى الآن ولكن الإكتشاف المبكر للسرطان عامل مهم للعلاج, وكلما تم الإكتشاف مبكرا" كان العلاج أسهل.
الطريقة التقليدية في تصنيف الصور الطبية من قبل الطبيب المختص قد يستهلك الزمن خصوصا ان الإكتشاف المبكر عامل مهم جدا في العلاج.
الفكرة الأساسية لهذا البحث هو اقتراح مصنف متعدد لتصنيف الصور باإستخدام خمسة مصنفاتDecision Tree, Support Vector Machine, K-Nearest Neighbors, Artificial Neural Network, Bayes Naïve ثم تصنيفها كصور حميدة او خبيثة بالاعتماد على التصويت بينها. قد استخدمنا التصويت لانه يعطي نتايج أكثر دقة من الإعتماد على مصنف واحد. تم استخدام طريقتين للتصويت:الطريقة الاولى الNormal Voting يتم فيها التصويت بين المصنفات بطريقة عادية وهي أخذ رأي الأغلبية كقرار نهائي, الطريقة الثانية ال Weighted Voting يتم تنفيذ كل مصنف 10 مرات ويتم تخزين أفضل دقة تم الحصول عليها ثم إعطاء كل مصنف عدد مختلف من الأصوات اعتمادا على دقته ثم التصويت بينهم.
تحتوي هذه الدراسة على اربعة مراحل تبدأ بمرحلة جمع الصور (Dataset) التي تحتوي على 119 صورة . ومن ثم مرحلة تهيئتها (ROI) واستخلاص الخصائص (Feature Extraction) ثم مرحلة التصنيف بخمسة مصنفات مختلفة (SVM, BNC,KNN,DT,KNN) والتصويت بطريقتين(normal و weighted) بين نتائج هذه المصنفات إنتهاءا بمرحلة تقييم النتيجة .أفضل نتيجة تصويت تم الحصول عليها بطريقة ال weighted voting هي 0.945% , و أفضل نتيجة تم الحصول عليها بطريقة ال normal voting هي 0.8085 % .
Description
A Thesis Submitted to Fulfillment of the Requirement for the Degree of Master in Computer Science
Keywords
Computer Science, Images Detection, breast cancer
