كلية علوم الحاسوب - ماجستير

Permanent URI for this collectionhttps://repository.neelain.edu.sd/handle/123456789/503

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    A Comprehensive Overview of Automatic Cluster Detection as Data Mining techniques
    (جامعة النيلين, 2009) OMER MUSTAFA AHMED
    Abstract The main concern of this thesis is to address clustering problems with emphasize on Data Mining as a promised field that inherits the advances of both statistics and artificial intelligence methods. Thus, Data Mining has a capability to deal with clustering large data sets (even with no obvious groupings) into natural cluster using a number of variant Automatic Cluster Detection Techniques ACDTs. A comprehensive review of popular ACDT's has been provided along with perspectives on each one, so they can serve as basis for recommending the selection of the technique that is likely to suite the properties of a given data set and the goal of business problem. The enhanced k-means clustering model which represent an impact of the experimental procedures on this thesis has show its success in terms of accuracy and stability when it apply on two deferent type and size of data sets, and has provide with rich valuable results when it applied on Sudanese official VIPs data set. In conclusion, the enhanced features of the enhanced k-means model are that it builds models in a hierarchical manner using binary splitting, it apply a refinement of all clusters and probabilistic scoring. Furthermore, the enhanced clustering model distinguished with its valuable outputs including information about cluster confidence, cluster support and rule that create clusters, and the tree shape of clusters sequence. As a Sudanese, the researcher thinks that Sudanese government and universities should establish artificial intelligence research Centers so as to pay attention, encourage and provide support for such research arias.مستخلص البحث يهتم هذا البحث بصفة أساسية بمعالجة مشكلة تصنيف البيانات الي فئات ( عناقيد) وذلك بالتركيز على تقنية تعدين البيانات كحقل واعد ورث مزايا حقلي الإحصاء والذكاء الإصطناعي وعليه فإن لديها المقدرة على القيام بالتصنيف لإحجام البيانات الكبيرة الي فئات (عناقيد) حتي في ظل غياب تصنيف سابق جلي كمرشد وذلك باستخدامها لتقنيات الإكتشاف الأوتوماتيكي للفئات ( العناقيد) . قدم هذا البحث عرضاُ وافياُ لتقنيات الإكتشاف الأوتوماتيكي للفئات ( العناقيد) المستخدمة كثيراُ إضافة الى التعليق عليها بعرض وجهات النظر حولها مما يسمح لهذا العرض أن يخدم كدليل و مرشد للمستخدم في إختيار تقنية الإكتشاف الأوتوماتيكي للفئات ( العناقيد) الأنسب لخصائص مجموعة البيانات المدخلة و الهدف المطلوب إنجازه من وراء التصنيف . النموزج المحسن لخوارزمية مراكز ال ك فئة k-means) ) والذي يمثل الأثر الملموس بالجانب العملي لهذا البحث قد حقق نجاحاُ فيما يخص معايير الدقة و الإستقرار عندما طبق على مجموعتين مختلفتين من البيانات كماُ وحجماُ كما أعطى مخرجات قيمة عند تنفيذه على مجموعة بيانات المسؤولين القياديين بالسودان. وكتقييم نهائي فإن مزايا النموزج المحسن تتمثل في أنه يبني نموزجه بإسلوب هيكلي مستخدماُ التقسيم الثنائي و مراجعة الفئات لتنقيتها فضلاُ عن التقييم الإحتمالي. علاوة على ذلك فإن النموزج المحسن يتميز بمخرجاته القيمة التي تتضمن درجة الوثوقية و الدعم للفئة ( عدد الحالات التي تنتمي للعنقود) و القاعدة التي بموجبها تم إلحاق الحالات بكل عنقود بالإضافة الي شجرة تتابع العناقيد. إن الباحث و كسوداني يعتقد أن على الحكومة والجامعات السودانية إنشاء مركز متخصص لبحوث الذكاء الإصطناعي وذلك للإهتمام بهذا الحقل وتشجييع الباحثين وتزويدهم بالدعم في هذا المجال.