ENHANCING ASSOCIATION RULES IMPLEMENTATION TO EXPLORE THE BEHAVIORAL PATTERNS
Date
2019-11
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Neelain University
Abstract
ABSTRACT
Data mining science today have been an active and more important field, because it is participated to draw clear steps which helped stakeholders and administrators in the mission of taking decisions correctly and with more confidence.
this study concerned of using data mining tools to explore human behavioral patterns from large database storage containing data of candidates to military opportunities, also by focusing on using association-rule mining technique which is concerns more than other DM tools with the correlations and relations of records attributes, each with others, also number of skills and concepts were implemented to achieve the main goal of study; CRISP-DM methodology applied, data preprocessing executed to prepare data and data structures which is basic in the knowledge discovery process. And to choose and apply association rule technique comparison methodology was executed between them and classification rule mining, also to make this work effectively and so well, a modification on the FP-growth algorithm also performed to enhance the performance of this algorithm from the perspective of the speed and accuracy.
A military database contained more than 30,000 records, this data collected through eight years from 2010 to 2018, through this period multi of expected errors and mistakes happened by users, for that before using association rule technique, a preprocessing steps are performed.
Multi patterns of executing this technique was produced, and by modifying FP-growth algorithm, huge rules and patterns minimized with more accurate results, a rules was growth immediately and considered more suitable and effective to be used as standard rule in taking decisions by stakeholders.
المستخلص
لقد أصبح علم استخراج البيانات اليوم من المجالات النشطة والأكثر أهمية ، لأنه شارك في رسم خطوات واضحة ساعدت أصحاب المصلحة والإداريين في مهمة اتخاذ القرارات بشكل صحيح وبثقة أكبر. اعتمدت هذه الدراسة على استخدام أدوات التنقيب عن البيانات لاستكشاف الأنماط البشرية السلوكية من مخزن قاعدة بيانات كبيرة تحتوي على بيانات مرشحين للفرص العسكرية ، وأيضاً بالتركيز على استخدام تقنية التعدين في قواعد الجمعيات التي تهتم أكثر من غيرها من أدوات التقيب عن البايانات الأخرى بالعلاقات وعلاقات انماط السجلات ، كل واحد مع الآخرين ، كما تم تنفيذ عدد من المهارات والمفاهيم لتحقيق الهدف الرئيسي للدراسة. طبقت منهجية ال CRISP-DM وتم تنفيذ معالجة البيانات الأولية لإعداد البيانات وهياكل البيانات التي تعتبر أساسية في عملية اكتشاف المعرفة. أيضا ، ولاختيار تقنية قواعد الارتباط تم تنفيذ منهجية المقارنة للاختيار بينها وبين قواعد التصنيف، ولجعل هذا العمل يعمل بشكل جيد، تم إجراء تعديل على خوارزمية FP-growthأيضًا لتحسين الأداء من منظور سرعة ودقة هذه الخوارزمية. احتوت قاعدة البيانات العسكرية على أكثر من 30000 سجل ، جمعت هذه البيانات خلال ثماني سنوات من عام 2010 إلى عام 2018 ، وخلال هذه الفترة حدثت العديد من الأخطاء المتوقعة كأخطاء المستخدمين ، لذلك قبل استخدام تقنية قواعد الارتباط تم تنفيذ خطوات المعالجة القبلية علي البيانات. وتم إنتاج أنماط متعددة من خلال تنفيذ هذه التقنية ، وعن طريق تعديل خوارزمية النمو المتذايد FP-growth ، عدد ضخم من القواعد والأنماط تناقصت مع نتائج أكثر دقة ، والقواعد نمت على الفور وتعتبر أكثر ملاءمة وفعالية للاستخدام كقاعدة قياسية في اتخاذ القرارات من قبل أصحاب المصلحة والمدراء.
Description
A Dissertation Submitted to the College of Graduate Studies,
Faculty of Computer Science and information Technology,
ALNILAIN UNIVERSITY
In Fulfillment of the Requirements for the degree of
DOCTOR OF PHILOSOPHY
Major Subject: DATA MINING
Keywords
DATA MINING
