كلية علوم الحاسوب - دكتوراه
Permanent URI for this collectionhttps://repository.neelain.edu.sd/handle/123456789/504
Browse
Item خوارزمية لمراقبة العمليات الشاذة في البطاقات الإئتمانية(جامعة النيلين, 2021-10) حمزه محمد حسن سعيدالمستخلص من أكثر التحديات الحالية والمستقبلية هي أمان وسرية المعاملات الخاصة ببطاقات الإئتمان، في الوقت الحاضر تتم معظم معاملات نظم تطبيقات التجارة الإلكترونية من خلال بطاقات الإئتمان والخدمات المصرفية عبر الإنترنت. وهذه الأنظمة معرضة لهجمات عن طريق تقنيات جديدة بمعدل كبير جداً و ينذر بالخطر. يعد الكشف عن الإحتيال في معاملات بطاقات الإئتمان أحد الجوانب المهمة والحيوية حالياً ومستقبلاً لذلك لابد من المحافظة علي خصوصية مستخدمي في بطاقات الإئتمان. يهدف هذا البحث إلي إكتشاف عمليات الغش و الإحتيال في البطاقات الإئتمانية عبر عمليات السحب الشاذة، حيث تم إستخدام المنهج الوصفي التطبيقي بالإضافة إلي منهجية كرسب للتنقيب في البيانات، وإستخدام تقنيات التنقيب في البيانات لتصميم النموذج وتطبيقه للكشف عن الحالات الشاذة في معاملات بطاقات الإئتمان وتصنيفها إلي معاملات طبيعية (Normal) أو معاملات شاذة (Fraud) مما يساعد في إتخاذ القرارات المناسبة. وفقاً للدراسات السابقة تم بناء وتطوير النموذج المقترح للمقارنة بين مجموعة من أفضل الخوارزميات التي تساعد في إكتشاف الإحتيال في بطاقات الإئتمان وهي عبارة عن سبع كالأتي خوارزمية الغابات العشوائية (Random Forest)، تعزيز التدرج (Gradient Boosting)، الإنحدار اللوجستي (Logistic Regression)، الشبكات متعددة الطبقات (Multilayers Perceptron)، القاعدة الضبابية (Fuzzy Rule)، شجرة القرار (Decision Tree)، و ألة موجه الدعم (Support Vector Machine). من أجل تقييم هذا النموذج، تم التطبيق علي عينة عشوائية من مجموعة البيانات (Datasets)، وهي عبارة عن معاملات في بطاقات إئتمان أروبية (European Credit Card Datasets)، حيث تم إستخدام عينة من البيانات للتدريب (Training) بنسبة 70% من مجموعة البيانات، بينما تم إستخدام 30% من البيانات للتحقق من الصحة والإختبار (Testing). تم تطبيق طريقتي إزالة الميزة الخلفية وطريقة الخوارزميات الجينية لإختيار الميزة، ولقياس كفاءة النموذج وتقييم أداء الخوارزميات تم إستخدام مقياس الإستدعاء (recall)، الدقة (precision)، مقياس F (F-Measurement) و الدقة (Accuracy). حيث تشير النتائج إلى أن هناك إحتمالاً بنسبة 99.96% لخوارزمية الغابة العشوائية للتنبؤ بمعاملة إحتيالية، وهي كذلك أكثر فاعلية في الإستدعاء (Recall)، وهذا يعني أن هناك إحتمالاً بنسبة أكبر من 86% أن تكون المعاملة الإحتيالية المتوقعة حقيقية بالفعل. و من النتائج أعلاه وضح أن خوارزمية الغابة العشوائية لها فعالية كبيرة من بين جميع الخوارزميات في إكتشاف عمليات الغش والإحتيال التي تحدث في بطاقات الإئتمان. Abstract One of the most current and future challenges in the finance and banking sector is the security and confidentiality of credit card transactions, where almost every person deals with the bank either personally or through the Internet, because most of the current transactions are entirely related to credit cards, at present most of the applications system transactions are E-commerce through credit cards and Internet banking. These systems are vulnerable to attacks by new technologies at a very large and alarming rate. In today's world, detecting fraud in banking is critical, thus it's critical to maintain the security and confidentiality of transactions against fraud and theft. In this research, the descriptive and applied approach was employed in addition to the CRSP data mining methodology, data mining techniques were used to build and apply the model to detect anomalies in credit card transactions and classify them into normal or fraudulent transactions, which helps in making appropriate decisions. According to literature review the proposed model was developed using the best seven algorithms Random Forest, Gradient Boosting, Logistic Regression, Multilayers Perceptron, Decision Tree, Support Vector Machine and Fuzzy Rule. In order to evaluate this model, it was applied to a random sample of the Datasets, which are transactions in European credit cards (European Credit Card Datasets), where we used a sample of 70% of data for training, while 30% of the data was used for validation and testing. Genetic Algorithms and Backward Elimination for feature selection was applied, Accuracy, recall, precision and F-Measurement were used to evaluate the performance of the seven algorithms. Genetic algorithm scores the highest degree of F-Measurement relative to Backward Elimination. This helps us to explain that genetic algorithms are the best way to select a feature from a dataset feature. As the results indicate that there is a 99.96% chance of the Random Forest algorithm to actually predict a fraudulent transaction. And the random forest algorithm is more effective in summoning (Recall), this means that there is a greater than 86% chance that the expected fraudulent treatment is actually real. From the above results, the random forest algorithm has proven to be effective among all algorithms in detecting frauds occurring in credit cards.