كلية علوم الحاسوب وتقانة المعلومات

Permanent URI for this communityhttps://repository.neelain.edu.sd/handle/123456789/485

Browse

Search Results

Now showing 1 - 10 of 24
  • Thumbnail Image
    Item
    تحسين خوارزمية (Depth First Search (DFS لاستعلام قواعد البيانات العلائقية
    (جامعة النيلين, 2017-08) ابتسام الطيب محمد الطيب
    المستخلص ركزت الدراسة علي تحسين الخوارزمية الاساسية Depth First Search (DFS) المستخدمة لتحسين الاستعلام لاستخدامها بصورة عكسية , والتقنيات التى تتمثل في الاستدلال الامثل+ تقدير التكلفة (Cost-estimation, Heuristic) والتى طبقت على نظم إدارة قواعد البيانات العلائقية، كما ركزت على طرق أمثلية الاستعلام، تمثلت مشكلة الدراسة في ان الخوارزمية الاساسية لتحسين الاستعلام لاتفي ولاتؤدي الاغراض المطلوبة للتحسين عند استخدامها مع التقنيتين(Cost-estimation, Heuristic) وفقاً لمعياري الزمن والتكلفة, بالاضافة الى عدم وجود تجارب علمية واضحة بين تقنيات تحسين الاستعلام تؤكد التقنية الأفضل وفقاً لمعياري الزمن والتكلفة, ثم المشاكل التي تواجه طرق التحسين(أحياناً تكون دون المستوى الأمثل). ومن ثم تأتي أهمية الدراسة في تحسين الخوارزمية الاساسية لتحسين الاستعلام لاستخدامها بطريقة عكسية, وتطوير برنامج سهل الاستخدام لحساب زمن تنفيذ الاستعلام لمساعدة مطوري ومستخدمي قواعد البيانات على اتخاذ القرار في اختيارهم للطريقة المناسبة واختيارهم للنظام الذي يفي بمتطلبات التحسين. هدفت الدراسة الى التحسين في الخوارزمية الاساسية لتحسين الاستعلام لاستخدامها بطريقة عكسية, ودراسة التقنيات التي تتمثل في تقنية(الاستدلال+ تقدير التكلفة) وتطبيقهما على قواعد البيانات العلائقية (الاوراكل,السيكوال سيرفر, الماي سيكوال). حيث يتفاعل المستخدم مع لغة الاستعلام الهيكلية (SQL) لتنفيذ الاستعلام في قواعد البيانات العلائقية. تطبيق وحساب وقت تنفيذ الاستعلام باستخدام عمليات البحث, التعديل,الادراج والحذف على قاعدة البيانات ومن ثم تقدير وتقييم زمن تنفيذ الاستعلام بالـ ( Millisecond, Microsecond, Nanosecond Start-time, End-time,) كدالة على سرعة الاستعلام والخروج بنتائج تساعد المستخدم بإختيار التقنية الأمثل للنظام الامثل ذات زمن الاستجابة الأقل وزمن التنفيذ الأقل,بالاضافة الي توصيف الطرق المثلي لتقدير التكلفة لتحسين الاستعلام. من خلال الدراسة والتجارب وجدنا أن استخدام الخوارزمية الاساسية بصورة عكسية يفي ويؤدي الاغراض المطلوبة للتحسين بصورة مفيدة وقيمة تم استخدامها من خلال تحليل لقاعدة البيانات وأثناء إجراء التجربة تم حساب زمن تنفيذ الاستعلام , ووجدنا أن تقنية الاستدلال الأمثل في قاعدة بيانات (الأوراكل, السيكوال سيرفر, الماي سيكوال) أفضل بكثير من تقنية تقدير التكلفة, ووجدنا ان طريقة المحسن الديناميكي افضل من المحسن الثابت من حيث الزمن والتكلفه، الديناميكي حقق امثلية الاستعلام. هناك أبعاد مفتوحة للبحث في المستقبل يمكن أن تساعد مصممي ومنفذي و مديري قواعد البيانات، معتبرا تقنيات أخرى لتطبيقها على نظم إدارة قواعد البيانات. تطبيق تقنيات, المرشد الاستدلالي, وتقدير التكلفة وتقنيات التحسين الأخرى على أنظمة ادارة قواعد البيانات العلائقية الأخرى، بالإضافة إلى تقدير وقت التنفيذ لكل منها, واضعين في الاعتبار (مواصفات الجهاز والذاكرة). التفكير في استخدام خوارزميات اساسية اخري وتحسينها بحيث تلائم النتائج المطلوبة وتفي بالغرض المطلوب. Abstract The study focused on the improvement of the basic algorithm Depth First Search (DFS) used to optimize the query to be used in reverse, and the techniques namely (Heuristic + cost estimation) that implemented on relational database management systems, and it also focused on the approaches of query optimization. The study problem is there is the basic algorithm for query optimize is not fulfilling and does not perform the purposes required for optimize, when used with the two techniques (Cost-estimation, Heuristic) according to the criteria of time and cost. In addition to the lack of clear scientific experiments between query optimization techniques that confirm the best technique according to the criteria of time and cost estimate, then the problem facing the optimization approaches sometimes they are sub-optimal. And then comes the importance of study, this study provides modifying the basic algorithm to optimize the query to be used in a reverse way, and developed a user friendly software, to evaluate the query execution time to help/guide database developers and users to make the decision in their choice of the appropriate approach and also their choice of the system that meets the requirements of improvement, then the importance comes in the descriptive analysis of approaches Query optimization. The study aimed, to modify the basic algorithm to optimize the query to be used in a reverse manner, and to study the approaches and techniques namely (heuristic + cost estimation) and apply them to relational databases taking into account the time and cost standards. Where the user interacts with the Structural Query Language (SQL) to execute the query in relational databases. Application and calculation of query execution time using (insert, search, update and delete) operations and applied for (Oracle, SQL-Server, My-Sql) And then assess and evaluate the time of execution of the query using (Millisecond, Microsecond, Nanosecond Start-time, End-time,) as a function of the speed of the query and come up with results helps the user to found the best technique of optimization of the system with a lower response time and the time of execution is lower. In addition to describing the optimal approaches for cost estimation to optimize the query. Through the study and experiments, we found that the use of the basic algorithm in reverse satisfies and performs the purposes required for optimization in a useful and valuable manner. It was used through an analysis of the database, and during the conduct of the experiment, the query execution time was calculated, Through the study, experiments we find the heuristic optimization technique in a database came in ranked first in terms of the improvement of the performance of the system by an algorithm of (Depth-tree algorithm) which modified, and Cost-estimation Optimization Technique came in second order. , and we found that the dynamic optimizer approach is better than the static optimizer in terms of time and cost, the dynamic optimizer optimized the query. There are open dimensions for future research as guidance that can help the database designers, the database system implementers or the database administrators, considering another techniques to applying them on (Oracle, SQL Server, MY-SQL). And considering is the select another RDBMS to applying heuristic optimization technique, cost-based optimization technique and additional optimization techniques on them, in addition to estimation execution time for each of the RDBM. Thinking about using other basic algorithms and modifying them to suit the required results and meet the desired purpose.
  • Thumbnail Image
    Item
    بناء نموذج تحديد حالة الحاج بإستخدام تقنيات تنقيب البيانات (لدراسة حـالة هيئة الحج والعمرة)
    (جامعة النيلين, 2022) الشيخ محمد النبهاني الشيخ
    المستخلص تمثل شعيرة الحج أهم شعائر وعبادات المسلمين المفروضة ،وتمثل وزارة الحج والعمرة في السودان الجهة الحكومية المسؤولة عن تقديم كافة الخدمات المستلزمة التي تتطلبها احتياجات الحجيج السوداني من مختلف الخدمات ، ولذلك جاءت هذه الدراسة للتعرف على اكتشاف أنماط مفيده من بيانات الحجيج السوداني والوصول أيضا الي مجموعات تصنيف البيانات بناءً على عمليات تنقيب البيانات وتقييم نتائج التنقيب والإرتكاز عليها في تحسين جودة الخدمات التي يمكن تقديمها، شملت الدراسة بيانات وزارة الحج والعمرة لست أعوام سابقة للعالم 2018 م حيث بلغ حجم البيانات 29999 سجل من البيانات وقد ضمنت البيانات في ملف Excel واحد ، تكمن مشكلة البحث في صعوبة الوصول لنتائج فعالة وتقارير واحصاءات دقيقة يتم الإرتكاز عليها في التوصل للقرارات السليمة لتحسين جودة الخدمات التي تقدمها وزارة الحج والعمرة استنادا للكم الهائل من البيانات الخاصة بالحجيج السوداني ،قد قام الباحث بدراسة الوضع الراهن و قد تم تصميم نموذج مقترح للحل ،تم استخدام خوارزمية K-mean في عمليات التجميع والعنقدة Clustering وفي عمليات التصنيفClassification تم استخدام خوارزمية j48 وتشغيلها على أداة تنقيب البيانات ويكا ، تم في هذه الدراسة تصنيف وتجميع البيانات علي حسب العام ورقم القطاع وحسب وسيلة النقل وعلى حسب تاريخ الميلاد ورقم الولاية وحسب حالة الحاج والمحلية وحسب فصيلة الدم ونوع الحج والولاية وحسب الجنس والعام ورقم المحلية ،ومن النتائج التي توصل اليها البحث ان الخوارزمية j48 اظهرت عند التنفيذ درجات دقة افضل وانجازها في فترة زمنية قصيرة. بلغت دقة التصنيف 99.6 % ، وقد كانت شجرة القرار تتعلم بسرعة و تنفذ بسرعة بزمن 09.0 ثانيـة،وجاءت النتائج مجملة كالتالي وذلك على حسب تصنيف الجنس كان عدد الذكور اكثر من الإناث حيث بلغ 15369حاج وعلى حسب وسيلة النقل كانت الباخرة الوسيلة الأكثر استخداما حيث استغلها 17958 وجاءت ولاية الخرطوم الاولى على الولايات من حيث عدد الحجاج حيث بلغ عددهم 10485 سجلت محليات أزوم ، مكجر وأبوجابرة أقل نسبة من الحجاج بمعدل حاج واحد فقط ، شكلت فئة الستينات والسبعينات الفئة العمرية الأكبر حجما بنسبة 24% ، وشكلت فصيلة الدم O+ الفصيلة الأكثر شيوعا بمعدل 10069 حاج يحمل الفصيلة. Abstract The Hajj ritual represents the most important rituals and worship of Muslims imposed, and the Ministry of Hajj and Umrah in Sudan represents the government agency responsible for providing all the necessary services required by the Sudanese hajj's needs from various services, and therefore this study came to identify the discovery of useful patterns from the data of Sudanese hajj's and also access to classification groups Data based on data mining operations The results of the mining and relying on it to improve the quality of services that can be provided, The study included the data of the Ministry of Hajj and Umrah for six years prior to the world 2018, where the data size amounted to 29,999 records of data. The data were included in one Excel file. The problem of the research lies in the difficulty of accessing effective results, reports and accurate statistics that are based on reaching sound decisions to improve the quality of services that are provided. Provided by the Ministry of Hajj and Umrah based on the huge amount of data related to Sudanese hajj's , the researcher has studied the current situation and a proposed model has been designed for the solution, the K-mean algorithm was used in the processes of clustering, and in the classification processes the j48 algorithm was used and run on the data mining tool weka , In this study, data were classified and clustered according to year, sector number, kind of transport, date of birth, state number, hajj status, locality, blood type, Hajj type, state, gender, year, and locality number. Among the results of the research, the j48 algorithm showed when implementing Better accuracy and accomplished in a short period of time. The classification accuracy reached 99.6%, and the decision tree was quickly learned and implemented quickly in a time of 09.0 seconds, and the results were summarized as follows, according to the gender classification, the number of males was more than females, reaching 15,369 hajj, and according to the kind of transportation, the ship was the most used means where 17,958 took. Registered of it.Azum, Mukjar and Abu Jabra localities recorded the lowest percentage of hajj's with an average of only one hajj. The sixties and seventies formed the largest age group by 24%, and the blood type O+ was the most common type, with an average of 10,069 hajj's carrying this type.
  • Thumbnail Image
    Item
    استخدام تقنية التصنيف والعنقدة فى تنقيب البيانات لتحديد بعض النظائر المشعة فى السودان وتأثيرها فى إرتفاع مستوى النشاط الإشعاعي دراسة حالة (هيئة الطاقة الذرية السودانية – معهد السلامة الإشعاعية)
    (جامعة النيلين, 2022-12) سوسن عبد الحميد السيد يوسف
    المستخلص إن مستوى النشاط الإشعاعي الطبيعي في القشرة الأرضية متقارب جداً في معظم الأماكن حيث لا يوجد اختلاف يذكر من مكان وآخر بصفة عامة . إلا أن هناك أماكن على الأرض يزداد فيها الإشعاع الطبيعي بشكل كبير نتيجة وجود تركيزات عالية من العناصر المشعة طبيعياً في صخور القشرة الأرضية . ترتكز هذه الدراسة علي إظهار واكتشاف تأثير بعض النظائر المشعة فى إرتفاع مستويات النشاط الإشعاعي وذلك بمقارنة مقايس النشاط الإشعاعي فى كثير من مناطق السودان المختلفة بهدف تحديد مستويات النشاط الإشعاعي لتلك المناطق ومن ثم مقارنتها مع القيمة العالمية المسموح بها كخلفية إشعاعية ومن ثم التنبؤ بالتطورات المستقبلية لتلك المناطق ومساعدة متخذي القرار بشأن تلك المناطق. وقد تناولت هذه الدراسة إرتفاع مستوي التركيز لعنصر اليوارنيوم المشعة U238 وذلك بمقارنته مع متوسط تركيز النظير فى كل الولايات التي تم اجراء القياس والإختبار عليها ومقارنتها مع المتوسط العالمي لهذا النظير. استخدمت طرائق مختلفة من تقنيات التقنيب فى البيانات وهي تقنية التصنيف مصنف شجرة القرارClassification Using Decision Tress التي تنفذ خوارزميةJ48 وتقنية العنقدةCluster مستخدمة خوارزمية التجميع (K-mean) وتم تطبيقها من خلال برنامج Weka التي تدعم هذه الخوارزميات. ومن أهم النتائج التي توصل إليها البحث أن اكثر الولايات التي ظهرت فيها نسبة الإشعاع مرتفعه هي ولاية البحر الأحمر تليها القضارف ثم كسلا ثم شمال كردفان ، بينما كانت منخفظة في ولاية النيل الأبيض ، كما ان نسبة عنصر اليورانيوم كانت مرتفعة في ولاية دارفور و بنسبة خطورة أقل وكانت مرتفعة في ولاية كسلا. وقدمت بعض التوصيات التي تساعد متخذي القرار فى تصنيف واختيار مناطق سكنية وزراعية وصناعية تتفق وتتطابق مع متطلبات البيئة.   Abstract The level of natural radioactivity in the earth's crust is very close in most places where there is no significant difference from one place to another in general. However, there are places on earth where the natural radiation increases greatly as a result of the presence of high concentrations of radioactive elements naturally in the rocks of the earth's crust. This study is based on showing and discovering the effect of some radioactive isotopes on the high levels of radioactivity by comparing radioactivity measurements in many different regions of Sudan in order to determine the levels of radioactivity in those regions and then compare them with the global value allowed as a radioactive background and then predict future developments in those regions And help decision makers about those areas. This study dealt with the high level of concentration of the radioactive uranium element U238 by comparing it with the average concentration of the isotope in all the states where the measurement and testing was carried out and compared with the global average for this isotope. Different methods of data mining techniques were used, namely the classification technique, the decision tree classifier, which implements the J48 algorithm, and the clustering technique, using the K-means clustering algorithm, and it was applied through the Weka program that supports these algorithms. One of the most important findings of the research is that the most states in which the radiation rate is high is the Red Sea state, followed by Gedaref, then Kassala, then North Kordofan, while it was low in the White Nile state, and the proportion of the uranium element was high in the state of Darfur and with a lower risk rate It was high in Kassala state. It presented some recommendations that help decision makers in the classification and selection of residential, agricultural and industrial areas that are compatible with the requirements of the environment.
  • Thumbnail Image
    Item
    استخدام تقانة تنقيب البيانات في التنبؤ بأرباح الاعمال (حالة تطبيقية متجر تسويق الادوات الرياضية)
    (جامعة النيلين, 2022-08) محمد محجوب ابراهيم محمد
    المستخلص: لازالت عملية تحديد الربح من المعاملات التجارية بمختلف مسمياتها تشكل هاجسا وعائقا امام اصحاب رأس المال وغيرهم من ممارسي العملية التجارية, وهذا الدافع هو الاساس الذي وضع الباحث كل اهتمامه علي محاولة تقليل هذا الاشكال مستعينا بالادوات الحديثة في تحليل البيانات, والمشكلة الاساسية التي قامت عليها الدراسة هي صعوبة التنبؤ بالارباح من العمليات التجارية المتمثلة في البيع لكل زبون بأشكالة المتعددة وتفرعت من هذه المشكلة عدة مشكلات منها قلة استخدام الادوات الدقيقة في تحديد الارباح مما يؤدي طرديا الي زيادة المخاطر التي من شأنها ان تضعف نشاط الدخول في تجارب تجارية غير واضحة المعالم والارباح الذي يتم استنتاجة بالاعتماد علي دراسات الجدوي التقليدية غير مشجع في كثير من الاحيان مقارنة برأس المال المبذول في العملية التجارية والاعتماد علي متغيرات شبه ثابتة لتخمين الربح في معظم الدراسات التقليدية واغفال عدد من المتغيرات التي قد تؤثر بشكل مباشر علي تحقيق الارباح او التأكد من تحقيقها.ان اهمية اتخاذ القرار في الاعمال التجارية يعتمد كليا علي مدي المعرفة الاكيدة بتحقيق الارباح مع تقليل الخسائر بقدر الامكان بناء علي التوقعات المحتملة والمبنية علي بيانات حقيقية, وبناء علي ذلك تهدف هذه الدراسة الي تحقيق عدد من الاهداف منها استخدام ادوات التنقيب في البيانات لمعرفة المتغيرات التي تؤثر علي الارباح في عمليات البيع وتحديد العوامل والمتغيرات التي تؤثر علي زيادة الارباح واكتشاف متغيرات غير المتعارف عليها ذات تأثير علي الارباح التجارية واستخدام ادوات التحليل المتقدمة للتنبؤ بالارباح باستخدام ادوات وتقنيات التنقيب عن البيانات.تم جمع البيانات من مصادر اولية ومصادر ثانوية مصادر اولية الاوراق العلمية والدراسات السابقة ومصادر ثانوية من اجل تصميم النموذج وتم تجهيز البيانات من اجل تصميم النموذج ومن ثم تدريب النموذج ومن ثم قياس دقة النموذج.تم بناء نموذج الإنحدار الخطي المتعدد للتنبؤ بصافي أرباح الزبون بإستخدام أربعة صفات و 34.867سجل وهناك حاجة إلى مزيد من البحث لفهم سلوك العملاء بشكل أعمق مما سيساعد المؤسسات في تزويد العملاء بخدمات عالية الجودة. Abstract: The process of determining the profit margin from commercial transactions of various names still constitutes an obsession and an obstacle to the owners of capital and other practitioners of the commercial process. It is the difficulty of predicting profits from commercial operations represented by selling to each customer in various forms. Several problems branched from this problem, including the lack of use of accurate tools in determining profits, which directly leads to an increase in risks that would weaken the activity of entering into unclear commercial experiences and the profits that are made. Conclusion Relying on traditional feasibility studies is often discouraging compared to the capital spent in the business process and relying on semi-fixed variables to estimate profit in most of the traditional studies and omitting a number of variables that may directly affect or ensure that profits are achieved. The decision in business depends entirely on the extent of certain knowledge of achieving profits while minimizing losses as much as possible Based on potential expectations and based on real data, and accordingly this study aims to achieve a number of goals, including the use of data mining tools to find out the variables that affect profits in sales operations and to identify the factors and variables that affect the increase in profits and discover unknown variables that have an impact On commercial profits and the use of advanced analysis tools to predict profits using data mining tools and techniques. Data were collected from primary and secondary sources, primary sources, scientific papers, previous studies and secondary sources in order to design the model. The data was prepared for model design and then training the model and then measuring Model accuracy.The multiple linear regression model was built to predict customer net profit using four characteristics and 34.867 records and more research is needed to understand customer behavior in a deeper way, which will help organizations in providing customers with high quality services.
  • Thumbnail Image
    Item
    استخـدام تقنيات تنقيب البيانات في تطبيقات التــجارة الالكتــرونيــة للتنبؤ عن المبيعات المستقبلية
    (جامعة النيلين, 2021-10) عواطف الحاج كوكو خاطر
    المستخلص : يناقش هذا البحث التأثير القوي لتطبيقات التجارة الالكترونية في الاعمال التجارية الصغيرة وكيف يمكن للمسوقين الاستفادة من هذه التطبيقات لجني الارباح دون انفاق المزيد من الاموال في التسويق التقليدي عدم القدرة على التنبؤ بالبضائع والمنتجات المرغوبة ،عدم معرفة اذواق الزبائن ، عدم معرفة اي المنتجات اكثر طلباً خلال اي شهر من شهور السنة . وكذلك صعوبة الحصول على سجل المبيعات . إعطاءالحل البديل الأمثل للشركات ذات الميزانية الصغيرة للترويج لها ولخدماتها، ذيادة أرباح الشركة وعائداتها من خلال الوصول إلى غالبية الناس، وتطوير نموذج يمكنه التنبؤ بنتائج التسويق من خلال تطبيقات التجارة الالكترونية ، اصبح لا غنى لدى أي مستخدم انترنت عن تطبيقات الهواتف الجوالة على مدار العقد الأخير حيث توفر إمكانية القيام بالعديد من المهام اليومية بأقل مجهود ممكن خلال ثواني أو دقائق معدودة مثل التسوق وتصفح وطلب الخدمات المرغوبة مثل خدمات الصيانة والبحث عن الوجبات الغذائية وطلبها وتحويل واستلام الأموال ومتابعة كل عمليات النشاط التجاري . ترتكز منهجية البحث على المنهج الوصفي التحليلي في عملية التحليل ومقارنة النتائج وبناء التوقعات ، تم استخدام برنامج الويكا في التنقيب عن البيانات وخوارزمية (J48) والتي تعتبر إحدى خوارزميات التصنيف الشجري للتنبؤ بسلوكيات العميل الشرائية ، وكذلك تم استخدام خوارزمية (Apriori)لتوضيح العلاقة بين العملاء والمبيعات عبر الزمن ، استخدام تقنيات تنقيب البيانات ساعد في تحليل المبيعات خلال فترة زمنية معينة بدقة عالية. ونجد أن أكثر الاماكن إستفادة من التطبيق هي ولاية الخرطوم وخاصة في مناطق المعمورة والأزهري وأمدرمان والطائف والرياض.وأكثر الشهور التي بها تدفق قوة شرائية هي شهر سبتمبر وأغسطس بنسبة ملحوظة . ونجد أن العنصر النسائي هو الأكثر إقبالاً على طلب شراء المنتجات من خلال التطبيق. والفترة المسائية هي الأكثر طلباً في الشراء من حيث الزمن.والأدوات المنزلية هي الأكثر شراء ومن ثم تليها العقارات والسيارات.يجب زيادة بيانات التدريب المستخدمة في الدراسة بإضافة مزيد من الخصائص مثل طريقة الدفع وإضافة كافة البيانات الخاصة بباقي الشهور،عمل مستودع بيانات متكامل لتوفير كل المعلومات والبيانات التي يحتاجها المحللون لمساعدتهم في تنقيب البيانات وإكتشاف المعرفة وإستخدام خوارزميات اخرى ومقارنة النتائج بنتائج هذا البحث ، وكذلك يجب تخزين بيانات المبيعات بصورة جيدة لتكون فى متناول اليد مما يساعد فى إكمال مسيرة الابحاث فى هذا المجال ، تطبيق خوارزمية الترابط Association لتحديد العلاقات بين المبيعات والعملاء والشهور التي يكون فيها تزايد في نسبة المبيعات . ه Abstract : This research discusses the strong impact of e-commerce applications in small businesses and how marketers can take advantage of these applications to make profits without spending more money on traditional marketing. Unpredictability of desired goods and products, lack of knowledge of customers' tastes, lack of knowledge of any more in demand products during any month of the year. It is also difficult to get a sales record. Give the perfect alternative solution for small-budgetcompanies to promote them and their services, boosting the company's profits and revenues by reaching the majority of people, and developing a model that can predict the results of marketing through e-commerce applications, it has become indispensable for any Internet user to apply mobile phones over the last decade where it provides the possibility to do many daily tasks with the least effort possible in a few seconds or minutes such as shopping, browsing and requesting desired services such as maintenance services, searching and ordering meals, transferring and receiving money and following all business operations Based on the descriptive analytical approach in the process of analysis, comparing results and building expectations, the WAICA program was used in data exploration and algorithm (J48), which is one of the tree classification algorithms for predicting the client's purchasing behaviors, the use of data exploration techniques helped analyze sales over a certain period of time with high accuracy. We find that the most useful places for the application are Khartoum stateEspecially in the regions of Al-Maamoura, Al-Azhari, Amberman, Taif and Riyadh. The most significant month of purchasing power flow is September and August. The female component is the most popular for ordering products through the app. The evening period is the most in demand in time. Household items are the most purchased and then followed by real estate and cars. Training data used in the study should be increased by adding more features such as payment method, adding all data for the rest of the months, making an integrated data repositoryTo provide all the information and data that analysts need to help them dig up data, discover knowledge, use other algorithms and compare results with the results of this research, as well as store sales data well to be within reach, which helps to complete the research process in this area, apply the association's
  • Thumbnail Image
    Item
    استخدام تقنيات تنقيب البيانات للتحليل حاله الطقس ( دراسة حالة ولاية الخرطوم (يناير 1981_ ديسمبر 2010 ()
    (جامعة النيلين, 2021) سلمي الشيخ سعد مصطفي
    المستخلص الكثيرمن الأنظمة تحتوي علي بيانات هائلة من الممكن استخدامها وتحليلها للحصول علي معلومات مفيدة تساهم في عمليه اتخاذ القرار السليم ولكن حجم هذه البيانات يجعل من الصعب تحليلها يدويا لذا أصبحت هنالك حاجه ماسه لوجود وسائل تمكن من الوصول لهذه البيانات بطريقة سهله وفعالة واحدي هذه الوسائل تقنية تنقيب البيانات. تكمن مشكلة الدراسة في سؤالين ما هي أهم خوارزميات تنقيب البيانات الأكثر ملائمة في مجال الأرصاد الجوي وهل هذه الدراسة تساعد الإدارة بالاهتمام بتنقيب البيانات. تتبع أهمية الدراسة في استخدام تنقيب البيانات في مجال الرصد الجوي للمساعدة في اتخاذ القرار السليم بالسرعة والدقة المطلوبة حيث يهدر المحللون البشر الكثير من الوقت في تحليل البيانات. استخدام منهج التحليل الوصفي في تحليل وتصميم البيانات عبر دوره حياة تطور النظم. تهدف هذه الدراسة الي التنبؤ بحاله الطقس حيث تم بناء قاعدة بيانات تحتوي علي معلومات الطقس وتحليل تلك البيانات باستخدام البرنامج ويكا والتنبؤ بواسطة خوارزمية Multilayer perceptionوكانت حاله التنبؤ( حاله طقس متوقعه، حاله طقس اقل من المتوقع، حاله طقس اعلي من المتوقع) حيث تم استخدام هذه الخوارزمية لكفاءتها في التنبؤ بحاله الطقس. خرجت الدراسة بان العوامل المؤثرة علي حاله الطقس هي ( درجه الحرارة العليا – الرطوبة –درجه الحراره الصغري) تم بناء النموذج باستخدام الشبكة العصبية وكانت نسبه النموذج 57% ومعدل الخطأ 0.33 . Abstract Many systems contain huge data that can be used and analyzed to obtain it contain useful information that contributes to the process of making a sound decision ,but the volume of this data makes It is difficult to analyze it manually, so there is an urgent need for means to access this data in an easy and effective way, and one of these means is data technology .the problem with the study lies in two question: what are the most important data mining algorithms that are most appropriate in metrology? The study helps the administration to pay attention to data mining In the field of metrology to help makes the right decision with the required speed and accuracy, where waste is wasted Human analysts spend a lot of time analyzing data .use the descriptive analysis method to analyze and data design across the systems evolution life cycle this study aims to predict the weather a data base containing weather information was built and that was analyzed using the program WEKA forecasting using the multilayer perceptron algorithm was a forecast condition. Weather condition is lower than expected, weather condition is higher than expected (where this algorithm was used) for its efficiency in forecasting the weather .the study concluded that the factors affecting the weather are: maximum temperature, minimum temperature ,and humidity .the model was but using the grid the model ratio was 57% and the error was 0.33
  • Thumbnail Image
    Item
    إستخدام تقنيات التنقيب عن البيانات في التنبؤ بالقروض متناهية الصغر (بالتطبيق على بنك الإدخار والتنمية )
    (جامعة النيلين, 2021-03) الاء عبدالمنعم حمدنا الله علي حسن
    المستخلص يقدم هذا البحث دراسة تحليلية وتنقيب البيانات لمجموعة كبيرة من البيانات تقدر بعدد (2490) سجل للعملاء الذين قاموا بإستخراج طلب الحصول على قرض من البنك وذلك خلال عام 2019-2021 والتي تم الحصول عليها من قسم الIT بالبنك ، وتكمن أهمية الدراسة في تجميع البيانات الخاصة بالعملاء والإستفادة منها في عملية إتخاذ القرار بما يساعد البنك في التطوير والتحديث المستمر والتنبؤ بمدى نجاح المشروع المراد استخراج القرض له، وقد تم إستخدام المنهج العلمي التجريبي في هذه الدراسة حيث تم إستخدام خوارزمية التصنيف J48 لتوليد شجرة القرار وخوارزمية K-mean عن طريق برنامج Weka لتنفيذ الخوارزمية علي بيانات العملاء ثم تحليلها وعرض النتائج وقد تم التوصل إلى عدة نتائج أهمها أن اكثر المشاريع التي تمت الموفقه عليها كانت في القطاع الصناعي وأهمها شراء مواد البناء تليها القطاع الحيواني وتجارة المواشي ، ومن أهم التوصيات التي نوصي بها هي زيادة البيانات المستخدمة في التنقيب وإضافة مجمموعة من الحقول مثل الولايات ونوع العميل (ذكر أو أنثى) بما يساهم في إستخراج معلومات أكثر أهمية. Abstract This research presents An analytical study and its use (2490) records that was exaction from El_Edikhar Bank and in the decision-making process in a way that helps the bank in developing, updating and predicting the extent of the project for which the loan is to be extracted, and the educational method was used in this model study in this study and the use of the classification algorithm J48 decision tree and the K-mean algorithm by Weka software to implement the algorithm The most important activities that have been reached and the presentation of the data that have been reached in many projects that have been formulated in the industrial sector, the most important of which are building materials, followed by the animal sector and livestock trade. And the type of client (male or female), which increases the extraction of more information.
  • Thumbnail Image
    Item
    عنــــوان البــــــحث مقارنة تقنيات تنقيب البيانات في أداء الطالب الاكاديمي بالتطبيق علي بعض المدارس الثانوية الحكومية بولاية الخرطوم - محلية كرري
    (جامعة النيلين, 2020-02) مصطفى السر فضل المولى أحمد
    Abstract It is known that the student’s academic record is the foundation upon which the student and the educational institution are based during the study period, as it contains all academic and personal information about the student over the years of study. Although there is all the information that helps in making decisions about developing the academic level of the student, it is not used for this purpose, it's just used to store certain statistics. In this research, I made a comparison between data mining techniques using the Aproiri algorithm and the FP-growth algorithm in the correlation technique, the K-means algorithm in the clustering technology and the one-R algorithm in the classification technology and applied it to the academic database of a number of male and female students in Khartoum State schools - Karary local government secondary school, in follow-up Academic performance of the student based on his grades in ten subjects. After collecting data, preparing it, analyzing it, and applying the aforementioned technologys. Important results were reached It is that the final rates for most students between failure and the middle and that the lowest minimum subjects in the level are mathematics and the English language with very high failure rates and that a number of subjects are closely related to each other and closely related to the success or failure of the student at the final rate and that the FP-growth algorithm is better in performance than Aproiri algorithm technology, and that the efficiency of the One-R algorithm in classification technology and SimpleK-means in clustering technology is very high. الملخص من المعروف أن سجل الطالب الأكاديمي هو الأساس الذي يرتكز عليه الطالب والمؤسسة التعليمية أثناء فترة الدراسة ، حيث أنه يحوي كل المعلومات الأكاديمية والشخصية حول الطالب عل مدار سنين الدراسة. وبالرغم من توفر كل المعلومات التي تساعد في إتخاذ القرارات بشأن تطوير المستوى الأكاديمي للطالب إلا أنه غير مستخدم لهذا الغرض و يكٌتفى منه بأخذ إحصاءات معينة وتخزينٌها. وقد قمت في هذا البحث بعمل مقارنة بين تقنيات تنقيب البيانات بإستخدام خوارزمية Aproiriوخوارزمية FP-growth في تقنية قواعد الإرتباط ، وخوارزمية K-means في تقنية التجميع وخوارزمية One-R في تقنية التصنيف وتطبيقها على قاعدة البيانات الأكاديمية لعدد من طلاب وطالبات مدارس ولاية الخرطوم - محلية كرري الثانوية الحكومية ، في متابعة أداء الطالب أكاديميا إستناداً عل درجاته في عشر مواد وبعد تجميع البيانات وتهيأتها وتحليلها وتطبيق التقنيات المذكورة مسبقا تم التوصل إلى نتائج هامة وهي أن المعدلات النهائية لمعظم الطلاب بين الرسوب والوسط وأن أكثر المواد تدنيا في المستوى هي مادة الرياضيات واللغة الإنجليزية بنسب رسوب عالية جدا وأن عدد من المواد الدراسية ترتبط مع بعضها وترتبط إرتباطا وثيقا بنجاح أو رسوب الطالب في المعدل النهائي وأن خوارزمية FP-growth أفضل في الأداء من خوارزمية Aproiri في تقنية قوانين الإرنباط وأن كفاءة خوارزمية One-R في تقنية التصنيف وخوارزمية SimpleK-means في تقنية التجميع عالية جدا .
  • Thumbnail Image
    Item
    إستخدام تقنيات تنقيب البيانات لدراسة ظاهرة تسرب الطلاب في مدارس تعليم الأ ساس (بالتطبيق على منطقتي جنوب الجزيرة والحصاحيصا _ولاية الجزيرة)
    (جامعة النيلين, 2017) ريان الفاضل صديق خوجلي
    Abstract:   Education is one of the most important  The pillars of society and is an indicator of the growth and development of countries, so all countries and communities attach great importance to him.       There is no doubt that any social phenomenon, behavioral or educational or other negative phenomena, if not followed by study and analysis to identify the causes or the factors that lead to it, and then characterize the treatment is effective, and to attach this process of recovery period to get rid of all side effects Which may arise during this treatment, which may be prolonged or shortened according to the type of phenomenon and its consequences and the subsequent destruction and destruction would have led to the subsequent responses if not be remedied and restrained at this sensitive moment and critical, or turn this phenomenon to be similar to the inevitable reality that C We were then forced to deal with it either by melting it or by keeping it out of fear of it becoming more and more dangerous.         One of the worst phenomena is the dropout of students from schools in Sudan, which is now one of the educational dilemmas that have failed to resolve.         Hence the idea of ​​exploration in the data of students to know the causes and effects that affect negatively or positively on this phenomenon.     It is one of the most serious pests facing the educational process and the future of generations in different societies because it is an educational waste that affects not only the student but also all aspects of society. It increases illiteracy, illiteracy and unemployment, weakens the economic and productivity structure of society and the individual and increases dependency. And dependence on others, and also produce the community serious phenomena such as child labor and exploitation and the phenomenon of early marriage .. Which leads to increase the size of social problems such as juvenile delinquency and the spread of thefts and assault on the property of others, which leads to weakness Society and the spread of corruption in it. The problem of dropout caused loss and loss to the students themselves because this problem leaves its negative effects in the psyche And disrupts productive participation in society. It is one of the most serious pests facing the educational process and the future of generations in different societies because it is an educational waste that affects not only the student, but also all aspects of society, which necessitates research and studies that explain the causes of this phenomenon and seek to solve it. A random sample, consisting of a number of students' records, was studied The tools used are Microsoft Excel 2007, WEKA 3.8.1 The results of the study were correctly predicted by 65.6% for 656 cases and 34.3% were wrongly predicted for 434 cases. The number of nodes in the tree was 14 knots and the total size of tree 21 was 6 seconds0.0. The most important recommendations of the research to increase the efficiency of the results obtained from this research recommended the addition of social, demographic and environmental data and access to data in recent years. Use other refining methods with a set of data for more information.
  • Thumbnail Image
    Item
    استخدام تقنية تنقيب البيانات في التعرف على العوامل المؤثرة على مرض (الماء الأبيض (بالتطبيق على مستشفى مكة لطب العيون) :
    (جامعة النيلين, 2019-10) نبيلة طارق عبدالنبي محمد.
    (30- (31- المستخلص: (32- يعرف تنقيب البيانات على أنه مصطلح يستخدم لوصف عملية اكتشاف أو استخراج المعرفة من كمية كبيرة من البيانات.تركز تقنيات التنقيب على بناء التنبؤات المستقبيلية واستكشاف السلوك والاتجاهات. (33- تتمثل المشكلة في ارتفاع الإصابات بمرض العيون الماء الأبيض(كتاراكت) بولاية الخرطوم. قد ترجع المشكلة إلى عدم توفر معلومات كافية عن العوامل المؤثرة للمرض ، تتنبأ بالاعداد التقريبية بالاصابات المتوقعة. يهدف هذا البحث إلى إكتشاف العلاقات الهامة بين أمراض العيون والعوامل المؤثرة في مسبباتها ، وتوفير معلومات مستقبلية عن أمراض العيون تساعد في إتخاذ القرارات ، وتوفير الموارد الكافية لمكافحة الأمراض من خلال بناء النموذج المناسب.تكمن الأهمية النظرية للبحث أن التنقيب في البيانات شكل هام من اشكال دعم القرار التي تساعد على صنع واتخاذ القرار ، ويسمح بالقيام بإستعلامات أو أسئلة دقيقة وتطويرها بإستمرار دون الحاجة الى وجود فكرة هدف محدد في البداية. الأهمية العلمية تتمثل في بناء التنبؤات المستقبلية واستخراج بيانات جديدة تحدد ما اذا كانت اي علاقة ظاهرية تعكس حقيقة في طبيعة البيانات.تم اتباع المنهج الوصفي لأنه طريقة لوصف الموضوع المراد دراسته ،وتصوير النتائج التي تم التوصل اليها على أشكال رقمية معبرة يمكن تفسيرها.ولأنه يدرس الظاهرة كما هي في الواقع.والمنهج التاريخي لأنه يساعد في إيجاد العلاقة بين الظواهر المدروسة وبين البيئة التي أدت إلى نشوئها.تم استخدام برنامج الweka لبناء النموذج لمعرفة التنبؤات المستقبلية للمرض واستخدام Excel worksheet لعرض النتائج.تم التوصل الى أن هناك علاقة طردية بين متوسط درجة الحرارة وعدد الإصابات، وعلاقة ايجابية قوية بين معدل الإصابة بالمرض والعمر.الى أن هناك علاقة ضعيفة بين ارتفاع الإصابة بالمرض ونسبة الوراثة.يوصى بإستخدام بيانات قائمة بالفصول لتوقع ادق بمرض الساد مع اختبار مساهمة العوامل الأخرى في معدل الإصابة بالمرض،كما يوصى بإضافة سمات أخرى تتعلق بأفراد المجتمع مثل النوع والمنطقة. (34- (35- Abstract: (36- Data Mining is a term used to describe the operation of discovering or extracting knowledge from a large amount of data. Data mining concentrating on building future predictions and exploring behavior and trends.The problem is the high incidence of factors affecting the disease (Cataract) in Khartoum state. Because of the insufficient information on the disease helping in the prediction of the approximate number of the expected cases. This research aims to discover the important relationships between eye diseases and the factors influencing their causes. And providing future information on eye diseases to help in decision making. And provision the adequate resources to fight these diseases through building the suitable model. The importance of this theory is that Data mining is an important shape of decision supporting which helps in decision making. And also allows for accurate queries and continuously develop it without having a specific goal idea at first. The scientific importance is to build the future predictions and extracting new information determines whether there is a virtual relationship reflecting the reality of the data. The descriptive approach was followed because it is a way to describe the subject that you want to study. And depict the results that have been reached on digital forms that can be interpreted. Besides learning the phenomenon as it is actually. The analysis and design systems approach was also followed because it helps in the analysis inputs, outputs and process.Weka software was used to build a model to know the future prediction of the disease and an Excel worksheet was used to review the results. It was reached that there is a direct correlation between the average temperature and the number of cases, strong positive relationship between the disease and the age of the patient, And a poor relationship with regard to genetics. It is recommended to uses seasonal data to help in an accurate prediction of Cataract cases. Beside examining the other factors of the infection. It is also recommended to add other attributes related to the individuals such as gender and living area.