كلية علوم الحاسوب - دكتوراه
Permanent URI for this collectionhttps://repository.neelain.edu.sd/handle/123456789/504
Browse
Item تطوير نموذج لتصنيف بيانات صور الرنين المغنطيسي لحالة الإكتئاب باستخدام تقنيات البيانات الضخمة(جامعة النيلين, 2021-11) وفاء محمد مصطفي أحمالمستخلص أدى توفير أجهزة الكمبيوتر والاتصالات وتعدد استخداماتها إلى توفر كميات كبيرة من البيانات (البيانات الضخمة)، والتي أصبح بلإمكان تخزينها، تحليلها، وعرضها باستخدام تقنيات علم البيانات. المجال الطبي، شهد مؤخرًا زيادة في التخزين الإلكتروني لبيانات المرضى. الصور الطبية تعد من أهم البيانات الطبية نسبة للإعتماد عليها في العديد من تشخيص الامراض وبالتالي توفرت بكميات ضخمة. هذه البيانات تحتاج الي تطوير طرق تحليلية متقدمة للاستفادة منها في المساهمة في دقة التشخيص، بالإضافة للحصول على الإستنتاجات والملاحظات وإستخلاص الميزات من الصورالطبية لمساعدة الأطباء وأختصاصي الأشعة في دعم قراراتهم. هدف الدراسة هو دمج تحليلات البيانات الضخمة في الرعاية الصحية وتقديم تقنيات تحليل متقدمة لتشخيص وتصنيف صور الرنين المغنطيسي، من خلال تصميم نموذج تصنيف بيانات صور الرنين المغناطيسي للدماغ البشري لحالات الاكتئاب، مع عرض بعض الملاحظات حول تاثير العمر والجنس على أجزاء الدماغ البشري. ومن ثم مقارنة أداء عدة طرق للتصنيف شملت الدراسة 400 صورة. تم استخدام سبارك كإحدى أدوات علم البيانات المستخدمة لتحليلات البيانات الضخمة مع تقنيات التعلم الالي، وواجهة بايثون للبرمجة (pyspark API)، تم تطبيق خوارزمية الانحدار اللوجستي، آلة للمتجهات الداعمة، والغابة العشوائية لتصنيف بيانات الصور. دقة النموذج باستخدام الانحدار اللوجستي والألة الداعمة للمتجهات تساوي 85٪ و82% على التوالي، بينما حققت خوارزمية الغابة العشوائية أفضل دقة هي 94%. Abstract providing computers and communications and the multiplicity of their uses have led to the availability of large amounts of data (Big Data), which has become one of the most important topics in recent years. which can now be stored, analyzed, and displayed using data science techniques. The medical field, recently has seen increase in the electronic storage of patient’s data. Medical images are one of the most important medical data, because relied upon in many disease diagnoses. thus, are available in huge quantities. This data needs to develop advanced analytical methods to use in contributing to the accuracy of the diagnosis, in addition to obtaining conclusions and observations and extracting features from medical images to help doctors and radiologists in supporting their decisions.The aim of the study is to integrate big data analyzes in health care and provide advanced analysis techniques to diagnose and classify magnetic resonance imaging (MRI), by designing a model for classification of human brain MRI data for depression, with view some observations on the impact of age and gender on human brain regions. Then, compare the performance of several classification methods, the study included 400 images. Spark was used as one of the data science tools used for big data analytics and python for programming (pyspark API), we apply Logistic Regression, support Vector Machine, and Random Forest to classify the image data. the accuracy of the model using Logistic Regression, SVM is equal to 85% and 82%, respectively, while Random Forest achieved the best accuracy 94%.