Estimating the Chance of Success of In-Vitro Fertilization (IVF) Treatment Using Data Mining Algorithms Case Study: Nile Fertility Center
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Neelain University
Abstract
ABSTRACT
Assisted reproductive technologies (ART) give infertile couples the chance to achieve successful pregnancy and achieve the dream of parenting. One of the most widely used infertility treatments is In-Vitro Fertilization (IVF). The effectiveness of this treatment has increased in recent years, but it is complex, stressful and expensive process, besides, it fits in only limited number of cases. For all these reasons, it is fair to the couples with infertility problem to know their chances of success before starting the treatment. If an initial evaluation indicates a low pregnancy rate, decision of the couple may change not to start the IVF treatment. Classical statistical methods have proven to be inadequate in this issue. Only the use of modern methods of data mining gives hope for a more effective analysis of the collected data. The dataset used in this research was collected from Nile Fertility Center from 2014 to 2017. The WEKA tool was used to analyze the data, where the classification algorithms (Decision Tree and Naïve Base) has been applied to the dataset to build two predictive models . The performance of the two models was then evaluated to use the best between them for predicting the success rate of IVF process. The Decision Tree J48 algorithm has achieved better accuracy (75.35%) compared to 69.01% for naïve bayes. We recommend to collect similar datasets from other IVF clinics to investigate whether the model agree with the one constructed in this study. Also other data mining algorithms such as Support Vector Machine (SVM), rough set theory and other types of DT algorithms should be tested in the future. it is also better to build an integrated system for the IVF clinics from the moment of data entry to the process of data mining.
المستخلص
تعطي تقنيات الإنجاب المساعدة (ART) الأزواج المصابين بالعقم فرصة لتحقيق الحمل الناجح و تحقيق حلم الأبوة والأمومة. واحدة من أكثر العلاجات المستخدمة على نطاق واسع في علاج العقم هو التخصيب في المختبرin vitro) fertilization) . ازدادت فعالية هذا النوع من العلاج في السنوات الحالية، و لكنها عملية معقدة ومجهدة ومكلفة. كما أنها لا تتناسب إلا مع عدد محدود من الحالات. لكل هذه الأسباب فمن المنصف للأزواج الذين يعانون من مشكلة العقم معرفة فرصهم في النجاح قبل بدء العلاج، إذا كان التقييم المبدئي يشير إلى انخفاض معدل الحمل، فقد يتغير قرار الزوجين بعدم البدء في علاج التلقيح الصناعي. أثبتت الطرق الإحصائية التقليدية عدم كفاءتها بهذا الشأن. فقط استخدام الطرق الحديثة في تنقيب البيانات يعطي أمل في إجراء تحليل أكثر فاعلية للبيانات التي تم جمعها. تم جمع البيانات المستخدمة في هذا البحث من مركز النيل للخصوبة في الفترة من 2014 إلى 2017. تم استخدام أداة WEKA لتحليل البيانات. حيث تم تطبيق خوارزميات التصنيف (شجرة القرارات و(Naïve bayes على مجموعة البيانات لبناء نموذجين للتنبؤ. ثم تم تقييم أداء النموذجين لاستخدام أفضل ما بينهما للتنبؤ بمعدل نجاح عملية التلقيح الصناعي. حققت خوارزمية شجرة القرار J48 دقة أفضل (75.35 ٪) مقارنة مع 69.01 ٪ لخوارزمية Naïve bayes. .
نوصي بجمع مجموعات بيانات مماثلة من عيادات IVF أخرى للتحقيق فيما إذا كان النموذج متوافقاً مع النموذج الذي تم إنشاؤه في هذه الدراسة. كما يجب اختبار خوارزميات أخرى متعلقة بتعدين البيانات مثل Support Vector Machine (SVM) ، ونظرية rough set theory وأنواع أخرى من خوارزميات DT في المستقبل. من الأفضل أيضًا بناء نظام متكامل لعيادات IVF من لحظة إدخال البيانات إلى عملية استخراج البيانات.
Description
A complementary Research for Master Degree
in Information Systems
Keywords
Estimating Chance