تطوير أداء محرك البحث الدلالي باستخدام خوارزميات الترتيب الحديثة
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
جامعة النيلين
Abstract
مستخلص الدراسة:
مع ظهور الجيل الثالث من الويب ظهر ما يعرف بتقنيات الويب الدلالي Semantic web، الذي يعد ثورة في عالم المعلومات، حيث أحدث نقلة في معالجة المعلومات عن طريق تحقيق فهم الويب لمعاني ودلالات الكلمات التي يعالجها ويسترجعها؛ فلم يقتصر الأمر على ما كان عليه في السابق من التعامل مع الآلة من خلال التعرف على اللغة الثنائية (صفر وواحد)، دون فهم لدلالات المكتوب عبر الويب.
وقد تبع هذا التطور، تطورًا في نظم استرجاع المعلومات المستخدمة مع هذا الجيل الجديد من الويب؛ حيث ظهر ما يعرف بالبحث الدلالي Semantic search، ومحركات البحث التي تقدم هذا النوع من البحث.
تكمن مشكلة البحث في ان معظم محركات البحث الدلالية تعمل في مجال محدد ومتخصص، كما انها تستخدم خوارزميات ترتيب تعمل على الترتيب اولاً ومن ثم فهرسة النتائج مما يؤدي الى استغراق وقت أكثر في عملية استرجاع النتائج.
وقد ارتكزت الدراسة على استرجاع المعلومات في الويب الدلالي باستخدام المعاني. وتم توضيح هندسة الويب الدلالي وشرح مكوناته وطرق التخزين في الويب الدلالي وآلية التخزين.
تم في هذا البحث استخدام خوارزميات الترتيب الحديثة لتطوير محرك بحث دلالي باستخدام لغة Python التي تم من خلالها تصميم الزاحف(Crawler) وهو برنامج مسؤول عن البحث عن الصفحات والنتائج المطلوبة وتخزينها في قاعدة البيانات الخاصة بمحرك البحث الدلالي. كما تم استخدام لغة PHP لتصميم واجهة محرك البحث.
من اهم نتائج الدراسة ان استخدام خوارزميات الترتيب الحديثة ساعدت كثيراً في تقليل الوقت من خلال عرض النتائج ذات الصلة بموضوع البحث واستبعاد النتائج التي ليست لها صلة بموضوع البحث.
Abstract:
With the advent of the third generation of the web, what is known as the semantic web technologies appeared, which is a revolution in the world of information, as it made a leap in the processing of information by achieving the web's understanding of the meanings and semantics of the words that it processes and retrieves; Not only was it what it used to be in dealing with the machine by recognizing the binary language (zero and one), without understanding the semantics of what was written on the web.
This development was followed by an evolution in the information retrieval systems used with this new generation of the Web; Where appeared what is known as semantic search, and search engines that provide this type of search.
The problem of the search is that most semantic search engines work in a specific and specialized field, and they use ranking algorithms that rank first and then index the results, which leads to taking more time in the process of retrieving the results.
The study was based on retrieval of information in the semantic web using meanings.
The Semantic Web architecture was clarified and its components, storage methods in the Semantic Web, and storage mechanism were explained.
In this research, modern ranking algorithms were used to develop a semantic search engine using the Python language, through which the Crawler was designed, a program responsible to searching for the required pages, results and storing them in the database of the semantic search engine. PHP was also used to design the search engine interface.
One of the most important results of the study is that the use of modern ranking algorithms helped a lot in reducing time by displaying results related to the topic of research and excluding results that are not related to the topic of research.
Description
رسالة مقدمة لنيل درجة دكتوراه الفلسفة في نظم المعلومات
Keywords
استرجاع المعلومات, خوارزميات الترتيب