(Dynamic Time Warping)التعرف علي الصوت باستخدام خوارزمية إنحراف الزمن الديناميكي
Date
2012
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
المستخلص:
يهدف هذا البحث لبناء نظام للتعرف علي بصمة الصوت الإنساني ، وذلك عبر مقارنة إشارة صوتية من متكلم مع قاعدة بيانات أصوات الأشخاص الذين تمت عملية تسجيل عينات من أصواتهم.
هذا النظام يتكون من خطوتين رئيسيتين ، التعرف علي صوت المتكلم والتحقق من ذلك، حيث يمكن التعرف علي من الشخص الذي تحدث ، كما تم وضع امكانية أن يتم ادخال صوت ليتم التحقق منه بعملية رفضه أو قبوله ، وقد صممت الخوارزمية بإستخدام تقنية إنحراف الزمن الديناميكي Dynamic Time Warping والتي تعتبر إحدي تطبيقات البرمجة الديناميكية.
وأيضاً تم استخدام تقنية Mel-Frequency Cepstrum Coefficients والتي تهدف لاستخلاص الصفات الاساسية لاشارة صوت المتكلم ، والتي تعتبر من اهم العوامل في تحقيق تمييز عالي الدقة، وتستخدم تلك الخطوة في تنقية للصوت.
في هذا البحث تم إنشاء قاعدة بيانات لمجموعة أصوات لعشرين شخص ، وذلك بأخذ خمسة عينات لكل فرد بحيث يسجل كل منهم عينة بنطق اسمه خمسة مرات، وذلك في مرحلة تدريب النظام .
تم تنفيذ النظام ببرنامج ماتلاب v7.0 وإستخدام برنامج الدلفي Delphi لعمل واجهة وشاشات البرنامج ، وقد تم اختبار خوارزمية التعرف علي قاعدة البيانات التي تم انشائها بواسطة الباحث ، وقد حققت نسبة نجاح بلغت 90% ، وبلغت نسبة الرفض الخطأ 8% و القبول الخطأ 2% في مرحلة التدريب.
Abstract:
The objective of this research is to recognize the speaker from his voice, by comparing signal from an unknown speaker to a database of known speakers that have been registered in the system.
The proposed system consists of two main steps, speaker identification and speaker verification. The speaker identification is the process of determining the registered speaker who provides a given speech, and the speaker verification is the process of rejecting or accepting the identity of the speaker which is implemented by using dynamic time warping (DTW) which is considered as one of the dynamic programming applications.
Also MFCC used to analyzed and extract the features of signal voice.
The system has been designed through Matlab 7.0, and Delphi used for user interface.
As the result the system has been successfully tested for a group of 20 persons and every one of them must register his own name 5 times.
The system successful rate is 90% , with false rejection rate 8% and false acceptance rate 2%.
Description
Keywords
تقانة المعلومات