نمذجة التعرف

نظرًا للعدد الزائد من الميزات، تم استخدام SVM-RFE المصدق عليه من 10 أضعاف لتصنيف SVM-RFE لتصنيف أهمية الميزات بعد استخراجها، ثم تمت إضافة الميزات بالتتابع لتصنيف LDA لتسجيل التغير في الدقة مع عدد الميزات المختارة، وأخيرًا تم تسجيل أفضل عدد من الميزات كمدخلات للتصنيفات اللاحقة (انظر الشكل 8). كانت أعلى دقة لتصنيف LDA هي 89.2% (قبل) / 95.6% (قبل + n×mR0).

بما أن أياً من MFCCs المستخرجة بعدد ثابت من النوافذ لم تحقق نتائج أفضل من طريقة تركيب GMM لتصنيف LDA (6 نوافذ: 86.6%؛ 10 نوافذ: 88.5%؛ 100 نافذة: <80%)، اختبرنا فعالية المصنفات الأخرى باستخدام الميزات المستخرجة بواسطة طريقة تركيب GMM فقط. في هذا الاختبار، قمنا باختيار 20% من البيانات عشوائيًا كمجموعة اختبار، واستخدمنا بقية البيانات لتدريب المصنف، وتم تكرار ذلك 10 مرات لكل دالة نواة لتسجيل توزيع الدقة. من بينها، يكون تأثير تصنيف GMM ضعيفًا عند استخدام pre فقط كوحدة MRU، بينما يكون التأثير أفضل بشكل عام من استخدام pre فقط عند استخدام pre + n×mR0 كوحدة MRU.

هناك العديد من المصنفات التي يمكن استخدامها للتعرف على الأفراد. وبالنظر إلى أداء وإمكانيات المصنفات، قارن هذا البحث فعالية التصنيف لثلاثة مصنفات تم تطويرها بشكل كبير في مجال الصوتيات الحيوية للجيبون أو التعرف على أنماط الصوت البشري، وهي: (1) التحليل التمييزي الخطي (LDA)، (2) آلة ناقلات الدعم (SVM) و (3) GMM (التصنيف عن طريق تحديد التشابه بين البيانات المراد قياسها والبيانات الموجودة).

تم تحديد الطريقة الأساسية لاستخراج خصائص النمط الصوتي، وتم وضع طريقة نظام أولية للتعرف على الصوت الفردي لحيوان الجيبون من هاينان. تظهر النتائج الأولية التي توصلنا إليها أن طريقة النظام الحالية موثوقة نسبيًا، وتحقق الأهداف المتوقعة من المشروع. من بينها، استخدام ما قبل + n×mR0 كوحدة MRU، واستخراج خصائص نمط الصوت باستخدام طريقة تركيب GMM، واستخدام SVM الخطي للتصنيف سيكون أكثر فعالية. في عمل المتابعة، سيتم استكمال بيانات الأفراد النادرة باستمرار، وسيتم تحسين تصميم نظام الخوارزمية، وسيتم إعطاء قدرة المصنف على التعرف على الأفراد غير المعروفين، وسيتم تقييم أداء النظام بشكل شامل، وذلك لتحقيق التعرف على الصوت الفردي لقرود الجيبون من هاينان في نهاية المطاف.