Моделирование распознавания

Из-за чрезмерного количества признаков для ранжирования важности признаков после их извлечения был использован 10-кратный кросс-валидированный SVM-RFE, затем признаки последовательно добавлялись для классификации LDA, чтобы зафиксировать изменение точности в зависимости от количества выбранных признаков, и, наконец, наилучшее количество признаков было записано в качестве входных данных для последующих классификаций (см. рис. 8). Наибольшая точность классификации LDA составила 89,2 % (pre) / 95,6 % (pre + n×mR0).

Поскольку ни один из MFCC, извлеченных с фиксированным числом окон, не показал лучших результатов, чем метод подгонки GMM для классификации LDA (6 окон: 86,6 %; 10 окон: 88,5 %; 100 окон: < 80 %), мы проверили эффективность других классификаторов, используя только признаки, извлеченные методом подгонки GMM. В этом тесте мы случайным образом выбрали 20 % данных в качестве тестового набора, а остальные данные использовали для обучения классификатора, которое повторили 10 раз для каждой функции ядра, чтобы записать распределение точности. Среди них эффект классификации GMM плох при использовании только pre в качестве MRU, в то время как при использовании pre + n×mR0 в качестве MRU эффект в целом лучше, чем при использовании только pre.

Существует множество классификаторов, которые могут быть использованы для распознавания отдельных звуков. Учитывая характеристики и возможности классификаторов, в данном исследовании сравнивалась эффективность классификации трех классификаторов, получивших значительное развитие в области биоакустики гиббонов или распознавания звуковых образов человека, а именно: (1) линейный дискриминантный анализ (LDA), (2) машина опорных векторов (SVM) и (3) GMM (классификация путем определения сходства между измеряемыми данными и существующими данными).

Определен базовый метод выделения характеристик звукового паттерна и создан предварительный системный метод распознавания индивидуальных звуков хайнаньских гиббонов. Наши предварительные результаты показывают, что существующий системный метод относительно надежен и позволяет достичь ожидаемых целей проекта. Среди них использование pre + n×mR0 в качестве MRU, извлечение характеристик звукового паттерна с помощью метода GMM и использование линейной SVM для классификации было бы более эффективным. В ходе дальнейшей работы данные о редких особях будут постоянно пополняться, дизайн системы алгоритмов будет улучшаться, способность классификатора распознавать неизвестных особей будет повышена, а эффективность системы будет всесторонне оценена, чтобы в конечном итоге реализовать распознавание индивидуальных звуков хайнаньских гиббонов.