Erkennungsmodellierung

Aufgrund der zu großen Anzahl von Merkmalen wurde eine 10-fach kreuzvalidierte SVM-RFE verwendet, um die Wichtigkeit der Merkmale nach der Extraktion zu bewerten. Anschließend wurden die Merkmale nacheinander für die LDA-Klassifikation hinzugefügt, um die Veränderung der Genauigkeit mit der Anzahl der ausgewählten Merkmale zu erfassen. Die höchste Genauigkeit für die LDA-Klassifikation war 89,2 % (pre) / 95,6 % (pre + n×mR0).

Da keiner der MFCCs, die mit einer festen Anzahl von Fenstern extrahiert wurden, bessere Ergebnisse als die GMM-Fitting-Methode für die LDA-Klassifikation erzielte (6-Fenster: 86,6%; 10-Fenster: 88,5%; 100-Fenster: <80%), testeten wir die Effektivität der anderen Klassifikatoren, indem wir nur die mit der GMM-Fitting-Methode extrahierten Merkmale verwendeten. Bei diesem Test wurden 20 % der Daten nach dem Zufallsprinzip als Testmenge ausgewählt, und die restlichen Daten wurden zum Trainieren des Klassifikators verwendet, was für jede Kernel-Funktion 10 Mal wiederholt wurde, um die Verteilung der Genauigkeit zu erfassen. Der Klassifizierungseffekt von GMM ist schlecht, wenn nur pre als MRU verwendet wird, während der Effekt im Allgemeinen besser ist als nur pre, wenn pre + n×mR0 als MRU verwendet wird.

Es gibt viele Klassifikatoren, die für die individuelle Erkennung verwendet werden können. In Anbetracht der Leistungen und Möglichkeiten der Klassifikatoren wurde in dieser Untersuchung die Klassifizierungseffizienz von drei Klassifikatoren verglichen, die im Bereich der Gibbon-Bioakustik oder der Erkennung menschlicher Klangmuster maßgeblich entwickelt wurden, nämlich (1) die lineare Diskriminanzanalyse (LDA), (2) die Support Vector Machine (SVM) und (3) das GMM (Klassifizierung durch Bestimmung der Ähnlichkeit zwischen den zu messenden Daten und den vorhandenen Daten).

Die grundlegende Methode zur Extraktion von Klangmustern wurde identifiziert, und es wurde ein vorläufiges System zur Erkennung einzelner Laute von Hainan-Gibbons entwickelt. Unsere vorläufigen Ergebnisse zeigen, dass die bestehende Systemmethode relativ zuverlässig ist und die erwarteten Ziele des Projekts erreicht werden können. Die Verwendung von pre + n×mR0 als MRU, die Extraktion von Klangmustereigenschaften mit Hilfe der GMM-Anpassungsmethode und die Verwendung von linearen SVM für die Klassifizierung wären effektiver. In den Folgearbeiten werden die Daten seltener Individuen ständig ergänzt, das Design des Algorithmus-Systems wird verbessert, die Fähigkeit des Klassifikators, unbekannte Individuen zu erkennen, wird gegeben sein, und die Leistung des Systems wird umfassend evaluiert werden, um schließlich die Erkennung individueller Laute von Hainan-Gibbons zu realisieren.