

特徴数が多すぎるため、特徴抽出後に10重クロスバリデーションのSVM-RFEを用いて重要度のランク付けを行い、LDA分類のために順次特徴を追加し、選択した特徴数による精度の変化を記録し、最終的に最適な特徴数を以降の分類の入力として記録した(図8参照)。LDA分類の最高精度は89.2%(pre)/95.6%(pre + n×mR0)であった。
窓の数を固定して抽出したMFCCは、いずれもLDA分類においてGMMフィッティング法を上回る結果を得られなかったため(6窓:86.6%、10窓:88.5%、100窓:80%未満)、GMMフィッティング法によって抽出された特徴のみを用いて、他の分類器の有効性をテストした。このテストでは、データの20%をテストセットとしてランダムに選択し、残りのデータを分類器の訓練に用い、各カーネル関数について10回繰り返し、精度の分布を記録した。その結果、MRUとしてpreのみを用いた場合にはGMMの分類効果は低いが、pre+n×mR0をMRUとして用いた場合にはpreのみを用いた場合よりも概ね良好な分類効果が得られた。
個体認識に用いることのできる分類器は数多く存在する。本研究では、分類器の性能と可能性を考慮し、テナガザルの生体音響やヒトの音声パターン認識の分野でかなり開発されている3つの分類器、すなわち、(1)線形判別分析(LDA)、(2)サポートベクターマシン(SVM)、(3)GMM(測定データと既存データの類似度を判定して分類)の分類効果を比較した。
音パターン特徴抽出の基本的な方法を特定し、海南テナガザルの個体音認識のための予備的なシステム方法を確立した。その結果、既存のシステム手法は比較的信頼性が高く、プロジェクトの期待目標を達成できることがわかった。その中で、MRUとしてpre + n×mR0を用いること、GMMフィッティング法を用いて音パターンの特徴を抽出すること、分類に線形SVMを用いることがより効果的であることがわかった。今後は、希少個体のデータを継続的に補充し、アルゴリズムシステムの設計を改善し、未知の個体に対する分類器の能力を与え、システムの性能を総合的に評価することで、最終的に海南テナガザルの個体音声認識を実現する予定である。