データの定量化とデータベース化

音の生データをAdobe Audition 3.0またはAvisoft-SASLab Pro音響分析ソフトウェアにインポートし、リサンプリング(サンプルサイズ:44100Hz、ウィンドウサイズ:1024ポイント)した後、WAV形式で個別に保存。海南テナガザルの鳴き声の特徴を測定し、個体間の音響指標の違いを分析し、個体ごとの海南テナガザルの鳴き声パターンのデータベースを構築するために、高品質な波形とソノグラムを選択した。次に、実装した音声認識モデルを用いて個体ごとの音声認識を行う。最後に、音取得の有効性を評価し、音認識の精度を評価する。このうち、音の認識効果の評価は、主にフィールド調査や他の音のモニタリング結果との比較によって行われる。

取得した海南テナガザルの時間周波数領域の特徴に基づき、発声データベースと連動して自動認識に使用するパラメータを決定した。選択された時間周波数パラメータは自動認識ソフトウェアにインポートされ、開発されたアルゴリズムプログラムにより、録音から海南テナガザルの鳴き声が自動的に識別・抽出された。音声データに含まれるテナガザルの数などの情報は、さまざまなクラスタリングや識別法によって評価される。

全自動の音響モニタリング装置は、このプロジェクトのデータ処理に欠かせない。送信された音響データは自動的にファーウェイのクラウド空間に保存される。海南生物多様性の音パターン・ファーウェイ・クラウド・データベースが構築されれば、個々の音の認識が可能になる。