


Penyaringan manual terhadap 532 sampel akustik owa Hainan telah selesai dilakukan, termasuk yang diperoleh selama pelacakan dan pengamatan owa dengan menggunakan perekam portabel dan yang diperoleh dengan menggunakan perekam otomatis. Selama proses penyaringan, tiga kualitas rekaman pada awalnya dikategorikan, yaitu tinggi, sedang, dan rendah. Diperoleh 44 rekaman berkualitas tinggi dari tujuh individu owa. Ketujuh individu pemanggil tersebut adalah GAM1, BM1, GBSA, GCM1, GCM2, GDM1, GEM1, di mana huruf setelah "G" menunjukkan nomor kelompok keluarga dan huruf setelah "M/S" menunjukkan nomor individu jantan dewasa/individu jantan muda. Hanya sekitar 40,9% rekaman yang dibuat secara manual. File mentah dari semua rekaman otomatis disediakan oleh tim profesor Wang Jichao, dan data terkait dicadangkan di Institut Taman Nasional Hainan.
Koefisien cepstrum frekuensi mel (MFCC) adalah metode ekstraksi fitur amplop frekuensi dengan cepstrum setelah melemahkan informasi frekuensi tinggi berdasarkan pendengaran manusia [1], yang memiliki berbagai aplikasi di bidang manusia dan bioakustik. Dalam penelitian ini, MFCC dan perbedaan orde pertama dan orde kedua (△、△2) digunakan untuk mencapai ekstraksi fitur otomatis.
Lima nada khas owa hainan jantan telah diidentifikasi (Gbr.1), termasuk nada boom, nada aa, nada pra-modulasi, nada modulasi-R0, dan nada modulasi-R1.
Menurut hipotesis ceruk akustik, panggilan spesies yang berbeda dibedakan dalam domain waktu dan frekuensi (lihat Gbr. 2), sehingga mengekstraksi fitur dalam rentang frekuensi tertentu dapat sangat mengurangi pengaruh kebisingan, dan semakin kecil rentang frekuensi yang digambarkan, semakin besar kemungkinan lebih banyak suara yang akan dikecualikan. Selain itu, apabila struktur setiap unit pengenalan minimum (MRU) sama, maka, kesulitan pengenalan akan sangat berkurang.
Mengingat situasi di atas, dalam tahap penelitian ini, kami mencoba (1) menerapkan pre only dan (2) menggunakan pre + n×mR0 sebagai MRU, masing-masing, dan membandingkan hasil klasifikasi untuk menentukan ekstraksi fitur yang paling tepat dalam pekerjaan selanjutnya. Dalam kasus anotasi suara, semua langkah di atas dapat diimplementasikan secara otomatis oleh kode bahasa R.