基于LPDMR-NET的鳥鳴聲識(shí)別
計(jì)算機(jī)工程
頁數(shù): 11 2024-10-14
摘要: 為了高效且快速地識(shí)別自然環(huán)境中的鳥鳴聲,提出一種基于輕量級(jí)逐點(diǎn)深度的多感受野注意力殘差網(wǎng)絡(luò)(LPDMR-NET)模型。首先,通過Mel濾波器生成Mel頻譜圖。接著,采用basicblock和downblock連接生成兩層殘差網(wǎng)絡(luò)DBNet,堆疊DBNet作為鳥鳴聲識(shí)別的主干網(wǎng)絡(luò),以提高訓(xùn)練速度。然后,利用逐點(diǎn)深度卷積網(wǎng)絡(luò)(PDNet)提取頻譜圖特征信息,替代主干網(wǎng)絡(luò)下采樣模塊,... (共11頁)
開通會(huì)員,享受整站包年服務(wù)