基于位置編碼重疊切塊嵌入和多尺度通道交互注意力的魚類圖像分類
計(jì)算機(jī)應(yīng)用
頁數(shù): 8 2024-03-12
摘要: 水下魚類圖像分類是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。傳統(tǒng)Vision Transformer (ViT)網(wǎng)絡(luò)骨干的局限性較大,難以處理局部連續(xù)特征,在圖像質(zhì)量較低的魚類分類中效果表現(xiàn)不佳。為解決此問題,提出一種基于位置編碼的重疊切塊嵌入(OPE)和多尺度通道交互注意力(MCIA)的Transformer圖像分類網(wǎng)絡(luò)PIFormer (Positional overlapping and I... (共8頁)