混洗SRAM:SRAM中的并行按位數(shù)據(jù)混洗
計(jì)算機(jī)研究與發(fā)展
頁數(shù): 15 2024-03-13
摘要: 向量處理單元(vector processing unit, VPU)已被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)、信號(hào)處理和高性能計(jì)算等處理器設(shè)計(jì)中,但其總體性能仍受限于專門用于對(duì)齊數(shù)據(jù)的混洗操作.傳統(tǒng)上,處理器使用其數(shù)據(jù)混洗單元來處理混洗操作.然而,使用數(shù)據(jù)混洗單元來處理混洗指令將帶來昂貴的數(shù)據(jù)移動(dòng)開銷,并且數(shù)據(jù)混洗單元只能串行混洗數(shù)據(jù).事實(shí)上,混洗操作只會(huì)改變數(shù)據(jù)的布局,理想情況下混洗操作應(yīng)在... (共15頁)