基于穩(wěn)定擴(kuò)散模型的漢服效果圖生成研究
北京服裝學(xué)院學(xué)報(自然科學(xué)版)
頁數(shù): 8 2024-12-24
摘要: 針對漢服效果圖生成過程中因各朝代服飾特征難以被準(zhǔn)確捕捉而造成生成圖像朝代混淆的問題,本文基于穩(wěn)定擴(kuò)散模型(Stable Diffusion),根據(jù)新輸入的文本提示詞匹配文本與圖像特征空間向量,將V~*作為新標(biāo)記符號嵌入層,并協(xié)同交叉注意力層參數(shù)W
k和W
v進(jìn)行聯(lián)合優(yōu)化,最終搜索模型再學(xué)習(xí)新服飾文本特征后的損失函數(shù)最小值。通過查閱文獻(xiàn)史料,收集整理并新增了唐、宋、明3個朝代16... (共8頁)