IDEAS
-
使用大语言模型对退化图像生成文本描述,并想象正常场景,将该文本输入controlnet与LQ一起控制SD生成
-
使用预训练模型输出 LQ 与 GT 图像的文本特征,观察分析使得 LQ 与 GT 的文本特征之间可以建立一种映射
-
直接将退化信息输入,如 “no rain”, “no haze”
-
训练过程中采样 z~0 与 z0 做损失
颜色漂移问题
在训练过程中发现重建图像与 GT 图像之间的颜色产生偏移:

解决方案(DiffBIR):
每一步去预测干净的图像 z0 :
z~0=αˉtzt−αˉt1−αˉtϵθ(zt,c,ε(ILQ))(1)
Dlatent(x,ILQ)=L(z~0,ε(ILQ))=j∑CjHjWj1∥z~0−ε(ILQ)∥22(2)