ELITE ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation 背景 customized 文本到图像的生成问题:由于用户可能会使用难以形容的、个人的一些概念去创造一些有想象力的样本(例:“柯基”)。通常需要从用户提供的少量图片集合去学习特定的概念,现存工作使用一种基于优 2023-11-28 #Diffusion
Understanding Diffusion Models Understanding Diffusion Models: A Unified Perspective ELBO 目标:学习一个模型去最大化 p(x)p(x)p(x) 的似然 法一:p(x)=∫p(x,z)dzp(x)=\int p(x,z)dzp(x)=∫p(x,z)dz 法二:p(x)=p(x,z)p(z∣x)p(x)=\frac{p(x,z)}{p(z|x)}p(x)=p(z∣x)p(x,z 2023-11-13 #Diffusion
IR-SDE Image Restoration with Mean-Reverting Stochastic Differential Equations 背景 以往的方法的反向过程会初始化一个较高方差的噪声,可能会导致ground-truth高质量图像的恢复效果不好,虽然可以获得较高的感知分数,但是往往会在基于像素或结构的退化标准方面表现不太满意。 贡献 为一般的IR问题提出一种SDE方法。mean-rec 2023-11-13 #SDE
基于分数的生成模型 基于分数的生成模型 基于能量的模型 任意分布都可以被写为: pθ(x)=1Zθe−fθ(x)(152)p_\theta(x)=\frac{1}{Z_\theta}e^{-f_\theta(x)}\tag{152} pθ(x)=Zθ1e−fθ(x)(152) fθ(x)f_\theta(x)fθ(x) 是一个任意的、参数化的函数——能量函数,通常被建模为一个NN,ZθZ_\thetaZθ 2023-11-12 #Diffusion