利用IS模型评估生成的图像质量
IS的核心思想
IS基于一个简单而巧妙的想法:好的生成图像应该既清晰又多样。
数学原理
1. 基本公式
IS = exp(E_x[KL(p(y|x) || p(y))])
其中:
x
:生成的图像y
:图像的类别标签p(y|x)
:给定图像x时,预测为类别y的概率分布p(y)
:所有生成图像的边际类别分布KL
:KL散度(Kullback-Leibler divergence)
2. 详细分解
第一步:获取每张图像的类别概率
# 对于每张生成图像,用Inception-v3预测1000个类别的概率
p(y|x) = [0.8, 0.1, 0.05, 0.03, 0.02, ...] # 清晰图像:某个类别概率很高
p(y|x) = [0.3, 0.25, 0.2, 0.15, 0.1, ...] # 模糊图像:概率分布较平均
第二步:计算整体边际分布