当前位置: 首页 > java >正文

利用IS模型评估生成的图像质量

IS的核心思想

IS基于一个简单而巧妙的想法:好的生成图像应该既清晰又多样

数学原理

1. 基本公式

IS = exp(E_x[KL(p(y|x) || p(y))])

其中:

  • x:生成的图像
  • y:图像的类别标签
  • p(y|x):给定图像x时,预测为类别y的概率分布
  • p(y):所有生成图像的边际类别分布
  • KL:KL散度(Kullback-Leibler divergence)

2. 详细分解

第一步:获取每张图像的类别概率

# 对于每张生成图像,用Inception-v3预测1000个类别的概率
p(y|x) = [0.8, 0.1, 0.05, 0.03, 0.02, ...]  # 清晰图像:某个类别概率很高
p(y|x) = [0.3, 0.25, 0.2, 0.15, 0.1, ...]   # 模糊图像:概率分布较平均

第二步:计算整体边际分布

http://www.xdnf.cn/news/13819.html

相关文章:

  • 解析XML发票:每一行标签的含义
  • GPIO简介(GPIO输出)
  • 创新综合实践 水果商城管理系统
  • 【Java工程师面试全攻略】Day8:高并发系统设计实战
  • python在容器内克隆拉取git私有仓库
  • 基于RK3588的KVM(Keyboard, Video, Mouse)远程传输方案
  • DQS和DQS_c
  • 进程间通信详解(三):Linux进程信号深度解析
  • 25年春招:字节跳动客户端开发二面总结
  • 【阿里巴巴 x 浙江大学】信息与交互设计 - 交互设计原则与思维
  • Vulkan学习笔记3—物理设备-逻辑设备-窗口表面-交换链-图像视图
  • ​约束催生自由,分离滋养创造——建造者模式有感
  • /proc/<pid>/maps文件格式详解
  • Git 常用总结
  • Unity | AmplifyShaderEditor插件基础(第十集:shader的基本属性+火焰制作-上)
  • 使用cmake安装faiss-GPU.so(无网或者内网情况下)
  • 《网络安全与防护》知识点复习
  • 多通道信号采集分析系统 - 01 功能分解与采样子系统
  • 体育赛事直播平台需要有哪些数据?
  • 通用人工智能离我们还有多远?从认知模型到大模型的深度解析
  • JavaScript中声明变量的关键字const/let/var区别
  • 13-Linux启动流程和内核管理自我总结
  • python根据图片路径获取文件后缀名
  • Spring Boot Actuator 健康信息
  • OpenLayers 动画
  • 零基础RT-thread第一节:串口通信UART
  • C语言——指针
  • 实现AI数据高效评估的一种方法
  • 分水岭边缘提取和hough提取边缘
  • ubuntu20上 : mujoco210安装教程