当前位置：首页 > ops >正文

数字图像处理——图像压缩

ops 2025/8/20 3:34:09

背景

图像压缩是一种减少图像文件大小的技术，旨在在保持视觉质量的同时降低存储和传输成本。随着数字图像的广泛应用，图像压缩在多个领域如互联网、移动通信、医学影像和卫星图像处理中变得至关重要。

技术总览

当下图像压缩JPEG几乎一统天下，本文主要依据其原理，进行解析。

工作流总览

颜色空间（YUV）下采样
分块DCT
依据量化表进行DCT量化
zigzag扫描
RLE编码
Huffman编码
上述过程反向进行，解压缩

颜色空间下采样

关于YUV空间一些基础知识：

https://zhuanlan.zhihu.com/p/587189669https://zhuanlan.zhihu.com/p/587189669其中Y空间也称灰度空间，直方图均衡化、灰度拉伸等操作就是基于这个空间进行的，很多时候，为了图像处理的简洁，经常在该空间上进行操作。

将颜色空间RGB转化为YUV之后，由于人眼主要对Y（亮度）敏感，而对UV空间不敏感，所以可以对UV空间进行下采样，（这里对UV空间体积分别缩小到原来的1/4），以512 * 512尺寸的RGB图片为例。仅一步颜色空间下采样，存储空间就压缩为了原本的

（512*512 + 256*256 + 256*256）/ 512*512*3 = 1/2

分块DCT

关于dct的一些相关知识⬇️

https://zhuanlan.zhihu.com/p/85299446https://zhuanlan.zhihu.com/p/85299446dct将空域转化成等价的频域，在频域中，人眼对高频的信息不敏感，那么如果略去高频，保留低频，则实现了图像的有损压缩。

dct仅仅是一步变换而已，并不对图像构成压缩，真正起到压缩效果的是量化 + 编码（也即接下来两步）

为何分块？

全局dct当然可以完成任务，并且压缩效果依旧十分优异。但分块后的好处是明显的

从空间上来说：有固定分块更容易研究量化表，读者仔细思考就会发现，对于任意尺寸的dct二维数组，去用函数生成量化表是困难的，但是如果行业定下一个固定的dct二维数组尺寸，大家就可以尽情研究这个条件下什么样的量化表效果会比较好。

从时间上来说：进行分块后，计算的总体时间比整体计算快很多。在此之外，对于8*8分块的dct，也有很多研究其快速算法的，ANN算法就是其中典例。

DCT矩阵量化

这一步的根本目标就是把DCT的高频部分消去。

具体的计算步骤为，DCT矩阵的元素处以量化矩阵的对应位置元素

读者的困惑应该大多在于量化表的生成。关于这一点，对于任意M*N尺寸的图片，其量化表可以设计一个指数函数去表达, 其中k的值应当偏小，对于512 * 512的lena图来说，笔者尝试值为0.4效果较佳。当然，如果真使用幂函数，记得在最外加上1，防止在0位置除0

Zigzag扫描

JPEG图像压缩探索_zigzag扫描（原创）-CSDN博客文章浏览阅读2k次。文章详细介绍了DCT变换后如何使用zigzag扫描算法将图像数据从高频到低频有序地转化为一维数据，以便于后续的霍夫曼编码等操作。该方法允许在不知原始二维数据边长的情况下，将二维数据转换为一维并能恢复原状。文中还提供了Java代码示例来实现这一过程。https://blog.csdn.net/cjzjolly/article/details/129158254

借上方博客图一用，zigzag扫描顺序如上图所示，其中“扫描”的目的是为了把二维数组转一维数组，方便进一步编码压缩，采用“zigzag”顺序的理由是，这样扫描让尽可能多的‘0’ 靠在了一起，为随后的RLE编码提供基础。

RLE编码

关于该编码，下边这篇讲的挺不错。

https://zhuanlan.zhihu.com/p/1892905961586405848https://zhuanlan.zhihu.com/p/1892905961586405848经过RLE之后，就把重复很多的0给去除了（其实这一点的效用和Huffman编码稍微有点打架，因为如果没有RLE，在量化后DCT矩阵的Huffman编码中，最主要能节省的空间就是重复的0）

Huffman编码

Huffman编码的知识⬇️

Huffman 编码原理详解（代码示例）_霍夫曼解码原理-CSDN博客文章浏览阅读2.9w次，点赞19次，收藏47次。本文介绍了Huffman编码的基本原理，包括路径长度、带权路径长度等概念，并详细阐述了Huffman树的构造过程及其编码实现。通过实例展示了如何选择最优二叉树以获得最短编码。https://blog.csdn.net/qinglongzhan/article/details/80982067关于该编码压缩空间的机理：

我们知道一个int在存储空间占用4个字节 32位，但是如果使用编码的方式以字节流存入，则根本用不了32位，在解码的时候只需保留Huffman的编码表即可。

在调试这一段代码的实践中笔者其实废了挺多力气，因为按字节流存入，再读取的时候由于不清楚大端读还是小端读导致调试的一头雾水。