取JPG图片高度与宽度
详细情况参阅下文,不过换算很麻烦,自己看看吧(这里只有一半,文章太大,发不上来,如要后半部,写信给我)。另外我有一个能得到指定图片的大小的Dll文件,如果需要也可告诉我。m。m。1990@qq。 com JPEG 压缩简介 ------------- 1。 色彩模型 JPEG 的图片使用的是 YCrCb 颜色模型, 而不是计算机上最常用的 RGB。 关于色 彩模型, 这里不多阐述。 只是说明, YCrCb 模型更适合图形压缩。 因为人眼对图片上 的亮度 Y 的变化远比色度 C 的变化敏感。 我们完全可以每个点保存一个 8bit 的亮 度值, 每 2...全部
详细情况参阅下文,不过换算很麻烦,自己看看吧(这里只有一半,文章太大,发不上来,如要后半部,写信给我)。另外我有一个能得到指定图片的大小的Dll文件,如果需要也可告诉我。m。m。1990@qq。
com JPEG 压缩简介 ------------- 1。 色彩模型 JPEG 的图片使用的是 YCrCb 颜色模型, 而不是计算机上最常用的 RGB。 关于色 彩模型, 这里不多阐述。
只是说明, YCrCb 模型更适合图形压缩。 因为人眼对图片上 的亮度 Y 的变化远比色度 C 的变化敏感。 我们完全可以每个点保存一个 8bit 的亮 度值, 每 2x2 个点保存一个 Cr Cb 值, 而图象在肉眼中的感觉不会起太大的变化。
所以, 原来用 RGB 模型, 4 个点需要 4x3=12 字节。 而现在仅需要 4 2=6 字节; 平 均每个点占 12bit。 当然 JPEG 格式里允许每个点的 C 值都记录下来; 不过 MPEG 里 都是按 12bit 一个点来存放的, 我们简写为 YUV12。
[R G B] -> [Y Cb Cr] 转换 ------------------------- (R,G,B 都是 8bit unsigned) | Y | | 0。
299 0。587 0。114 | | R | | 0 | | Cb | = |- 0。1687 - 0。3313 0。5 | * | G | |128| | Cr | | 0。5 - 0。
4187 - 0。0813| | B | |128| Y = 0。299*R 0。587*G 0。114*B (亮度) Cb = - 0。1687*R - 0。3313*G 0。
5 *B 128 Cr = 0。5 *R - 0。4187*G - 0。0813*B 128 [Y,Cb,Cr] -> [R,G,B] 转换 ------------------------- R = Y 1。
402 *(Cr-128) G = Y - 0。34414*(Cb-128) - 0。71414*(Cr-128) B = Y 1。772 *(Cb-128) 一般, C 值 (包括 Cb Cr) 应该是一个有符号的数字, 但这里被处理过了, 方法 是加上了 128。
JPEG 里的数据都是无符号 8bit 的。 2。 DCT (离散余弦变换) JPEG 里, 要对数据压缩, 先要做一次 DCT 变换。 DCT 变换的原理, 涉及到数学 知识, 这里我们不必深究。
反正和傅立叶变换(学过高数的都知道) 是差不多了。 经过 这个变换, 就把图片里点和点间的规律呈现出来了, 更方便压缩。JPEG 里是对每 8x8 个点为一个单位处理的。 所以如果原始图片的长宽不是 8 的倍数, 都需要先补成 8 的倍数, 好一块块的处理。
另外, 记得刚才我说的 Cr Cb 都是 2x2 记录一次吗? 所 以大多数情况, 是要补成 16x16 的整数块。按从左到右, 从上到下的次序排列 (和我 们写字的次序一样)。 JPEG 里是对 Y Cr Cb 分别做 DCT 变换的。
这里进行 DCT 变换 的 Y, Cr, Cb 值的范围都是 -128~127。 (Y 被减去 128) JPEG 编码时使用的是 Forward DCT (FDCT) 解码时使用的 Inverse DCT (IDCT) 下面给出公式: FDCT: 7 7 2*x 1 2*y 1 F(u,v) = alpha(u)*alpha(v)* sum sum f(x,y) * cos (------- *u*PI)* cos (------ *v*PI) x=0 y=0 16 16 u,v = 0,1,。
。。,7 { 1/sqrt(8) (u==0) alpha(u) = { { 1/2 (u!=0) IDCT: 7 7 2*x 1 2*y 1 f(x,y) = sum sum alpha(u)*alpha(v)*F(u,v)*cos (------- *u*PI)* cos (------ *v*PI) u=0 v=0 16 16 x,y=0,1。
。。7 这个步骤很花时间, 另外有种 AA&N 优化算法, 大家可以去 inet 自己找一下。 在 Intel 主页上可以找到 AA&N IDCT 的 MMX 优化代码。 ( Intel 主页上的代码, 输入数据为 12。
4 的定点数, 输入矩阵需要转置 90 度) 3。 重排列 DCT 结果 DCT 将一个 8x8 的数组变换成另一个 8x8 的数组。 但是内存里所有数据都是线 形存放的, 如果我们一行行的存放这 64 个数字, 每行的结尾的点和下行开始的点就 没有什么关系, 所以 JPEG 规定按如下次序整理 64 个数字。
0, 1, 5, 6,14,15,27,28, 2, 4, 7,13,16,26,29,42, 3, 8,12,17,25,30,41,43, 9,11,18,24,31,40,44,53, 10,19,23,32,39,45,52,54, 20,22,33,38,46,51,55,60, 21,34,37,47,50,56,59,61, 35,36,48,49,57,58,62,63 这样数列里的相邻点在图片上也是相邻的了。
4。 量化 对于前面得到的 64 个空间频率振幅值, 我们将对它们作幅度分层量化操作。方 法就是分别除以量化表里对应值并四舍五入。 for (i = 0 ; i (5,10111) -30 -> (5,00001) -8 -> (4,0111) 1 -> (1,1) 前面的那串数字就变成了: (0,6), 111001 ; (0,6), 101101 ; (4,5), 10111; (1,5), 00001; (0,4) , 0111 ; (2,1), 1 ; (0,0) 括号里的数值正好合成一个字节。
后面被编码的数字表示范围是 -32767。。32767。 合成的字节里, 高 4 位是前续 0 的个数, 低 4 位描述了后面数字的位数。 继续刚才的例子, 如果 06 的 huffman 编码为 111000 69 = (4,5) --- 1111111110011001 21 = (1,5) --- 11111110110 4 = (0,4) --- 1011 33 = (2,1) --- 11011 0 = EOB = (0,0) --- 1010 那么最后对于前面的例子表示的 63 个系数 (记得我们将第一个跳过了吗?) 按位流 写入 JPG 文件中就是这样的: 111000 111001 111000 101101 1111111110011001 10111 11111110110 00001 1011 0111 11011 1 1010 DC 的编码 --------- 记得刚才我们跳过了每组 64 个数据的第一个吧, DC 就是指的这个数字 (后面 63 个简称 AC) 代入前面的 FDCT 公式可以得到 c(0,0) 7 7 DC = F(0,0) = --------- * sum sum f(x,y) * cos 0 * cos 0 其中 c(0,0) = 1/2 4 x=0 y=0 1 7 7 = --- * sum sum f(x,y) 8 x=0 y=0 即一块图象样本的平均值。
就是说, 它包含了原始 8x8 图象块里的很多能量。 (通常 会得到一个很大的数值) JPEG 的作者指出连续块的 DC 率之间有很紧密的联系, 因此他们决定对 8x8 块的 DC 值的差别进行编码。
(Y, Cb, Cr 分别有自己的 DC) Diff = DC(i) - DC(i-1) 所以这一块的 DC(i) 就是: DC(i) = DC(i-1) Diff JPG 从 0 开始对 DC 编码, 所以 DC(0)=0。
然后再将当前 Diff 值加在上一个值上得 到当前值。 下面再来看看上面那个例子: (记住我们保存的 DC 是和上一块 DC 的差值 Diff) 例如上面例子中, Diff 是 -511, 就编码成 (9, 000000000) 如果 9 的 Huffman 编码是 1111110 (在 JPG 文件中, 一般有两个 Huffman 表, 一 个是 DC 用, 一个是 AC 用) 那么在 JPG 文件中, DC 的 2 进制表示为 1111110 000000000 它将放在 63 个 AC 的前面, 上面上个例子的最终 BIT 流如下: 1111110 000000000 111000 111001 111000 101101 1111111110011001 10111 11111110110 00001 1011 0111 11011 1 1010 下面简单叙述一下针对一个数据单元的图片 Y 的解码 ----------------------------------------------- 在整个图片解码的开始, 你需要先初始化 DC 值为 0。
1) 先解码 DC: a) 取得一个 Huffman 码 (使用 Huffman DC 表) b) Huffman解码, 看看后面的数据位数 N c) 取得 N 位, 计算 Diff 值 d) DC = Diff e) 写入 DC 值: " vector[0]=DC " 2) 解码 63 个 AC: ------- 循环处理每个 AC 直到 EOB 或者处理到 64 个 AC a) 取得一个 Huffman 码 (使用 Huffman AC 表) b) Huffman 解码, 得到 (前面 0 数量, 组号) [记住: 如果是(0,0) 就是 EOB 了] c) 取得 N 位(组号) 计算 AC d) 写入相应数量的 0 e) 接下来写入 AC ----------------- 下一步的解码 ------------ 上一步我们得到了 64 个矢量。
下面我们还需要做一些解码工作: 1) 反量化 64 个矢量 : "for (i=0;i 2) 重排列 64 个矢量到 8x8 的块中 3) 对 8x8 的块作 IDCT 对 8x8 块的 (Y,Cb,Cr) 重复上面的操作 [Huffman 解码, 步骤 1), 2), 3)] 4) 将所有的 8bit 数加上 128 5) 转换 YCbCr 到 RGB JPG 文件(Byte 级)里怎样组织图片信息 ----------------------------------- 注意 JPEG/JFIF 文件格式使用 Motorola 格式, 而不是 Intel 格式, 就是说, 如果 是一个字的话, 高字节在前, 低字节在后。
JPG 文件是由一个个段 (segments) 构成的。 每个段长度 记字开始。 标记字都是 0xff 打头的, 以非 0 字节和 0xFF 结束。 例如 'FFDA' , 'FFC4', 'FFC0'。
每个标记有它特定意义, 这是由第2字节指明的。 例如, SOS (Start Of Scan = 'FFDA') 指明了你应该开始解码。 另一个标记 DQT (Define Quantization Table = 0xFFDB) 就是说它后面有 64 字节的 quantization 表 在处理 JPG 文件时, 如果你碰到一个 0xFF, 而它后面的字节不是 0, 并且这个字节 没有意义。
那么你遇到的 0xFF 字节必须被忽略。 (一些 JPG 里, 常用用 0xFF 做某 些填充用途) 如果你在做 huffman 编码时碰巧产生了一个 0xFF, 那么就用 0xFF 0x00 代替。
就是说在 jpeg 图形解码时碰到 FF00 就把它当作 FF 处理。 另外在 huffman 编码区域结束时, 碰到几个 bit 没有用的时候, 应该用 1 去填充。 然后后面跟 FF。
下面是几个重要的标记 -------------------- SOI = Start Of Image = 'FFD8' 这个标记只在文件开始出现一次 EOI = End Of Image = 'FFD9' JPG 文件都以 FFD9 结束 RSTi = FFDi ( i = 0。
。7) [ RST0 = FFD0, RST7=FFD7] = 复位标记 通常穿插在数据流里, 我想是担心 JPG 解码出问题吧(应该配合 DRI 使用)。 不过很 多 JPG 都不使用它 (SOS --- RST0 --- RST1 -- RST2 --。
。。 。。。-- RST6 --- RST7 -- RST0 --。。。
) ---- 标记 ---- 下面是必须处理的标记 SOF0 = Start Of Frame 0 = FFC0 SOS = Start Of Scan = FFDA APP0 = it's the marker used to identify a JPG file which uses the JFIF specification = FFE0 COM = Comment = FFFE DNL = Define Number of Lines = FFDC DRI = Define Restart Interval = FFDD DQT = Define Quantization Table = FFDB DHT = Define Huffman Table = FFC4。收起