1. 数据压缩理论简介(译)

    原文:A introduction to compression

    译者:youngsterxyf

    最近我在思考GIF和JPEG图片格式之间的不同:为什么某些图片存储为GIF格式所占的磁盘空间更大,而另一些图片以JPEG格式存储要占用更大的磁盘空间?事实证明,这是因为不同的图片格式使用了不同的压缩方法。

    压缩是一组程序的简便说法,这些程序能够将数据装进更小的存储空间中,也能将数据从压缩编码中重新取回。这是一个双向的过程:输入文件能够产生经过压缩的输出,并且算法根据压缩后的输出能够重新给你一个输入的拷贝。

    冗余:行程长度编码(Run-Length Encoding)

    使压缩成为可能的是冗余:事实表明大多数的数据都以某种方式重复自己。例如,在一个文档中可能多次使用同一个单词,或者一张图片的多处包含相同的颜色。一个非常简单的冗余数据片段的示例如下所示:

    Redundancy: Before compression

    AAAAABBWWWWWWWWWPPPPQZMMMMVVV

    在这种情况下,冗余是明显的;整个样本中重复出现了一系列字母。压缩这种数据的一种简单方式是通过重复次数来代表重复出现的字母,从而削减了样本的总长度。

    Redundancy: After compression

    A5B2W9P4Q1Z1M4V3

    算法读取样本编码后的版本将能够完美地重现原来的数据:"A" 5次,"B" 2次,等等。这个简单算法的使用非常广泛,被称为行程长度编码(RLE ...

    Tagged as : 理论 翻译

Page 1 / 1