2008年8月10日 星期日

圖像壓縮(一)

上次我曾討論過文字的壓縮技術及和熵的關係。但結束前我又說到自然的資訊如聲音和圖像,這便比較困難了。今次,我便討論一下這個問題。

聲音的壓縮比較難理解,我還是由圖像說起罷!圖像的壓縮問題其實發生於個人電腦之前,由於早期的個人電腦能力有限,根本就不能太有效處理圖像,所以在三十年前,根本不存在電腦圖像問題。但約三十年前,有一圖像科技迅速發展起來,這就是傳真(Fax)。

傳真機其實就是一部綜合了掃瞄,打印和數據傳送的機器。而它有一個特點就是用固有的電話網絡作資料傳送。這點對其普及十分重要。但是,這又出現另一個問題,電話線是設計來傳送話音的,對數據傳送的速度非常有限,今天,電話線上網的速度可達56K,但當年的技術,我們是講300,1.2K,2.4K,後來發展到9.6K經已非常‘偉大’。

在速度的限制下,傳真的設計在減低數據量的問題上,可以說是無所不用其極,但說到尾,還是要靠壓縮技術才可以實現傳真的功能!傳真所用的壓縮方法基本上是Huffman Coding。其原理與我上次討論的文字壓縮類似。早期的傳真,很多時都是傳送手寫稿件,可以想像,這是在一張‘大’白紙上的‘一小撮’黑點。據經驗一般黑白面積比不會超過5%。亦即是說根本大部份都是白的。亦即重覆性很高,壓縮比亦高。

但若用傳真來傳照片,便會是個惡夢,一張手寫稿可能在一分鐘內傳完,但傳一張照片,可能十分鐘也未能完成!其分別便是照片不輕易找出重覆性!

等等,你可能會不同意照片缺乏重覆性!人面部都不是紅紅黃黃的嗎?是啊,但同一塊面是不是到處都一樣色呢?手繪的畫面可能會一樣色,但拍得好的照片必然會深淺光度都不一樣!但這實在也給了一個方向,我們有一個模糊印象,相片概應有重覆的資訊,但又說不出是如何重覆!

可能,使用一般性的壓縮方法並不能好好壓縮圖像,數學家另闢溪徑,第一個要打破的便是容許壓縮過程出現損失。

在文字壓縮的例子裏,不論怎樣壓縮都不會變動原文。這便叫做無損失壓縮(lossless compression)。但若我們容許在壓縮過程損失一些‘不重要’的資料,那麼便有可能壓縮到一些本來不可壓縮的資料,或提高壓縮比。這便稱為lossy compression。

對人來說,這個概念一點也不新鮮,我們根本就是用這種模式記憶的。現代人很少會一字不漏地背誦文章,看過文章後記得其主旨和大意便可以了!這便是有損失的壓縮。

但對電腦來說,它祗是貯存和按概定程序處理資料,根本就不認識這些資料的意義,要找出甚麼是‘不重要’的、‘可抛棄’的,實在是對數學家的一大挑戰!

未完,待續。

沒有留言:

網誌存檔