電腦,科學,政治,哲學: 圖像壓縮（一）

上次我曾討論過文字的壓縮技術及和熵的關係。但結束前我又說到自然的資訊如聲音和圖像，這便比較困難了。今次，我便討論一下這個問題。

聲音的壓縮比較難理解，我還是由圖像說起罷！圖像的壓縮問題其實發生於個人電腦之前，由於早期的個人電腦能力有限，根本就不能太有效處理圖像，所以在三十年前，根本不存在電腦圖像問題。但約三十年前，有一圖像科技迅速發展起來，這就是傳真(Fax)。

傳真機其實就是一部綜合了掃瞄，打印和數據傳送的機器。而它有一個特點就是用固有的電話網絡作資料傳送。這點對其普及十分重要。但是，這又出現另一個問題，電話線是設計來傳送話音的，對數據傳送的速度非常有限，今天，電話線上網的速度可達56K，但當年的技術，我們是講300，1.2K，2.4K，後來發展到9.6K經已非常‘偉大’。

在速度的限制下，傳真的設計在減低數據量的問題上，可以說是無所不用其極，但說到尾，還是要靠壓縮技術才可以實現傳真的功能！傳真所用的壓縮方法基本上是Huffman Coding。其原理與我上次討論的文字壓縮類似。早期的傳真，很多時都是傳送手寫稿件，可以想像，這是在一張‘大’白紙上的‘一小撮’黑點。據經驗一般黑白面積比不會超過5%。亦即是說根本大部份都是白的。亦即重覆性很高，壓縮比亦高。

但若用傳真來傳照片，便會是個惡夢，一張手寫稿可能在一分鐘內傳完，但傳一張照片，可能十分鐘也未能完成！其分別便是照片不輕易找出重覆性！

等等，你可能會不同意照片缺乏重覆性！人面部都不是紅紅黃黃的嗎？是啊，但同一塊面是不是到處都一樣色呢？手繪的畫面可能會一樣色，但拍得好的照片必然會深淺光度都不一樣！但這實在也給了一個方向，我們有一個模糊印象，相片概應有重覆的資訊，但又說不出是如何重覆！

可能，使用一般性的壓縮方法並不能好好壓縮圖像，數學家另闢溪徑，第一個要打破的便是容許壓縮過程出現損失。

在文字壓縮的例子裏，不論怎樣壓縮都不會變動原文。這便叫做無損失壓縮（lossless compression）。但若我們容許在壓縮過程損失一些‘不重要’的資料，那麼便有可能壓縮到一些本來不可壓縮的資料，或提高壓縮比。這便稱為lossy compression。

對人來說，這個概念一點也不新鮮，我們根本就是用這種模式記憶的。現代人很少會一字不漏地背誦文章，看過文章後記得其主旨和大意便可以了！這便是有損失的壓縮。

但對電腦來說，它祗是貯存和按概定程序處理資料，根本就不認識這些資料的意義，要找出甚麼是‘不重要’的、‘可抛棄’的，實在是對數學家的一大挑戰！

未完，待續。

電腦,科學,政治,哲學

2008年8月10日星期日

圖像壓縮（一）

沒有留言:

網誌存檔

關於我自己