多媒體技術/圖像的數字化

基本概念 編輯

現實空間中,以照片或視頻等形式記錄的圖像在亮度和顏色等信號上都是連續的,屬於模擬信號,這樣的圖像有時也稱為模擬圖像。而計算機是無法接收和直接處理這些連續的模擬信號的,因此要對這些圖像進行數字化,要將這些圖像轉化為用一系列數據表示的數字圖像。這一轉換過程就稱為圖像的數字化。
所謂數字化圖像,就是將圖像上每個點的信息按某種規律(模擬/數字轉換)轉換成一系列二進制數的編碼,即用二進制編碼來表示圖像信息。計算機可以對這種用編碼表示的圖像信息進行存儲、傳輸和分析處理。
圖像數字化的目的是把真實的圖像轉換為計算機能接受的格式,並且在輸出的時候,儘可能真實地還原出圖像原有的面目。

數字化過程 編輯

圖像在進行數字化的過程中,一般需要經過採樣、量化和編碼這三個步驟。

採樣 編輯

計算機在處理圖像模擬量時,首先就是要通過外部設備如數碼相機、掃描儀等來獲取圖像信息,即對圖像進行採樣。所謂採樣就是計算機按照一定的規律,對一幅原始圖像的圖像函數f(x,y)沿x方向以等間隔Δx採樣,得到N個採集點,沿y方向以等間隔Δy採樣,得到M個採集點,這樣就從一幅原始圖像中採集到M×N個樣本點,構成了一個離散樣本陣列。這個過程就是採樣的過程。
這個過程中主要的參數就是採樣頻率。所謂採樣頻率,指一秒鐘內採樣的次數,它反映了採樣點之間的間隔大小。丟失的信息越少,採樣頻率越高,圖像的質量越高,當然,圖像的數據存儲量也越大。

量化 編輯

採樣是對圖像進行離散化處理。下一步就是要對採集到的這些樣本點進行數字化處理,實際上是對樣本點的顏色或灰度進行等級劃分,然後用多位二進制數表示出來,即對模擬圖像的像素點所呈現出的特性,用二進制數據的方式記錄下來。
這個等級的劃分稱為樣本的量化等級。量化等級是圖像數字化過程中非常重要的一個參數。它描述的是每幅圖像樣本量化後,每個樣本點可以用多少位二進制數表示,反映圖像採樣的質量。

編碼 編輯

在以上兩項工作完成後,就需要對每個樣本點按照它所屬的級別,進行二進制編碼,形成數字信息,這個過程就是編碼。如果圖像的量化等級是256級,那麼每個樣本點都會分別屬於這256級中的某一級,然後將這個點的等級值編碼成一個8位的二進制數即可。
數字化後得到的圖像數據量十分巨大,必須採用編碼技術來壓縮數據量。

常見的圖像文件格式 編輯

圖像在存儲時由兩部分組成:圖像的說明部分和圖像的數據部分。圖像的說明部分說明圖像的格式、深度、高度、寬度和壓縮方法等內容。這些內容一般存放在文件的頭部,有時也會有部分內容存放在文件的尾部。圖像的數據部分描述圖像中每個像素的值和彩色變換表等。下面介紹幾種圖像的存儲格式。

BMP格式 編輯

BMP(Bitmap)格式是獨立於圖像設備的一種文件格式。它是Windows系統所採用的圖形文件格式,基本上所有的圖像處理軟件都支持這種格式。它採用位映射的方式存儲像素數據,而且除了圖像深度可以選擇外,不採用任何壓縮方式。存儲數據時,圖像的掃描方式按從左到右、從上到下的順序來進行。典型的BMP圖像文件由四部分組成:位圖文件頭數據結構,它包含BMP圖像文件的類型、顯示內容等信息;位圖信息數據結構,它包含BMP圖像的寬、高、壓縮方法;彩色表;定義位圖的字節陣列。

JPEG格式 編輯

JPEG(Joint Picture Expert Group)格式是目前靜態圖像中使用最為廣泛的一種圖像存儲格式。由於JPEG格式的圖像文件壓縮比高,圖像清晰,文件的大小比BMP格式小得多,而且基本上得到了所有圖像處理軟件的支持,因此使用得比較廣泛。它使用的壓縮算法一般就稱為JPEG壓縮算法,是一種以離散餘弦變換(Discrete Cosine Transform,DCT)為基礎的有損壓縮算法。在壓縮比為25∶1的情況下,壓縮後還原得到的圖像與原始圖像相比較,非圖像專家很難找到它們之間的區別。近年來,專家們正在制定JPEG 2000標準。

GIF格式 編輯

圖形交換格式(Graphic Interchange Format,GIF)是CompuServe公司開發的圖像文件存儲格式,它以數據塊為單位存儲圖像的相關信息。一個GIF文件由表示圖形/圖像的數據塊、數據子塊以及顯示圖形/圖像的控制信息塊組成,稱為GIF數據流。它採用LZW壓縮算法來存儲圖像數據。GIF格式有一個重要的特徵就是在一個文件中可以分層存儲多幅彩色圖形/圖像,從而在打開文件的時候可以形成動畫效果。

PNG格式 編輯

可移植性網絡圖像(Portable Network Graphics,PNG)格式是一種位圖文件存儲格式。用它來存儲灰度圖像時,圖像的深度可達16位,存儲彩色圖像時,深度可達48位,並且還可以存儲16位的α通道數據。它使用的是由LZ77派生的無損數據壓縮算法。目前有取代GIF和TIFF格式的趨勢。

TIFF格式 編輯

TIFF(Tagged Image File Format)是Macintosh和PC機上使用最廣泛的位圖交換格式,在這兩種硬件平台上移植TIFF圖形、圖像十分便捷。這種格式可支持跨平台的應用軟件,大多數掃描儀也都可以輸出TIFF格式的圖像文件。該格式支持的色彩數最高可達16M種,採用的LZW壓縮方法是一種無損壓縮算法,支持α通道。

TGA格式 編輯

TGA(Tagged Graphics)是True Vision公司為其顯卡開發的一種圖像文件格式,創建時間較早,最高色彩數可達32bit,其中包括8bit的α通道用於顯示實況電視。TGA的結構比較簡單,屬於一種圖形、圖像數據的通用格式,在多媒體領域有很大影響,是計算機生成圖像向電視轉換的一種首選格式。TGA圖像格式最大的特點是可以做出不規則形狀的圖形、圖像文件。該格式已經被廣泛應用於PC的各個領域,在動畫製作、影視合成、模擬顯示等方面發揮着重要的作用。

PSD格式 編輯

PSD格式是Adobe公司的圖像處理軟件Photoshop的專用格式,它支持Photoshop提供的所有圖像模式,包括多通道、多圖層和多種色彩模式。實際上,它是Photoshop進行平面設計的一張「草稿圖」,裡面包含各種圖層、通道、遮罩等多種設計的樣稿,以便於下次打開文件時可以修改上一次的設計。在Photoshop所支持的各種圖像格式中,PSD的存取速度比其他格式快很多,功能也很強大。

UFO格式 編輯

UFO格式是Ulead公司的圖像處理軟件PhotoImpact的專用圖形格式,該格式圖像文件與Adobe公司的PSD格式類似,能夠完整記錄所有經過PhotoImpact處理過的屬性。不過在記錄原理上則有些不同,UFO格式以物件來代替圖層。

RIF格式 編輯

RIF格式是作圖軟件Painter的專用圖形格式,處理方式和前面介紹的軟件大同小異,都可以儲存相當多的屬性資料。Painter可以打開PSD文件,而且經過Painter處理過的PSD文件在Photoshop中通用。這樣可以利用同一文件在Photoshop和Painter中交換使用。

CDR格式 編輯

CDR格式是繪圖軟件CorelDraw的專用圖形文件格式。由於CorelDraw是矢量圖形繪製軟件,所以CDR可以記錄文件的屬性、位置和分頁等。然而它在兼容度上比較差,因為其他圖像編輯軟件打不開此類文件。

EPS格式 編輯

EPS是Encapsulated PostScript的縮寫,是跨平台的標準格式,主要用於矢量圖像和光柵圖像的存儲。EPS格式採用PostScript語言進行描述,並且可以保存其他一些類型信息,例如多色調曲線、Alpha通道、分色、剪輯路徑、掛網信息和色調曲線等,因此EPS格式常用於印刷或打印輸出。向量圖可以轉成EPS格式,點陣圖也可以轉成EPS格式。Photoshop中的多個EPS格式選項可以實現印刷打印的綜合控制,在某些情況下甚至優於TIFF格式。

SWF格式 編輯

SWF(Shock Wave Flash)格式是Macromedia公司軟件Flash生成的一種動畫文件格式。這是一種網絡矢量圖形標準,壓縮率高,但需要Flash軟件或插件才能播放。

WMF格式 編輯

WMF(Windows Metafile)格式是Microsoft Windows中常見的一種圖元文件格式,用於Windows下的存儲和交換,VB、MS Office、PageMaker、CorelDraw等軟件都支持這種格式。WMF格式與設備無關,屬於顯示列表,可以很好地組織結構,可以比相應的位圖小很多。它具有文件短小、圖案造型化等特點,整個圖形常由各個獨立的組成部分拼接而成,但圖形往往較粗糙。Microsoft Office的剪貼畫使用的就是這個格式。

DXF格式 編輯

繪圖互換格式(Drawing Exchange Format)是AutoCAD中的圖形文件格式,它以ASCII方式儲存圖形,在表現圖形的大小方面十分精確,用於計算機輔助設計繪圖數據的交換,可被CorelDraw和3DS等大型軟件調用編輯。