多媒体技术/图像的数字化

基本概念 编辑

现实空间中,以照片或视频等形式记录的图像在亮度和颜色等信号上都是连续的,属于模拟信号,这样的图像有时也称为模拟图像。而计算机是无法接收和直接处理这些连续的模拟信号的,因此要对这些图像进行数字化,要将这些图像转化为用一系列数据表示的数字图像。这一转换过程就称为图像的数字化。
所谓数字化图像,就是将图像上每个点的信息按某种规律(模拟/数字转换)转换成一系列二进制数的编码,即用二进制编码来表示图像信息。计算机可以对这种用编码表示的图像信息进行存储、传输和分析处理。
图像数字化的目的是把真实的图像转换为计算机能接受的格式,并且在输出的时候,尽可能真实地还原出图像原有的面目。

数字化过程 编辑

图像在进行数字化的过程中,一般需要经过采样、量化和编码这三个步骤。

采样 编辑

计算机在处理图像模拟量时,首先就是要通过外部设备如数码相机、扫描仪等来获取图像信息,即对图像进行采样。所谓采样就是计算机按照一定的规律,对一幅原始图像的图像函数f(x,y)沿x方向以等间隔Δx采样,得到N个采集点,沿y方向以等间隔Δy采样,得到M个采集点,这样就从一幅原始图像中采集到M×N个样本点,构成了一个离散样本阵列。这个过程就是采样的过程。
这个过程中主要的参数就是采样频率。所谓采样频率,指一秒钟内采样的次数,它反映了采样点之间的间隔大小。丢失的信息越少,采样频率越高,图像的质量越高,当然,图像的数据存储量也越大。

量化 编辑

采样是对图像进行离散化处理。下一步就是要对采集到的这些样本点进行数字化处理,实际上是对样本点的颜色或灰度进行等级划分,然后用多位二进制数表示出来,即对模拟图像的像素点所呈现出的特性,用二进制数据的方式记录下来。
这个等级的划分称为样本的量化等级。量化等级是图像数字化过程中非常重要的一个参数。它描述的是每幅图像样本量化后,每个样本点可以用多少位二进制数表示,反映图像采样的质量。

编码 编辑

在以上两项工作完成后,就需要对每个样本点按照它所属的级别,进行二进制编码,形成数字信息,这个过程就是编码。如果图像的量化等级是256级,那么每个样本点都会分别属于这256级中的某一级,然后将这个点的等级值编码成一个8位的二进制数即可。
数字化后得到的图像数据量十分巨大,必须采用编码技术来压缩数据量。

常见的图像文件格式 编辑

图像在存储时由两部分组成:图像的说明部分和图像的数据部分。图像的说明部分说明图像的格式、深度、高度、宽度和压缩方法等内容。这些内容一般存放在文件的头部,有时也会有部分内容存放在文件的尾部。图像的数据部分描述图像中每个像素的值和彩色变换表等。下面介绍几种图像的存储格式。

BMP格式 编辑

BMP(Bitmap)格式是独立于图像设备的一种文件格式。它是Windows系统所采用的图形文件格式,基本上所有的图像处理软件都支持这种格式。它采用位映射的方式存储像素数据,而且除了图像深度可以选择外,不采用任何压缩方式。存储数据时,图像的扫描方式按从左到右、从上到下的顺序来进行。典型的BMP图像文件由四部分组成:位图文件头数据结构,它包含BMP图像文件的类型、显示内容等信息;位图信息数据结构,它包含BMP图像的宽、高、压缩方法;彩色表;定义位图的字节阵列。

JPEG格式 编辑

JPEG(Joint Picture Expert Group)格式是目前静态图像中使用最为广泛的一种图像存储格式。由于JPEG格式的图像文件压缩比高,图像清晰,文件的大小比BMP格式小得多,而且基本上得到了所有图像处理软件的支持,因此使用得比较广泛。它使用的压缩算法一般就称为JPEG压缩算法,是一种以离散余弦变换(Discrete Cosine Transform,DCT)为基础的有损压缩算法。在压缩比为25∶1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家很难找到它们之间的区别。近年来,专家们正在制定JPEG 2000标准。

GIF格式 编辑

图形交换格式(Graphic Interchange Format,GIF)是CompuServe公司开发的图像文件存储格式,它以数据块为单位存储图像的相关信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流。它采用LZW压缩算法来存储图像数据。GIF格式有一个重要的特征就是在一个文件中可以分层存储多幅彩色图形/图像,从而在打开文件的时候可以形成动画效果。

PNG格式 编辑

可移植性网络图像(Portable Network Graphics,PNG)格式是一种位图文件存储格式。用它来存储灰度图像时,图像的深度可达16位,存储彩色图像时,深度可达48位,并且还可以存储16位的α通道数据。它使用的是由LZ77派生的无损数据压缩算法。目前有取代GIF和TIFF格式的趋势。

TIFF格式 编辑

TIFF(Tagged Image File Format)是Macintosh和PC机上使用最广泛的位图交换格式,在这两种硬件平台上移植TIFF图形、图像十分便捷。这种格式可支持跨平台的应用软件,大多数扫描仪也都可以输出TIFF格式的图像文件。该格式支持的色彩数最高可达16M种,采用的LZW压缩方法是一种无损压缩算法,支持α通道。

TGA格式 编辑

TGA(Tagged Graphics)是True Vision公司为其显卡开发的一种图像文件格式,创建时间较早,最高色彩数可达32bit,其中包括8bit的α通道用于显示实况电视。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有很大影响,是计算机生成图像向电视转换的一种首选格式。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件。该格式已经被广泛应用于PC的各个领域,在动画制作、影视合成、模拟显示等方面发挥着重要的作用。

PSD格式 编辑

PSD格式是Adobe公司的图像处理软件Photoshop的专用格式,它支持Photoshop提供的所有图像模式,包括多通道、多图层和多种色彩模式。实际上,它是Photoshop进行平面设计的一张“草稿图”,里面包含各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其他格式快很多,功能也很强大。

UFO格式 编辑

UFO格式是Ulead公司的图像处理软件PhotoImpact的专用图形格式,该格式图像文件与Adobe公司的PSD格式类似,能够完整记录所有经过PhotoImpact处理过的属性。不过在记录原理上则有些不同,UFO格式以物件来代替图层。

RIF格式 编辑

RIF格式是作图软件Painter的专用图形格式,处理方式和前面介绍的软件大同小异,都可以储存相当多的属性资料。Painter可以打开PSD文件,而且经过Painter处理过的PSD文件在Photoshop中通用。这样可以利用同一文件在Photoshop和Painter中交换使用。

CDR格式 编辑

CDR格式是绘图软件CorelDraw的专用图形文件格式。由于CorelDraw是矢量图形绘制软件,所以CDR可以记录文件的属性、位置和分页等。然而它在兼容度上比较差,因为其他图像编辑软件打不开此类文件。

EPS格式 编辑

EPS是Encapsulated PostScript的缩写,是跨平台的标准格式,主要用于矢量图像和光栅图像的存储。EPS格式采用PostScript语言进行描述,并且可以保存其他一些类型信息,例如多色调曲线、Alpha通道、分色、剪辑路径、挂网信息和色调曲线等,因此EPS格式常用于印刷或打印输出。向量图可以转成EPS格式,点阵图也可以转成EPS格式。Photoshop中的多个EPS格式选项可以实现印刷打印的综合控制,在某些情况下甚至优于TIFF格式。

SWF格式 编辑

SWF(Shock Wave Flash)格式是Macromedia公司软件Flash生成的一种动画文件格式。这是一种网络矢量图形标准,压缩率高,但需要Flash软件或插件才能播放。

WMF格式 编辑

WMF(Windows Metafile)格式是Microsoft Windows中常见的一种图元文件格式,用于Windows下的存储和交换,VB、MS Office、PageMaker、CorelDraw等软件都支持这种格式。WMF格式与设备无关,属于显示列表,可以很好地组织结构,可以比相应的位图小很多。它具有文件短小、图案造型化等特点,整个图形常由各个独立的组成部分拼接而成,但图形往往较粗糙。Microsoft Office的剪贴画使用的就是这个格式。

DXF格式 编辑

绘图互换格式(Drawing Exchange Format)是AutoCAD中的图形文件格式,它以ASCII方式储存图形,在表现图形的大小方面十分精确,用于计算机辅助设计绘图数据的交换,可被CorelDraw和3DS等大型软件调用编辑。