一、
首先,我们要了解浏览器是如何处理内容的。在浏览器中显示的内容有 HTML
、有 XML
、有 GIF
、还有 Flash
……那么,浏览器是如何区分它们,决定什么内容用什么形式来显示呢?答案是 MIME Type
,也就是该资源的媒体类型。
媒体类型通常是通过HTTP
协议,由Web
服务器告知浏览器的,更准确地说,是通过 Content-Type
来表示的,例如:
Content-Type: text/HTML
表示内容是 text/HTML
类型,也就是超文本文件。为什么是text/HTML
而不是HTML/text
或者别的什么?MIME Type
不是个人指定的,是经过 ietf
组织协商,以 RFC
的形式作为建议的标准发布在网上的,大多数的Web
服务器和用户代理都会支持这个规范 (顺便说一句,Email
附件的类型也是通过 MIME Type
指定的)。
通常只有一些在互联网上获得广泛应用的格式才会获得一个MIME Type
,如果是某个客户端自己定义的格式,一般只能以 application/x-
开头。
XHTML
正是一个获得广泛应用的格式,因此,在 RFC 3236
中,说明了 XHTML
格式文件的 MIME Type
应该是 application/xHTML+XML
。
当然,处理本地的文件,在没有人告诉浏览器某个文件的 MIME Type
的情况下,浏览器也会做一些默认的处理,这可能和你在操作系统中给文件配置的 MIME Type
有关。比如在 Windows
下,打开注册表的HKEY_LOCAL_MACHINESOFTWAREClassesMIMEDatabaseContent Type
主键,你可以看到所有 MIME Type
的配置信息。
二、
在把输出结果传送到浏览器上的时候,浏览器必须启动适当的应用程序来处理这个输出文档。这可以通过多种类型MIME(多功能网际邮件扩充协议)来完成。在HTTP
中,MIME
类型被定义在Content-Type header
中。
例如,架设你要传送一个Microsoft Excel
文件到客户端。那么这时的MIME类型就是application/vnd.ms-excel
。在大多数实际情况中,这个文件然后将传送给Execl来处理(假设我们设定Execl为处理特殊MIME类型的应用程序)。在ASP
中,设定MIME类型的方法是通过Response
对象的ContentType
属性。
多媒体文件格式MIME
最早的HTTP
协议中,并没有附加的数据类型信息,所有传送的数据都被客户程序解释为超文本标记语言HTML
文档,而为了支持多媒体数据类型,HTTP
协议中就使用了附加在文档之前的MIME
数据类型信息来标识数据类型。
MIME
意为多目Internet
邮件扩展,它设计的最初目的是为了在发送电子邮件时附加多媒体数据,让邮件客户程序能根据其类型进行处理。然而当它被HTTP
协议支持之后,它的意义就更为显著了。它使得HTTP
传输的不仅是普通的文本,而变得丰富多彩。
每个MIME
类型由两部分组成,前面是数据的大类别,例如声音audio
、图象image
等,后面定义具体的种类。
常见的MIME
类型
超文本标记语言文本
.html
,.html
text/html
普通文本.txt
text/plain
RTF
文本.rtf
application/rtf
GIF
图形.gif
image/gif
JPEG
图形.ipeg
、.jpg
image/jpeg
au
声音文件.au
audio/basic
MIDI
音乐文件mid
、.midi
audio/midi
,audio/x-midi
RealAudio
音乐文件.ra
,.ram
audio/x-pn-realaudio
MPEG
文件.mpg
,.mpeg
video/mpeg
AVI
文件.avi
video/x-msvideo
GZIP
文件.gz
application/x-gzip
TAR
文件.tar
application/x-tar
Internet
中有一个专门组织IANA
来确认标准的MIME
类型,但Internet
发展的太快,很多应用程序等不及IANA
来确认他们使用的MIME类型为标准类型。因此他们使用在类别中以x-
开头的方法标识这个类别还没有成为标准,例如:x-gzip
,x-tar
等。事实上这些类型运用的很广泛,已经成为了事实标准。只要客户机和服务器共同承认这个MIME类型,即使它是不标准的类型也没有关系,客户程序就能根据MIME类型,采用具体的处理手段来处理数据。而Web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的MIME类型,只有对于不常见的 MIME类型,才需要同时设置服务器和客户浏览器,以进行识别。
由于MIME
类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的MIME
类型,服务器中必须定义文档后缀和MIME
类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用附加信息来告诉客户程序数据的MIME类型。服务器在发送真正的数据之前,就要先发送标志数据的MIME
类型的信息,这个信息使用Content-type
关键字进行定义,例如对于HTML文档,服务器将首先发送以下两行MIME标识信息,这个标识并不是真正的数据文件的一部分。
Content-type: text/html
注意,第二行为一个空行,这是必须的,使用这个空行的目的是将MIME
信息与真正的数据内容分隔开。
MIME
(Multipurpose Internet Mail Extensions
) 是描述消息内容类型的因特网标准。
MIME
消息能包含文本、图像、音频、视频以及其他应用程序专用的数据。
官方的 MIME
信息是由 Internet Engineering Task Force (IETF)
在下面的文档中提供的:
RFC-822 Standard for ARPA Internet text messages
RFC-2045 MIME Part 1: Format of Internet Message Bodies
RFC-2046 MIME Part 2: Media Types
RFC-2047 MIME Part 3: Header Extensions for Non-ASCII Text
RFC-2048 MIME Part 4: Registration Procedures
RFC-2049 MIME Part 5: Conformance Criteria and Examples
不同的应用程序支持不同的 MIME
类型。