| 文章首页 |
|---|
| 了解XML:XML简单介绍 |
| XML的独特之处 |
| XML的应用与开发工具 |
来源:supinfo-projects.com
HTML在复杂的WEB应用中可能遇到问题,要彻底解决必须用XML来替代HTML。因XML有利于信息的表达和结构化组织,从而使数据搜索更有效。本文介绍XML诞生、HTML与XML的比较、XML的构成以及XML开发工具等。
网络以前所未有的速度发展,成为与报纸、广播、电视相比肩的第四媒体。它需要更完整的语言表达网络内容的内涵。人们越来越发现HTML这种语言已经远远不能满足网络潜在应用能力的需要。"可扩展性标识语言"XML的出现把网络表达语言集合推进了一大步。下面我们就来详细了解一下这一全新的标识语言……
1 何谓标识
SGML、HTML、XML都是标识语言:
- SGML(Standard Generalized Markup Language)标准通用标记语言
- HTML (Hypertext Markup Language)超文本标记语言;
- XML (Extensible Markup Language)可扩展标记语言;
最早,标识是文件在排版的时候,用来指示文字如何编排的指令。标识并不处理文件的内容,主要用来处理文件世界的呈现外观,这类的标识称为程序性标识(Procedural Markup)。一般而言,程序性标识的作用都只针对单一文件。
另一类标识称为描述性标识(Descriptive Markup),也称为通用标识。所描述的是文件的内容(content)或结构(structure),而不是文件的呈现外观。描述文件结构的凡是以标识指定结构中的元素(elements)XML、SGML都是典型的通用标识语言,HTML就比较特殊了,HTML的标签集(tag set)中的大部分都是用来设定文件在WEB上的呈现外观,少部分描述文件的结构。(如:head, title, body)
由于 HTML是SGML的一种应用,所以HTML并非程序性标识语言,而是以描述性标识的方式来控制文件的呈现外观。HTML的样式是内建的,并不像XML、SGML有分离的样式,所以HTML标识的作用与程序性标识类似,是针对单一文件,并不像XML、SGML有较高的再利用弹性。
2 HTML
2.1 HTML
HTML (超文本链接标示语言)是我们的数据类型"比尔-盖茨(1996.2)"这句话预示了互联网无可限量的发展前景。
无论是公司、政府机构、还是个人,网络和它最初用以表达信息的方法HTML都获得了圆满的成功,HTML以简单易学、灵活通用的特性,使人们发布、检索、交流信息都变得非常简单,从而使Web成了最大的环球信息资源库。
这样看来HTML可以解决绝大部分问题了,但是,一些独具慧眼的人却已经认识到有必要重新发展一种新的语言,即XML。
2.2 HTML的缺点
"HTML只说明数据看起来应该是什么样,而XML则说明数据是什么意思。"
首先,HTML存在很大的局限性, 由于标准的标记已经由W3C预先确定,所以当描述复杂文档时HTML就显得力不从心。
HTML是面向描述的,而非面向对象的,因此,HTML标记不会给出内容的含义。举一个最简单的例子。<h2>Apple</h2>这句话在网络浏览器中有特定的表现。但是HTML却并没有告诉我们它到底是什么。就像Apple只是一个英文单词罢了,它在不同的环境之下可能会有不同的意义,或许是一个计算机公司,一个水果,还是一个姓氏,HTML并没有告诉我们Apple具体的内容。
其次,HTML的另一个问题就是它的标记的集合是固定的,用户不能增加自己的有意义的标记。而且各大浏览器的规格不尽相同,要使我们用HTML做的网页能够被所有浏览器正常显示,我们只能够使用W3C给我们定义好了的标记来创建网页。
另外,使用当前的HTML,开发者必须要对文档进行许多的调整才能兼容流行的浏览器。由于浏览器不会去检查错误的HTML代码,因此导致 Internet上大量的文档包含了错误的HTML语法。这个问题越来越严重,W3C开始寻找解决办法。会是什么呢?这就是XML!
3 XML的诞生
XML,extensible markup language (可扩展标识语言),是当代最热门的网络技术之一,被称为"第二代web语言"、"下一代网络应用的基石"。自从它被提出来,几乎得到了业界所有大公司的支持,丝毫不逊于当年HTML被提出来的热度。
XML是1986年国际标准组织(ISO)公布的一个名为"标准通用标识语言"(standard general ized markup language,sgml)的子集。它是由成立于1994年10月的W3C(world wide web consoutium)所开发研制的。1998年2月,W3C正式公布了XML的recommendation 1.0版语法标准。XML掌握了SGML的扩展性,文件自我描述特性,以及强大的文件结构化功能,但却摒除了SGML过于庞大复杂以及不易普及化的缺点。XML和SGML一样,是一种"元语言" (meta-language)。换言之,XML是一样用来定义其他语言的语法系统。这正是XML功能强大的主要原因。
4 HTML与XML的比较
与HTML相比,XML具有以下几点技术优势:
| 比较内容 | HTML | XML |
| 可扩展性EXTENSION | 不具有扩展性 | 是元标识语言,可用于定义新的标识语言 |
| 侧重点 | 侧重于如何表现信息 | 侧重于如何结构化地描述信息 |
| 语法要求 | 不要求标记的嵌套,配对等,不要求标识之间具有一定的顺序 | 严格要求嵌套,配对,并遵循DTD的树形结构 |
| 可读性及可维护性 | 难于阅读,维护 | 结构清晰,便于阅读,维护 |
| 数据和显示的关系 | 内容描述与显示方式整合为一体 | 内容描述与显示方式相分离 |
| 保值性 | 不具有保值性 | 具有保值性 |
| 编辑及浏览工具 | 已有大量的编辑,浏览工具 | 编辑,浏览工具尚不成熟 |
- XML同HTML都来自SGML。
- HTML是一种固定格式的超文本标识语言,因格式固定、标识有限,故难以扩展。而XML保留了SGML的可扩展功能,可以定义其他语言,同时XML的标识,用户可以自己定义。
- XML提供了一个直接"处理"web数据的通用方法,而HTML只是web"显示"数据的通用方法。
- XML着重描述的是web页面的"内容",而HTML着重页面"显示格式。"
- XML使机器能交谈(能自动处理信息),HTML方便了人与人的交流(只是网络初级阶段)
- XML具有良好的交互性,它可以在客户机上进行数据操作,不需与服务器交互,极大地减轻了服务器的负担。
- HTML不支持深层的结构描述,而XML的文件结构嵌套可以复杂到任何程度。
5 XML的构成
XML主要有3个组成元素:Schema(模式)、XSL(可扩展样式语言)和XLL(可扩展链接语言)。
Schema规定了XML文件的逻辑结构,定义了XML文件中的元素、元素的属性以及元素和元素属性之间的联系,它可以帮助XML的分析程序校验XML 文件标记的合法性;XSL是用于规定XML文档样式的语言,它能在客户端使Web浏览器改变文档的表示法,从而不需要再与服务器进行交互通信;XLL将进一步扩展目前Web上已有的简单链接。
由于XML具有许多HTML所不可比拟的优点,许多公司和组织都提供了对XML的支持。如 W3C开发的PICS(Platform For Internet Content Selection,Internet内容挑选平台)和RDF(Resource Description Framework,资源描述框架)、Microsoft的CDF(Channel Definition Format,频道定义格式)、Netscape的MCF(Microsoft Connector Framework,元内容框架)等。
6 显示
单独实用XML不能显示页面,因为XML是将数据和格式分离的, XML本身不知道如何来显示,必须有辅助文件来帮助实现。比如CSS或者XSL。(XML取消了所有标识,包括font, color, p等风格样式定义标识,因此XML全部是采用类似DHTML中CSS的方法来定义文档风格样式), XML中用来设定显示风格样式的文件类型有:
6.1 XSL
XSL是将来设计XML文档显示样式的主要文件类型。它本身也是基于XML语言的。使用XSL,可以灵活的设置文档显示样式,文档将自动适应任何浏览器和PDA(掌上电脑)。
6.2 CSS
CSS,全称是Cascading Style Sheets, 层叠样式表,是目前用来在浏览器上显示XML文档的主要方法。
6.3 Behaviors
Behaviors现在还没有称为标准,它是微软的IE浏览器特有的功能,用它可以对XML标识设定一些有趣的动作。
如果你喜欢这篇文章,请阅读本文相关的下列内容:

