| 文章索引 |
|---|
| 基于XML的内容管理 |
| XML数据处理技术的应用 |
| 所有页面 |
Java技术的出现和发展促进了Web的迅速普及与壮大,同时,Web的迅猛扩张也反过来催生了与Java相关的其他技术。XML与生俱来的可扩展、跨平台、开放等特性无疑与Java相呼应,形成了完美搭档。在Web这样一个公共的、开放的资源平台与计算环境上,Java技术提供了丰富的实现机制;XML为信息的有效管理和数据集成提供了强大的功能,它提供了一种人和程序都能阅读的描述机制。Web为信息生产者提供了一种便捷、廉价的电子文档发布方式,因此它得以迅速发展,并成为实现全球信息传递与共享的日益重要和最具有潜力的资源平台。而XML的出现使得文本数据的表达有了可遵循的标准,它因此而被称为"Web上的ASCII码"。XML的广泛应用将Web环境下的信息处理技术带入了一个崭新的阶段。
XML与内容管理
在Web产生后的短短几年时间内,传统业务模式发生了重大的变革。这就对信息供应者提出了迫切的要求,他们应当充分利用这种信息交换平台保证其所提供信息的时效性、正确性和完整性。各种各样的商业化网站和信息服务系统能否为信息消费者及时而有效地提供他们所需要的最新信息成为衡量系统技术水准和决定其生存与发展的关键。
企业级内容管理系统可以被看成是一个企业信息架构的基础,其实现得越完善,为用户提供信息的价值就越高。内容管理系统的本质就是从内容角度将信息以具有一定粒度、可管理的"块"或组件的形式通过数据仓库进行存储和管理,系统可以实时对这些组件进行访问、更新和自由组合。基于Web的内容管理建立在广义数据库理解的基础上,它是指在Web环境下对复杂的内容信息进行有效的采集、组织与集成,实现方便而准确的信息查询与发布。一个基于Web应用环境且设计出色的内容管理系统具有开放的商业机遇,这些机遇依赖于对信息内容的复用和加工,使信息能够以多种不同的方式从内容的组织和数据的样式化形式等方面进行个性化处理,并可以利用数据挖掘技术发现蕴含在其中的知识和规则,从而为决策支持提供服务。从技术上讲,Web内容管理系统的研究融合了数据仓库技术、数据挖掘技术、WWW技术、信息检索技术、移动计算技术以及多媒体技术等,是一门综合性很强的新兴研究领域。
XML(eXtensible Markup Language)是针对包含结构化信息的文档而设计的一种标记语言。XML是元语言中的一种,所谓"元语言",就是能够帮助不同个人和组织定制自己的标记语言的语言,定制后的标记语言可以用于特定的应用领域中实现信息数据的交换。XML正在成为数据组织和交换的实施标准,并且大量的XML数据已经出现在Web上。同时,XML作为一种基础技术在知识管理、通讯管理和数据传送领域扮演着一种重要的角色。不同应用程序之间的数据交换对于开发分布式系统和提供电子商务和灵活性需求来说非常重要。XML可以将Internet转变为一个基于知识仓库的全球计算平台。最终的环境可以被看成是实现电子数据交换的强大基础架构。一旦采用XML表示文档中的元数据,则可以编写一个相关的XSL(eXtensible Stylesheet Language)文档用以定义元数据的显示方式。通过将在XSL中为不同对象定义的规则应用于XML数据上,可以实现根据不同用户的不同需求、不同关系或者不同的显示能力,实现不同的数据视图。
基于XML的内容管理系统的一个主要特点就是内容"块"仅仅由数据组成(例如文本、图形、表格等),而针对元数据定义的表示信息单独保存。在递送元数据信息的同时提供样式信息的处理方式意味着通过数据管理系统所管理的信息可以很方便地满足不同目标的需求。基于XML/XSL技术实现的内容管理系统可以在文档层实现数据模型层与表示层之间的分离。
面向多领域XML标准的制订
XML的诸多先进性令其在产生后迅速得到发展,备受开发者和最终数据消费者的青睐。XML中的"扩展"一词指的是定义新的标记及其用途的标准机制。由于这一切均是标准化的,所以我们拥有固定不变的途径来描述这些新标记并同其他XML用户交流。
利用XML技术,数据规范的定义者在充分全面地考虑数据定义完整性出发,定义完整的XML数据标准,以满足当前和未来应用的需求。而软件开发者则不必拘泥于固定的脚本语言、开发和设计工具以及数据传输方式,实现一种标准化的、分级别操作的应用环境,在这个环境中不同的工具类软件可以各显神通,从而最大限度地满足客户的需求。包括IBM、微软、Sun在内的诸多国际顶级IT企业、著名研究机构和国际标准化组织无不对XML技术青睐有加,大有得XML者得天下之势。他们纷纷积极参与到基于XML的数据标准规范的指定和相关软件研发等工作中,几乎每个专业XML标准的制订都有该领域在全球占据技术领导权的企业或权威机构参与。
XML数据标准通常是通过词汇表的形式存在的,XML"词汇表"是对XML数据的描述,是元素及其属性、以及你所指定的文档结构的规范。作为信息交换的媒介,它经常是与人类在某种领域的活动息息相关的。XML词汇表的高效性也正是XML应用成功的关键因素之一。目前,针对不同的应用领域的XML词汇表包括科学词汇表、商务词汇表、计算机领域的XML词汇表以及面向其他应用领域的词汇表。
面向内容和具体应用领域的诸多XML国际标准的制订,实现了软件开发人员一个曾经梦寐以求的目标:无论数据产生者位于何处,任何数据消费者都能够通过某种工具与他们交互,并且这种通信是基于数据的含义,而不是数据偶然的表现形式。