我所做的调查并不需要花大力气。XHTML 2 在 XHTML 的基础上添加更丰富的结构,使之成为一种可用于创建和存储内容的格式,而并不单单是能够把内容传递给浏览器。当我说 XHTML 2 已经有用时,我稍微夸张了一点;许多店铺针对这个尚未完成的标准都有一些非常明智的政策,而且 XHTML 2 还仍然处于工作草案(Working Draft)的阶段(有关更多信息,请参阅 参考资料)。与几乎所有的 HTML 相关标准都有所不同,XHTML 2 能够在知名的浏览器对它提供支持之前提供大量有价值的东西,原因在于,它更可能以更丰富和复杂的结构来存储内容,而不会过多地偏离为人所熟悉的 HTML 元素和属性。
XHTML 的现状:我们进展到哪了
W3C XHTML 1.0 标准(请参阅 参考资料)创建了一种 XML 版本的 HTML。当浏览器并不过分讲究 Web 页面是否为格式良好的 XML 时,Web 站点设计人员已经厌倦于针对 Firefox 使用一套方法而针对 Microsoft™ Internet Explorer 又使用另一套方法,他们在标准中看到了更多的价值。许多开源 CSS 集合(如 Open Web Design 和 Open Source Web Design,有关这两者的链接,请参阅 参考资料)的样式表使用 XHTML 1 示例文件用于演示目的,我曾听说一些几乎不知道格式良好 是什么的 Web 设计人员很骄傲地宣称他们的站点是 XHTML 构成的。随着 Internet Explorer 和 Firefox 支持的 CSS 特性越来越多,这些 Web 设计人员把更多设计技巧加入到 CSS 样式表中,把更简单更直接(以及更易于重复使用)的 XHTML 留在基本文档中。
XHTML 2 保留了 XHTML 1 中清除现有语法的功能使它更加简洁,同时还加入了一些新特性。它加入了对 XForms 的支持,XForms 是表单的更加完善的继承者,它在 HTML 中已应用了十年以上。XHTML 2 中还包括 XML 事件(XML Events),它可以让我们识别由某些用户接口操作所触发的事件,因而减少了使用 JavaScript 或者 ASP 编写脚本的需要。这些特性会是有趣的,尤其是当主要浏览器对它们提供支持以后,但是其他的特性即使在浏览器支持 XHTML 之前对发布人而言也会更加有趣:
一个更丰富、可重用性更好的结构
设备独立性更好、更易访问、语义更完善
更易于添加元数据
更丰富的结构
许多需要在 XML 中存储内容的发布者都知道使用现有的标准模式(我指的是 W3C Schema、RELAX NG 模式或者 DTD)要比自己从头创建一个更好。他们看了 DocBook 后发现太复杂了,他们看了 HTML 或 XHTML 1 之后又发现太简单了。对于许多发布者来说,XHTML 2 很好地平衡了 DocBook 的丰富性和 XHTML 1 的简单性,这种平衡使之成为存储内容的一种极佳的格式,不论内容是否需要被转换成其他的格式以供在各种媒体中传递。
清单 1 包含了一个示例 XHTML 1 文件,并以缩进格式表示了该文件的结构。
清单 1. XHTML 1 文件的结构
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>My Web page</title>
</head>
<body>
<h1>My Web Page</h1>
<p>Here is my Web page.</p>
<h2>Section 1 of my Web page</h2>
<p>Here is section 1 my Web page.</p>
<h3>Section 1.1 of my Web page</h3>
<p>Here is a subsection of my Web page.</p>
<h2>Section 2 of my Web page</h2>
<p>Here is section 2 of my Web page.</p>
</body>
</html>
我们可以看到 body 元素内部并没有太多的缩进格式,这是因为该元素中没有多少结构。这个文档的树形表示会显示出一个带有许多子元素而没有孙子元素的 body 元素,段落 “Here is a subsection of my Web page” 将作为主 h1 标题 “My Web Page” 的兄弟元素显示出来。标记中只有一个地方指示出这个段落是一个子段的一部分:它前面最近的题头,h3,比前一个题头的数字大。容器元素不会把任何作为标题的题头与其内容组合在一起,除非让 body 元素把 h1 header 题头与 Web 页面其余可显示的内容封装在一起。我们可以使用一个 div 元素把每个题头/内容(header/content)组合封装在一起,不过 div 元素与 span 元素一样是一种相当通用的分组元素。它可以用于许多目的,比如说指示一些特定的段落形成一个菜单或者一个侧栏或者 Web 页面中的另一个可视表示元素,因此我们不能假定其表示指示内容的一个结构单元。
XHTML 2 中的新增的 section 和 h 元素结合在一起能使我们创建一个更丰富的结构,从而使内容更易于重用。清单 2 演示了与 清单 1 中的 body 元素等价的 XHTML 2 body 元素。作者: webptr 时间: 2007-9-11 12:50
清单 2. XHTML 2 body 元素
<body>
<section>
<h>My Web Page</h>
<p>Here is my Web page.</p>
<section>
<h>Section 1 of my Web page</h>
<p>Here is section 1 my Web page.</p>
<section>
<h>Section 1.1 of my Web page</h>
<p>Here is a subsection of my Web page.</p>
</section>
</section>
<section>
<h>Section 2 of my Web page</h>
<p>Here is section 2 of my Web page.</p>
</section>
</section>
</body>
在这一版本的代码中,“Here is a subsection” 段落是第一个 section 元素的曾孙元素,这个 section 元素中的 “My Web Page” h 元素显示了其主标题 — 正应该如此!
如果我想要在示例代码之后继续该语句,XHTML 1 会强制我把语句分成两部分放在两个不同的 p 元素中,不过从语义上说它们位于同一个语句中。XHTML 2 让我们把示例代码、无序列表和编号列表和许多其他块元素放置在一个 p 元素中,让我们的标记能更准确地反映出文档的结构。
从表示标记到结构型标记还要一小步,把 hr 元素重命名为 separator。HTML 工作小组(HTML Working Group)发现其原始名称(代表 horizontal rule)经常落入结构型标记和表示标记之间的灰色区域。他们收到了一些使用亚洲国家语言的用户发出的 vertical rule 请求,他们看到许多水平分离器并不是真正的规则(HTML 工作小组的主席 Steven Pemberton 作了一个陈述,其中指出了 James Joyce 的 Ulysses 中的几个不同的变种;请参阅 参考资料 以获得到该陈述的链接)。这使得他们把 hr 元素重命名为能更准确地返回其使用的名称并在陈述中允许了更强的灵活性。
设备独立性更好、更易访问、语义更完善
这三个目标实际上有相互重叠的地方。对于不用在一个平台上传递的 Web 页面和视力减弱的用户能方便地理解的 Web 页面来说,文本语音翻译器读出 Web 页面中的内容仍然具有意义。XHTML 2 工作草案(XHTML 2 Working Draft)中提到:
各种新设备出现在网络上,如电话、PDA、写字板、电视等等,这意味着需要有一种设计,允许我们创作一次然后在不同的设备上以不同的方式呈现,而不是为每种类型的设备都创作一种新版本的文档。
发布者不需要从未来考虑其价值。设备独立使它们中的很多在 XML 发明之前应用于 SGML,因为它让这些设备以打印的方式,在 Web 页面上以及在 CD-ROM 上发布相同的内容,只要该内容的编辑版本中存储有足够的结构和语义信息,从而使自动例程把它转换成各自的格式。我记得十一年之前当我们的竞争者要把内容的编辑版本存储为 HTML 时,我的前老板的办公室中充斥着窃笑声;使用 XHTML 2 就不再是一个疯狂的想法了。
如果 XHTML 2 元素中已有的语义对你来说还不够的话,新加入的 role 属性(可以被加入到任何元素中)可以告诉你元素更多的用途。XHTML 2 规范为这个属性指定了九个可能的值:banner、note、contentinfo、search、definition、secondary、 main、seealso 和 navigation。角色值,如 banner 和 navigation,显然更加面向表示,但是对于 definition 和 note 之类的值,其中的语义在为多媒体准备内容的发布环境中更具实用性。您甚至还可以构造自己的 role 值,只要它们处于自己的名称空间就即可。