HTML DOM与XML DOM的区别与联系探究(1)(2)
理解DOM Level1 HTML
我们日常工作的时候,跟HTML文档打交道,其实就是属于W3C所规定的DOM Level1HTML模块内的处理工作。HTMLDOM的特性和方法不是标准的DOM实现,是专门针对HTML同时也让一些DOM操作变的更加简便。HTML模块集中表现在HTMLElement接口上,即为全体元素类型的对象所实现的接口。就该文讨论的范围而言,HTMLElement接口的参与形式与上述的Node节点接口非常地相似。一旦引入了OO设计观,只要实现了HTMLElement接口的对象,就可以定义它为元素了。一份HTML文档有相当多的都是元素,当然还有,表示文档本身的HTMLDocument和集合容器HTMLCollection等等。
因此,要准确理解DOM1HTML的模块,必须认识其接口是基于元素的(Element-based),而不是基于节点的(Node-based)。那样的话,元素方式与节点方式到底又有什么区别呢(Elementv.sNode),应该如何界定两者呢?例如节点属性(propertiesofelements),当在“基于元素”的语境中,就是“属性(attributes)”,并非独立的节点对象。——尽管按照某个角度讲,元素是节点的一种特例,我们仍可保留“节点”这一说法,一个标签(tag)便是一个“节点”。假如我们要得到id属性的字符串的值是什么,采用DOM1Core的方式就是:
- viewplaincopytoclipboardprint?
- myElement.attributes["id"].value;//从Node接口提供的属性
- myElement.attributes["id"].value;//从Node接口提供的属性
等于下面的方法:
- viewplaincopytoclipboardprint?
- myElement.getAttributes("id");//从Element实现的方法返回
- myElement.getAttributes("id");//从Element实现的方法返回
但使用DOM1HTML方式的话,我们仅仅如此:
- viewplaincopytoclipboardprint?
- myElement.id;myElement.id;
这般就可以获取id了。此时此刻,你可能会认为,XML文档本身就不一定缺省有id的属性,而因为有你所说的HTMLElement.id属性预先定义在API中,当然HTML中的每个元素就有id的属性啦——这里的意思没有错,也不妨碍我们的理解。的确全体的HTML元素均有id一项的属性,不管HTMLDivElementHTMLImageElement……
Core or HTML Module?
既然这样,那我应该使用Core的API,还是HTML模块的API?对于HTML的文档来说,用Core或HTMLModuel实际差别不大。本来我们一直都不太强调这种界定,以致忽略了它们细微的差异。如果我们觉得还是模棱两可的话,我们可进一步查探它们的明细。
个人认为处理XHTML并使用CoreAPI这样更能够说明XHTML的“X”,即表明这份HTML就是一份标准的XML文档,以便与原有HTML4.1从语义上区别开来。但请记住,当处理一份XML结构的文档的时候,自然而然就是采用Core去处理。通过XHMLHttpRequest请求执行后所返回的responseXML结果,只能使用Core的API去处理分析,就不能够采用HTML的了。
小结
通过文本开发者应该明白到,HTML DOM与XML DOM之间,既有区别,又有联系。一般而言,除了上述比较外,须值得一提的就是,HTML是可以允许不Well-Form的,XML就不行。






