XML入门精解之文件格式定义

时间:2008-02-25 13:57:00 

DTD实际上可以看作一个或多个XML文件的模板,这些XML文件中的元素、元素的属性、元素的排列方式/顺序、元素能够包含的内容等,都必须符合DTD中的定义。XML文件中的元素,即我们所创建的标记,是根据我们应用的实际情况来创建的。想要创建一份完整性高、适应性广的DTD是非常困难的,因为各行各业都有他们自己的行业特点,所以DTD通常是以某种应用领域为定义的范围,如:医学、建筑、工商、行政。DTD定义的元素含盖范围越广泛,那么就越复杂。

DTD可以是一个完全独立的文件,也可以在XML文件中直接设定。所以,DTD分为外部DTD(在XML文件中调用另外已经编辑好的DTD)和内部DTD(在XML文件中直接设定DTD)两种。比如,有几十家相互联系的、合作伙伴关系的公司、厂商,他们相互之间的交换电子文档都是用XML文档。那么我们可以将这些XML文档的DTD放在某个地方,让所有交换的XML文档都使用此DTD,这是最方便的做法,同时也适用于公司内部的XML文件使用。

内部DTD


内部DTD是在XML文件的文件序言区域中定义的。语法:



  〈!DOCTYPE element-name[........ 
  ]〉 


  〈!DOCTYPE :表示开始设定DTD,注意DOCUTYPE是大写。


Element-name :指定此DTD的根元素的名称,一个XML文件只能有一个根元素。注意,如果 XML文件使用了DTD,那么文件中的根元素就在这里指定。


[.........]〉 :在[ ]标记里面定义XML文件使用元素,然后用〉结束DTD的定义。


下面,我们来看一下怎样给XML文件定义DTD,请见例1。


例1中的DTD定义区可以看作是一个DTD定义的大概框架,为其他XML文件定义DTD,结构和例1的DTD差不多,只是可能需要添加、删除或者更改一些东西而已。在DTD定义的中间是元素设定,这是一个DTD的最主要部分,其主要语法如下:

〈!ELEMENT element-name element-definition〉 


〈!ELEMENT:表示开始元素设置,注意此处ELEMENT关键字是大写。


element-name:表示要设置的元素的名称。

element-definition:指明要对此元素进行怎样的定义,就是说〈元素〉...〈/元素〉之间能够包含什么内容,是其他元素还是一般性的文字。


在例1中,大家可以看到,〈!ELEMENT 参考资料 (书籍)〉这个元素设定是声明了“参考资料”这个元素,并且它是作为“书籍”这个元素的父元素。〈!ELEMENT 书籍 (名称,作者,价格)〉这个元素设定声明了“书籍”这个元素,并且它是作为“名称”、“作者”、“价格”这三个元素的父元素。而〈!ELEMENT 名称 (#PCDATA)〉这个元素设定声明了“名称”这个元素,但是此元素仅仅包含一般文字,是基本元素,这是由#PCDATA关键字定义的。


在元素设置中,如果元素包含多个子元素,如:〈!ELEMENT 书籍 (名称,作者,价格)〉这种含多个子元素的声明,那么“名称”、“作者”、“价格”这些标记在XML文件中必须以上面排列的顺序出现,每个标记必须而且只能够出现一次。如果在设定元素时,按照〈!ELEMENT 书籍ANY〉,这样在元素下就可以包含任意被设定过的元素,出现的次数和顺序也不受限制,并且在该元素下,除了可以包含子元素以外,还能够包含一般的文字。有时候,在XML文件中,一个标记可能多次出现(或者不出现),那么我们除了在它们的父元素中用ANY关键字之外,还可以在元素的旁边加上特定的符号来控制标记出现的次数。这些符号见表1。

表1


符号    代表标记出现的次数

?    不出现或只出现一次


*    不出现或可出现多次

+    必须出现一次以上


无符号    只能出现一次


例如:〈!ELEMENT 参考资料(书籍,报纸+,杂志?,网站)〉这个元素设定,“书籍”标记在XML文件中可以不出现或者出现多次;“报纸”标记必须出现一次以上;“杂志”标记可以不出现或只出现一次;而“网站”标记必须出现而且只能出现一次。


在一些父元素的声明中,有可能它包含的子元素是在多个子元素中选择一个来使用,那么我们声明此父元素时,就可以把它声明成选择性元素,例如:〈!ELEMENT 配偶 (妻子|丈夫)〉。可供选择的子元素用“|”分隔,这样,我们在XML文件中可以这样写:


〈配偶〉


〈丈夫〉张三〈/丈夫〉

〈/配偶〉


只从中选择一个子元素。


在我们的XML文件中,还可能包括很多“空元素”,即:元素是单独存在的,没有〈/元素〉这样的结束标记。那么在DTD中是用EMPTY关键字来声明的。如:〈!ELEMENT 元素名 EMPTY〉。在XML文件中,空元素不需要结束标记,但必须以〈/空元素名〉这样的写法。


DTD中,还可以声明一些称为Entity的东西,让DTD和XML文件使用。我们可以把Entity看作是一个常量,它有一定的值。在DTD中,Entity的声明语法为:〈!ENTITY entity-name entity-definition〉。例如:我们在DTD中声明〈!ENTITY PC "(#PCDATA)"〉 ,那么在后面的元素设定中,就可以使用这个Entity来代替“(#PCDATA)”这个字符串,如:〈!ELEMENT 作者 (#PCDATA)〉可以写成〈!ELEMENT 作者 &&PC;〉。引用Entity的时候,必须要在Entity名称前面加上“&&”符号,后面加上“;”符号。

在例1中,〈!ATTLIST 价格 货币单位 CDATA #REQUIRED〉这一句是设定元素的属性,关于元素属性设置的语法为:〈!ATTLIST element-name attribute-name Type Default-value〉 。其中,〈!ATTLIST是开始属性的设定(注意大小写)。element-name是指明此属性设定是针对什么元素的;attribute-name是设定的属性的名称;Type是该属性的属性值的类别,属性值有多种,可以是一般的文字,或从几种属性值中取一种等,属性值的种类见表2。Default-value是指该属性的内定值种类,有四种不同的属性内定值(见表3)。

标签:DTD,文件,xml
0
投稿

猜你喜欢

  • ASP中使用Session变量的优缺点

    2007-10-01 18:02:00
  • Access保留字和变量名列表

    2007-10-15 12:43:00
  • 小白讲座:在win下mysql备份恢复命令概括

    2009-09-05 09:43:00
  • DBA_2PC_PENDING 介绍

    2009-02-28 10:59:00
  • 使用一条INSERT语句完成多表插入

    2010-03-18 11:08:00
  • 一起感受HTML5和CSS3的能量[译]

    2009-09-04 16:29:00
  • Web标准学习:CSS样式书写风格

    2008-03-25 09:37:00
  • mysql数据库你需要特别注意的23个事项

    2010-08-08 08:34:00
  • 支持鼠标拖拽的简单目录树代码

    2011-07-01 12:34:09
  • Flash连接服务器

    2008-06-15 07:19:00
  • asp如何对多个条件进行判断?

    2009-11-20 18:28:00
  • asp中提取HTML中图片的SRC路径

    2008-10-24 08:42:00
  • sqlserver索引的原理及索引建立的注意事项小结

    2012-08-21 10:54:34
  • HTML5 第二份草案发布

    2008-06-17 17:42:00
  • 阿里巴巴中秋节logo设计的艰辛曲折过程

    2008-09-11 17:15:00
  • Dreamweaver虚拟在线试衣室

    2009-07-05 18:54:00
  • SQL Server中通过reverse取某个最后一次出现的符号后面的内容(字符串反转)

    2012-07-11 15:59:36
  • 如何将函数的实际参数转换成数组

    2010-01-11 19:59:00
  • 构建成功web应用的十项黄金法则

    2010-09-17 19:11:00
  • ASP中 ADODB.Stream 语法速查

    2008-01-27 15:23:00
  • asp之家 网络编程 m.aspxhome.com