综漫之猫屋餐厅乐文:xml是什么格式

来源：百度文库编辑：中科新闻网时间：2024/04/28 22:17:47

是一种网页的文件格式，跟ASP，HTML有什么不同么。
它有什么作用呢。

简单地说明一下吧。
首先是ASP与HTML的关系，希望楼主能够明白两者的关系。HTML的主要功能就是显示数据，也就是说网页的内容。HTML定义了许多标签，提供了数据的显示方式，哪些是显示为段落，哪些显示为标题，哪些显示为表格等等。而ASP是动态地生成HTML，用户需要浏览什么数据，ASP就把这些数据组织成HTML来显示出来，最常见的情况就是ASP能够从数据库中提取数据并用HTML向用户表示出来。由此，这可能发生一件事，也许你看了好几个内容不同的网页，但它们可能都是一个asp文件生成的。

而xml则侧重于管理数据，更具体地说是分类数据（这是它的主要功能之一）。也许从一个HTML上看不出数据之间的关系，两个HTML段落可能一个段落是一本书的标题，另一个段落可能是一本书的序言。这一切用HTML表示都无法说明它们的关系。而XML可以做到这一点，因为它的标签可以由用户定义，如一本书的标题可以定义为title标签，内容可以定义为content标签。这样数据之间的关系就很明显。

但xml文件无法提供显示方式，因为浏览器并不知道这些标签要用什么来显示，即使可以使用css或者xsl来定义显示，但xml还是很少用来显示，它还是侧重于管理数据，显示数据的任务还是由html担任，因此xml会取代html恐怕不会实现。不过在html中已经可以实现从xml中提取数据并显示出来，这样它们的分工就更加明显了。

XML有以下几个优点：
• 数据是自说明的
• 数据可用标准工具加以处理
• 数据可用标准工具查看
• 用样式单可容易地生成同样数据的不同视图
XML格式的第一条主要好处是数据是自描述的。每个数字的意义是清楚的，且不会错误地与数字本身相联系。当读取文档时，用户了解 2 中的2指的是击中数而不是得分或是防守。如果键入文档的打字员漏掉了一个数字，不会造成其后的数字都错了位。HITS就是HITS，即使它前面的RUNS元素丢失也没关系。
在本书第二部分中，读者会看到，XML还可以使用DTD来加强限制，使得某些元素，如HITS或RUNS必须存在。
第二条好处是XML提供的数据可用广泛的具有XML处理能力的工具加以处理，从相当贵的软件，如Adobe FrameMaker 到免费软件，如Python和Perl。数据量可以很大，但是数据额外的冗余就允许使用更多的工具来处理它。
当查看数据时，也同样有这样的问题。XML文档可装入Internet Explorer 5.0、Mozilla、FrameMaker 5.5.6和许多其他工具，所有这些工具都提供唯一的、有用的一种数据的视图。数据还可以装入简单的文本编辑器中，如vi、BBEdit和TextPad。这就使得数据或多或少的可在多种平台上查看。
使用新软件也不是获得数据的不同视图的唯一方法。在下一节中，我们将为棒球统计数据创建一个样式单，来提供一种与图4-1完全不同的查看数据的方法。每当对同一文档施加不同的样式单，都可以看到不同图景。
最后，要向自己发问，文件大小真是很成问题吗？当前硬盘容量已经相当大了，可以存入大量数据，即使存储得不太节省也没有太大的关系。同时，XML文件的压缩率很大。全部的两大棒球联赛1998年统计数据的文档是653K。如果用gzip 压缩一下的话，只有66K，几乎压缩了90%。先进的HTTP服务器，如Jigsaw可以发送压缩文件，而不必解压缩，因而文档所用的网络带宽与其实际信息内容已相当接近。最后，我们不能认为二进制文件格式（特别通用的格式）必定是高效的。包含1998statistics.xml文件同样数据的Microsoft Excel文件的大小达到了2.37MB，比XML格式大了三倍多。虽然我们能够创建更为有效的文件格式和编码方法，但实际上简单并不是必须的。
http://www.idfree.net/artlist.asp?a_id=410
把数据转换成XML格式的好处
我们常常会碰到需要处理以各种格式（从以逗号或者制表符做分隔符的文件到更负载的格式）保存或者传输的数据的情况，对每一种格式你都需要对应的解析器（parser）。这一缺点减缓了开发进度，而且可能会导致错误的发生。一个解决方案就是把常用格式的数据转化成XML文档，然后对它进行保存、处理或者转换成其它格式。

一个实例

现在已经有好多种实现在软件内部或者软件之间进行数据保存、导出、导入以及传输功能的数据格式。最常见的是定界格式（delimited format），如逗号或者制表符分隔数据格式以及定长数据格式。假设我们有一个地址簿程序，该程序提供把数据导出成逗号分隔以及固定长度这两种格式的功能。

在逗号分隔格式中，用逗号来分隔同一个数据记录中的不同字段，如清单A所示。而在固定长度数据格式中，记录的每一个字段都应该有一个标准长度。清单B给出了一个固定长度格式的地址簿。

创建XML文档

现在，让我们解析输入数据并把它转换成XML文档。XML文档（即org.w3c.dom.Document）是全部文档对象模型（DOM）的原始数据类型，并且它提供了对文档数据的访问。

你可以用执行buildDocument(InputStream is)方法来创建与你的数据对应的文档，如代码清单C所示。该方法逐行读取输入数据流，并根据给定格进行来逐行分析。

如果你想解析分界格式数据，你需要创建构造函数为PlainTextToXmlFormatter(String[ ] colName,String delim)的类的实例，其分界符可以是任何字符串。在固定长度格式的情况下，你应该使用第二种构造函数PlainTextToXmlFormatter(String[ ] colName,int[ ] colLen)，它的一个参数为字段长度数组。在我们所给的地址簿例子中，各字段的长度分别为10、10、30以及10个字符。参数colName是保存了目标数据记录的名字的数组，在我们给出的这个例子中，名字分别为名（firstName）、姓（lastName）、email以及电话号码（phone）。

把数据行转换为数据符号的实际解析过程也就是执行getStringArray(String read,String delim)或者parseFixedLengthMessage(String read,int[ ] colLen)方法的过程。其返回值是一个String型数组，这个数组是上述两个方法把给定输入进行分解而得来的。如果数据格式不对，就会抛出一个例外并且终止解析过错。调用setSkipError(true)方法就可以忽略例外并完成数据解析过程。调用这个方法可以防止抛出例外，但它仍允许程序向错误输出流打印错误信息。

当行被解析成标记后，它们作为XML文档的元素而加入到XML文档之中。放入到元素之中的每一行记录都有一个默认的名字line，你也可以调用setDataLineName()来指定名字。每一个数据记录都是一个列元素，列元素的名字由相应的类构造函数提供，子元素加到行元素之中。

在输入数据完全读取之后，你就得到了一个有效的XML文档，你可以进一步处理这个文档。现在，由于数据是按众所周知的树状结构来组织的，因此处理它非常简单。例如，你可以把这个文档送交给第三方，只要第三方知道该文档的文档类型定义（Document Type Definition ，DTD），那么他就可以很容易的处理文档了。你还可以调用writeDocument(Document doc,OutputStream osOut)方法来保存这个文档。代码清单D就给出一个把XML文档保存到一个文件中的例子。

用XSLT转换来查看数据

你还可以把XML数据转换成其它格式，并用不同的视图来表示其内容。最简单的方法就是使用XSLT转换，它提供了一种强大的面向树的转换语言实现，可以把使用一种词汇表的XML实例转换成简单文本、HTML或者使用其它词汇表的XML。

对给定的XML输入，你可以用XSLT语言来创建你所期望的输出。例如，通过执行transformData(InputStream xmlIn,InputStream xslIn,OutputStream transfOut)，你就可以把XML数据转换成一个HTML文档。代码清单E提供了XSLT转换的一个例子，而清单F给出了地址簿条目的HTML视图。

简化对数据的管理

在本文中，我们通过分析PlainTextToXmlFormatter类而学会了如何把常用格式数据转换成XML文档。我们还看到了如何借助于XSLT转换而用不同的视图来表示XML文档。当你需要处理各种格式的数据时，采纳上述技术或许就就是一个好的解决方案，从而节省了你的宝贵时间并减少了出错的可能性。
http://www.toprosoft.com/data/4/0292663753460.htm

xml是什么格式 xml是什么 XML是什么？ xml是什么？ XML是什么？ xml是什么？ xml和rtf各是什么格式的文件？格式为XML的文件是什么东东啊?? 什么是XML格式？ xml格式打不开