如何将xml文件转换为格式良好的文件(convert an xml file to be well-formed)

本文通过一个示例说明如何编写格式良好的XML。WebWriter时事通讯使用XML格式编写;我们称之为AML或关于标记语言。虽然这是一个工作文档,但它不是格式良好或有效的XML文档。...

本文通过一个示例说明如何编写格式良好的XML。WebWriter时事通讯使用XML格式编写;我们称之为AML或关于标记语言。虽然这是一个工作文档,但它不是格式良好或有效的XML文档。

Documento XML

结构合理

创建格式良好的XML文档有一些特定规则:

  • XML声明必须放在每个文档的第一位。
  • 注释在标记中无效。注释不能在一行中包含两个连字符,注释的开头和结尾除外。
  • 例如,标记必须有一个结束标记,或者在单例标记本身中关闭。
  • 标签的所有属性都必须加引号,最好是双引号,除非属性本身包含双引号。
  • 每个XML文档必须包含一个完全包含所有其他元素的元素。

文档中只有两个问题导致其格式不正确:

  • AML文档需要的第一件事是XML声明语句。
  • 另一个问题是没有一个元素完全包围所有其他元素。要解决此问题,我们将添加一个外部容器元素:

进行这两个简单的更改(并确保所有元素仅包含CDATA)将使格式不正确的文档变成格式正确的文档。

根据文档类型定义(DTD)或XML模式验证有效的XML文档。这些是由开发人员或标准组织创建的一组规则,用于定义XML文档的语义。这些命令告诉计算机如何处理标记。

对于About标记语言,由于它不是标准的XML语言(如XHTML或SMIL),DTD将由开发人员创建。该DTD很可能与XML文档位于同一服务器上,并在文档顶部引用。

在开始为文档开发DTD或模式之前,您应该意识到,只要格式良好,XML文档就是自描述的,因此不需要DTD。

例如,在我们格式良好的反洗钱文件中,有以下标签:

如果您熟悉Web Writer时事通讯,您可能会认识时事通讯的不同部分。这使得使用相同的标准格式创建新的XML文档变得非常容易。我们总是将全文标题放在标记中,将第一节URL放在标记中。

DTD

如果您需要编写有效的XML文档来使用数据或处理数据,那么您可以将其与标记一起包含在文档中。在这个标记中,您定义文档中的基本XML标记和DTD的位置(通常是Web URI)。

例如:

DTD声明的一个优点是,您可以声明DTD是系统的本地,其中XML文档与“系统”在一起。您还可以指向公共DTD,例如HTML 4.0文档:

当您同时使用两者时,您告诉文档使用特定的DTD(公共标识符)以及在哪里可以找到它(系统标识符)。

最后,您可以直接在文档中的DOCTYPE标记中包含一个内部DTD。例如(这不是反洗钱文件的完整DTD):

XML模式

要创建有效的XML文档,还可以使用XML模式文档定义XML。XML模式是描述XML文档的XML文档。学习如何编写模式。

笔记

仅仅指向DTD或XML模式是不够的。文档中的XML必须遵循DTD或模式中的规则。使用验证解析器是检查XML是否遵循DTD规则的简单方法。你可以在网上找到很多这样的解析器。

  • 发表于 2021-09-08 06:04
  • 阅读 ( 165 )
  • 分类:数学

你可能感兴趣的文章

pdf格式(pdf)和xps公司(xps)的区别

...意。 什么是pdf格式(pdf)? PDF是由adobefilesystems开发的。PDF文件扩展名是指这样的文档。PDF主要与adobepdf相关。PDF代表可移植文档格式。PDF是独立于操作系统硬件或软件的二维文档。PDF文档能够支持文本、按钮、超链接、视频、图...

  • 发布于 2020-10-15 10:53
  • 阅读 ( 284 )

如何用代码读写xml文件

您想学习如何从java读写XML文件吗? ...

  • 发布于 2021-03-12 02:25
  • 阅读 ( 406 )

如何从头开始为站点创建rss提要

... 首先让我们看看如何从头开始为站点创建RSS提要。 ...

  • 发布于 2021-03-24 03:18
  • 阅读 ( 231 )

关于linux中bash for loops的所有知识

... 第一行告诉运行这个程序的人如何运行它(即使用bash解释器)。第二个命令与您在命令行中输入的任何其他命令一样。将该文件另存为hello_世界.sh,然后: ...

  • 发布于 2021-03-29 06:22
  • 阅读 ( 312 )

什么是xml文件(如何打开一个)?

...一些您可能认识到的: RSS和ATOM都描述了阅读器应用程序如何处理web提要。 Microsoft.NET使用XML作为其配置文件。 MicrosoftOffice2007和更高版本使用XML作为文档结构的基础。这就是“X”在.DOCX Word文档格式中的含义,例如,它也用于Exc...

  • 发布于 2021-04-05 05:56
  • 阅读 ( 188 )

如何将未知的媒体文件类型转换为mp3?

...道如何将未知的媒体文件类型转换为mp3: I am having trouble converting an unknown media file type to mp3 so that I can easily play it in VLC Media Player on my Windows 7 system. If I drag and drop the file into VLC Media Player, it plays fine. When I open it and attempt to choose VLC ...

  • 发布于 2021-04-08 10:30
  • 阅读 ( 228 )

为什么zip压缩单个文件比压缩具有相同内容的多个文件更好?

能够压缩我们的文件以便更容易地共享和/或传输它们可以使我们的电子生活更容易,但有时我们在压缩文件后可能会看到奇怪或意外的大小调整结果。为什么?今天的超级用户问答帖子回答了一位困惑读者的问题。 今天的问答...

  • 发布于 2021-04-10 01:56
  • 阅读 ( 224 )

为什么windows不允许我将一个8.6gb的文件放在14.7gb的空间中?

...o need to reformat the drive. You can upgrade from FAT32 to NTFS with the convert command. >convert /?
 Converts a FAT volume to NTFS.
 
 CONVERT volume /FS:NTFS [/V] [/CvtArea:filename] [/NoSecurity] [/X]
 
 volume Specifies the drive letter (followed by a colon),&#1...

  • 发布于 2021-04-11 16:54
  • 阅读 ( 118 )

什么是svg文件,如何打开?

...展名为“SVG”的图形文件。这些文件有什么特别之处,您如何查看它们?我们会解释的。 什么是svg文件(an svg file)? 在计算机图形学的上下文中,SVG代表“可缩放的矢量图形”。SVG文件是一种计算机文件,它使用万维网联盟定...

  • 发布于 2021-04-14 18:13
  • 阅读 ( 240 )

html格式(html)和xml格式(xml)的区别

...理器无法理解某些内容,处理器将生成错误代码并终止对文件的处理。它包括一个被称为“严苛”的错误处理机制。下表列出了两种语言的进一步规范,包括限制。   HTML格式 XML格式 定义 在web浏览器中显示网页的标记语言...

  • 发布于 2021-07-13 23:43
  • 阅读 ( 150 )
Tony_CTS
Tony_CTS

0 篇文章

相关推荐