XSLT如何复制XML节点结构？-小浪学习网

XSLT复制xml节点结构的核心是恒等转换，通过匹配所有节点并递归复制实现完整结构复制；在此基础上，可通过添加特定模板实现选择性复制、节点重命名、内容修改与结构重组；实际应用中需注意命名空间处理、空白字符控制、性能优化及模板优先级等高级问题。

XSLT如何复制XML节点结构？

XSLT要复制XML节点结构，核心思路其实就是利用所谓的“恒等转换”（identity transform）。这就像是给XML文档拍了个照，然后把照片上的所有东西原封不动地再打印出来。它通过一个通用的模板来匹配XML文档中的所有节点和属性，然后简单地将它们复制到输出中，同时递归地处理它们的子节点。

解决方案

在我看来，XSLT的恒等转换是处理XML结构复制和部分转换的基石。它的基本实现非常简洁，但功能却异常强大。你可以想象成它提供了一个默认的“复制一切”规则，然后我们可以在此基础上，针对性地修改或添加我们想要的转换逻辑。

一个典型的恒等转换模板是这样的：

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">    <!-- 匹配所有属性节点和所有其他节点（元素、文本、注释、处理指令等） -->   <xsl:template match="@*|node()">     <!-- 复制当前节点本身 -->     <xsl:copy>       <!-- 然后递归地处理当前节点的所有属性和子节点 -->       <xsl:apply-templates select="@*|node()"/>     </xsl:copy>   </xsl:template>  </xsl:stylesheet>

这段代码的精妙之处在于

match="@*|node()"

和

<xsl:copy><xsl:apply-templates select="@*|node()"/></xsl:copy>

。

@*

匹配所有属性，

node()

匹配所有其他类型的节点（元素、文本、注释、处理指令等）。

xsl:copy

指令会复制当前匹配到的节点，但不会复制其子节点或属性。要复制子节点和属性，就需要紧接着的

xsl:apply-templates select="@*|node()"

，它会再次应用模板，形成一个递归的复制过程。这样一来，整个XML文档的结构，包括所有元素、属性、文本内容，都会被完整地复制出来。这其实就是XSLT处理XML文档的默认行为的一个显式表达，它给了我们一个非常灵活的起点。

XSLT选择性复制XML节点的实用技巧是什么？

有时候我们并不是想把整个XML文档原封不动地复制一遍，可能只想复制其中一部分，或者复制的同时排除掉某些不必要的信息。在我日常工作中，这种需求非常常见。最直接的方法，就是以恒等转换为基础，然后针对性地“覆盖”或“添加”新的模板规则。

比如说，你有一个包含用户敏感信息的XML文档，你想复制大部分结构，但又不希望某些敏感的

<secret>

元素出现在输出中。你可以这样做：

首先，保留那个万能的恒等转换模板，它负责复制所有你没有明确指定处理方式的节点。

通过添加

match="secret"

这个空模板，XSLT在处理到

<secret>

元素时，会优先选择这个更具体的模板，而这个模板什么都不做，于是

<secret>

元素及其内部的所有内容就被“静默”地跳过了，不会出现在最终的输出中。这是一种非常优雅且强大的选择性复制方式。

再举个例子，如果你想复制文档，但又想把所有

<oldName>

元素改名为

<newName>

，同时保留其内容和属性，你可以这样写：

                                <newName>

这里，我们为

oldName

元素定义了一个特定模板。当XSLT遇到

oldName

时，它会创建一个新的

newName

元素，然后把

oldName

的所有属性和子节点（通过

xsl:apply-templates

）复制到这个新的

newName

元素内部。这种方式既实现了选择性地改变节点名称，又保留了其内部结构。

在复制XML结构时，XSLT如何实现节点内容的修改或重组？

仅仅是复制或者排除节点，有时候还不够。很多时候，我们还需要在复制的过程中对节点的内容进行修改，或者对结构进行一些重组。这正是XSLT的强项所在。

比如，你可能想复制一个

<item>

节点，但同时给它添加一个

status="processed"

的属性，或者把它的某个子节点的值提取出来，作为另一个新元素的文本内容。

假设原始XML是这样的：

<data>   <item id="123">     <name>Product A</name>     <price>100</price>   </item> </data>

你想把它变成：

        Product A     100     <summary>Product A - 100

我们可以这样实现：

                                                            processed                            <summary>                   -

在这个例子里，针对

item

元素，我们首先用

xsl:copy

复制了它自己。接着，

xsl:apply-templates select="@*"

复制了

item

的所有原有属性。然后，

xsl:Attribute name="status"

则创建了一个新的

status

属性并赋值。

xsl:apply-templates select="node()"

继续处理

item

的子节点，确保

name

和

price

等原有子元素也被复制。最后，我们创建了一个新的

<summary>

元素，并使用

xsl:value-of

从

name

和

price

子元素中提取内容，结合

xsl:text

的固定文本，组成了新的文本内容。这种组合使用

xsl:copy

、

xsl:attribute

、

xsl:element

（虽然这里没直接用，但

<summary>

就是隐式创建了一个元素）、

xsl:value-of

和

xsl:text

的方式，让XSLT在复制结构的同时，能非常灵活地修改和重组内容。

使用XSLT复制XML节点结构时，有哪些常见陷阱和高级考量？

在我看来，XSLT在复制XML结构时，虽然基础操作直观，但深入进去，还是有一些细节和“坑”需要注意，尤其是在处理复杂的XML文档时。

一个经常让人头疼的问题就是命名空间（Namespaces）。XML命名空间是用来避免元素和属性名称冲突的，但在XSLT复制时，如果处理不当，可能会导致输出的XML命名空间声明混乱或丢失。

xsl:copy

指令默认会复制当前元素的命名空间URI，但不会复制其命名空间声明。如果你的输出需要显式的命名空间声明，或者你想改变某个元素的命名空间，你就需要更精细的控制，比如使用

xsl:element

来明确指定新元素的命名空间，或者在

xsl:stylesheet

根元素上使用

exclude-result-prefixes

来管理前缀。举个例子，如果你有一个带命名空间的XML，并且希望在复制时保持其命名空间，但又不想让某些前缀出现在输出中，就需要仔细配置。

另一个需要注意的点是空白字符（Whitespace）处理。默认情况下，XSLT处理器可能会移除XML文档中那些“无关紧要”的空白字符（比如元素之间的缩进和换行）。如果你需要精确地保留所有空白字符，包括那些通常被认为是可忽略的空白，你就需要使用

xsl:preserve-space

指令。反之，如果你想清理掉所有可忽略的空白，可以使用

xsl:strip-space

。这在处理混合内容（元素和文本混合）或者需要精确格式化输出时非常关键。

性能考量也是一个实际问题。对于非常庞大或深层嵌套的XML文档，虽然恒等转换本身效率很高，但如果你在上面叠加了大量复杂的条件判断、XPath查询或外部函数调用，转换的性能可能会受到影响。在这种情况下，优化XPath表达式、减少不必要的处理，甚至考虑将大型文档拆分成小块处理，都是值得考虑的策略。

此外，模板的优先级和冲突解决也是一个高级话题。当多个模板可以匹配同一个节点时，XSLT会根据一套规则来决定哪个模板被应用（通常是更具体的模板优先级更高）。了解这些规则可以帮助你避免意外的行为，确保你的转换逻辑按预期执行。

最后，我想说，XSLT的强大在于它的声明性。你描述的是你想要的结果，而不是实现结果的步骤。这使得它在XML结构复制和转换方面非常高效和灵活，但同时也要求我们对XML和XSLT的底层机制有深入的理解。

文章版权归作者所有，未经允许请勿转载。

THE END