如何用Python解析XML并存入SQLite数据库

4次阅读

python解析 xml 存入 sqlite 需三步：先用 xml.etree.ElementTree 分析结构并提取字段（区分。get() 取属性与。text 取文本），再转为字典列表；然后用 sqlite 3 建表（注意字段类型匹配）；最后 executemany() 批量插入，兼顾安全与性能。

如何用 Python 解析 XML 并存入 SQLite 数据库

用 Python 解析 XML 并存入 SQLite数据库，核心是三步：读取 XML、提取数据、插入 SQLite。关键在于结构化处理——XML 格式多变，需先理清标签层级和字段映射关系，再用标准库（xml.etree.ElementTree）安全解析，避免第三方依赖；SQLite 用sqlite3 原生支持，无需额外安装。

比如有如下简化 XML（books.xml）：

&lt;library&gt;   &lt;book id=&quot;1&quot;&gt;     &lt;title&gt;python 编程&lt;/title&gt;     &lt;author&gt; 张三 &lt;/author&gt;     &lt;price&gt;59.9&lt;/price&gt;   &lt;/book&gt;   &lt;book id=&quot;2&quot;&gt;     &lt;title&gt; 数据结构 &lt;/title&gt;     &lt;author&gt; 李四 &lt;/author&gt;     &lt;price&gt;45.5&lt;/price&gt;   &lt;/book&gt; &lt;/library&gt;

目标字段是：id（属性）、title、author、price。注意 id 在book标签上，其余是子元素内容——解析时需区分.get()（取属性）和.text（取文本）。

不建议直接逐节点拼 SQL，先统一转成结构化数据更安全、易调试：

立即学习“Python 免费学习笔记（深入）”；

用 ET.parse() 加载文件，或 ET.fromstring() 加载 字符串
用 .findall("book") 定位所有记录节点
对每个 book，用.get("id") 取属性，.find("title").text等取子元素值
加 try/except 防缺失字段（如某本书没<price></price>），设默认值或跳过

示例代码片段：

import xml.etree.ElementTree as ET  tree = ET.parse(&quot;books.xml&quot;) root = tree.getroot()  books = [] for book in root.findall(&quot;book&quot;):     books.append({&quot;id&quot;: book.get(&quot;id&quot;),         &quot;title&quot;: book.find(&quot;title&quot;).text if book.find(&quot;title&quot;) is not None else None,         &quot;author&quot;: book.find(&quot;author&quot;).text if book.find(&quot;author&quot;) is not None else None,         &quot;price&quot;: Float(book.find(&quot;price&quot;).text) if book.find(&quot;price&quot;) is not None else None,     })

表结构要匹配字段类型：id可设 TEXT 或 Integer（若 XML 中全是数字），price 用 REAL，title/author用 TEXT：

用 sqlite3.connect() 连数据库（文件不存在会自动创建）
cursor.execute()建表，注意加 IF NOT EXISTS 避免重复报错
用 executemany() 批量插入，比循环 execute() 快得多，且自动处理sql 注入（参数化）
别忘了 conn.commit() 和conn.close()

接上例：

import sqlite3  conn = sqlite3.connect(&quot;library.db&quot;) cursor = conn.cursor()  cursor.execute(&quot;&quot;&quot;     CREATE TABLE IF NOT EXISTS books (         id TEXT PRIMARY KEY,         title TEXT,         author TEXT,         price REAL) &quot;&quot;&quot;)  cursor.executemany(&quot;INSERT OR REPLACE INTO books (id, title, author, price) VALUES (?, ?, ?, ?)&quot;,     [(b[&quot;id&quot;], b[&quot;title&quot;], b[&quot;author&quot;], b[&quot;price&quot;]) for b in books] )  conn.commit() conn.close()

编码问题 ：XML 文件含中文时，确保用ET.parse("books.xml", parser=ET.XMLParser(encoding="utf-8")) 显式指定编码。
空值与类型 ：XML 中<price></price> 或空白标签会导致 .text 为None，转换 float(None) 会报错，务必提前判断。
特殊字符 ：ElementTree 能自动处理&、 等实体，不用手动解码。<br><strong><a style="color:#f60; text-decoration:underline;" title="大数据 " href="https://www.php.cn/zt/16141.html" target="_blank"> 大数据 </a> 量 </strong>：若 XML 超大（百 MB 以上），改用 <code>iterparse() 边读边处理，避免内存爆满。

发表于：后端开发

近三天内

# app # Float # if # Integer # python # python编程 # sql # sqlite # sql注入 # try # xml # 大数据 # 字符串 # 循环 # 数据库 # 标准库 # 编码

复制链接

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

php数据库条件查询构建_php数据库动态查询语句组装

php工具如何构建RESTful API_php工具Web服务的开发指南

文件锁怎么用php_php文件锁机制使用方法与注意事项

Go语言XML解析教程：解决结构体字段映射失败的常见问题

mysql事务日志是什么_mysql事务日志作用解析

如何用Python解析XML并存入SQLite数据库

1. 分析 XML 结构，明确要存的字段

2. 用 ElementTree 解析 XML，转为 Python 字典列表

3. 创建 SQLite 表并批量插入

4. 小心常见坑

Java DOM Level 3 Core是什么新增了哪些功能

2024年你必须知道的20个VSCode神级插件

sublime如何显示漂亮的文件图标_AFileIcon插件让sublime界面更美观

TAGGER（TAG）币是什么？如何运作？2025年-2030年价格预测

PHP 表单提交：确保 $_POST 接收数据的关键——name 属性

如何用Python解析XML并存入SQLite数据库

1. 分析 XML 结构，明确要存的字段

2. 用 ElementTree 解析 XML，转为 Python 字典列表

3. 创建 SQLite 表并批量插入

4. 小心常见坑

Java DOM Level 3 Core是什么 新增了哪些功能

2024年你必须知道的20个VSCode神级插件

sublime如何显示漂亮的文件图标_AFileIcon插件让sublime界面更美观

TAGGER（TAG）币是什么？如何运作？2025年-2030年价格预测

PHP 表单提交：确保 $_POST 接收数据的关键——name 属性

Java DOM Level 3 Core是什么新增了哪些功能