1、通过浏览器“另存为”功能可保存静态网页源码;2、使用开发者工具复制渲染后dom适用于动态内容;3、wget命令适合批量抓取;4、python脚本实现自动化获取与保存。

如果您需要将网页的html源码保存到本地设备以便离线查看或进行分析,可以通过多种方式实现。以下是完整的操作流程:
一、使用浏览器自带的保存功能
现代浏览器均提供将当前页面以HTML格式保存到本地的功能,该方法适用于大多数静态网页。
1、在目标网页上右键点击空白处,选择“查看页面源代码”或按快捷键 Ctrl+U(windows)/ Cmd+Option+U(mac)。
2、页面跳转至源码界面后,全选所有内容并复制,或直接通过菜单栏选择“文件” → “另存为”。
立即学习“前端免费学习笔记(深入)”;
3、在弹出的对话框中,设置保存位置,将“保存类型”更改为“网页,仅HTML (*.html)”或“网页,全部(包含资源)”以保留图片和样式。
4、输入文件名,点击“保存”按钮完成操作。
二、通过开发者工具手动导出
当页面内容由javaScript动态生成时,直接查看源代码可能无法获取完整结构,此时应使用开发者工具提取渲染后的DOM。
1、在网页上按下 F12 或右键选择“检查”打开开发者工具。
2、切换至“Elements”标签页,此处显示的是经过javascript处理后的实时DOM结构。
3、右键点击根节点 <html> 标签,选择“copy” → “Copy outerHTML”。
4、打开文本编辑器(如记事本、VS Code等),粘贴内容,并以 .html 扩展名保存文件。
三、使用命令行工具 wget 抓取网页
wget 是一个强大的命令行下载工具,适合批量保存网页源码。
1、确保系统已安装 wget 工具,可在终端或命令提示符中输入 wget –version 验证是否可用。
2、执行命令:wget -O output.html http://example.com,其中 URL 替换为目标地址,output.html 为本地保存文件名。
3、命令执行完成后,当前目录下将生成指定名称的HTML文件。
四、通过编程脚本获取并保存源码
使用 Python 脚本可以灵活地请求网页并保存响应内容,适用于自动化场景。
1、安装 requests 库:在命令行运行 pip install requests。
2、编写以下 Python 代码:
import requests
url = “http://example.com”
response = requests.get(url)
with open(“page_source.html”, “w”, encoding=”utf-8″) as file:
file.write(response.text)
3、运行脚本后,同级目录将生成名为 page_source.html 的本地文件。


