php怎么取字符串里的数组_php字符串取数组json_decode与正则匹配法【技巧】

4次阅读

需根据 字符串 格式选择对应方法:一、标准 jsON 用json_decode;二、嵌套在非 JSON 中用正则提取后解析;三、php 数组语法先替换再解析;四、可信环境可用 eval;五、序列化字符串用 unserialize。

php 怎么取字符串里的数组_php 字符串取数组 json_decode 与正则匹配法【技巧】

如果 php 字符串 中包含类似数组格式的 JSON 数据,需要将其转换为可操作的 PHP 数组,则需根据字符串的具体结构选择合适的方法。以下是几种可行的操作步骤:

一、使用json_decode 解析标准 JSON 字符串

当字符串是合法的 JSON 格式(如 {“name”:”test”,”items”:[1,2,3]}),可直接调用json_decode 函数将其转为 关联数组 对象 。该方法要求字符串严格符合 JSON 语法规范,否则会返回NULL 且不报错。

1、确认字符串以花括号{或方括号[开头,并以对应符号结尾。

2、使用 json_last_error()检查解码前后的错误状态,确保无语法错误。

立即学习PHP 免费学习笔记(深入)”;

3、调用 json_decode($str, true)将 JSON 字符串转为关联数组,第二个参数设为 true 避免返回对象。

4、若字符串外层被单引号或多余字符包裹,需先用 trim()去除首尾空白及引号。

二、用正则匹配提取嵌套在非 JSON 上下文中的数组结构

当字符串并非完整 JSON,而是混杂在 html、日志或模板代码中(例如var data = [1,2,3]; 或 $arr = Array(1,2,3);),需借助 正则表达式 定位并捕获目标数组部分,再进行后续处理。

1、编写正则模式匹配方括号包围的数组内容,例如 ’/[.*?]/s’ 用于懒惰匹配最短的数组字面量。

2、使用 preg_match_all 获取所有匹配项,选取第一个有效结果。

3、对提取出的子字符串再次调用 json_decode,前提是其内容为 JSON 兼容格式;否则需进一步替换 PHP 数组语法(如 array(1,2))为 JSON 格式。

4、若匹配到的是 PHP 原生数组语法,可用 str_replace 将 array(替换为 [,将) 替换为],再清理空格和换行后尝试 json_decode。

三、结合 str_replace 与 json_decode 处理 PHP 数组语法字符串

针对明确以 PHP 数组语法书写的字符串(如 ”array(1, ‘a’, array(‘x’=>2))”),无法直接用 json_decode 解析,需先做语法转换。该方法适用于已知字符串结构固定、无动态嵌套变量的场景。

1、用 str_replace 将 array(替换为 [,将) 替换为],将 =>替换为:,单引号替换为双引号。

2、对字符串中的字符串值做转义处理,例如将 ”” 替换为 ””,避免 JSON 解析失败。

3、使用 preg_replace 处理多维嵌套中的逗号与括号关系,确保结构闭合。

4、执行 json_decode 前,用 json_validate(PHP 8.3+)或手动校验括号配对数量,防止非法输入导致静默失败。

四、使用 eval 执行动态 PHP 代码(仅限可信环境)

当字符串完全符合 php 语法 且来源绝对可信(如 配置文件、内部生成字符串),可临时启用 eval 将字符串作为 PHP 代码执行。此方式风险极高,禁止用于用户输入或外部数据。

1、确认字符串仅含数字、字母、空格、括号、引号、逗号、冒号、分号等安全字符。

2、在 eval 前添加白名单校验,例如用 preg_match(‘/^[a-zA-Z0-9s[]{}():,'”.;-+*/%&|^!~=?$#]+$/’, $str)粗略过滤。

3、将字符串包装为赋值语句:$temp = $str;,再传入 eval 执行。

4、执行后检查 $temp 是否为数组类型,使用 is_array($temp)验证结果有效性。

五、利用 serialize/unserialize 还原 PHP 序列化字符串

若原始字符串是 PHP serialize()输出的结果(如 ”a:3:{i:0;i:1;i:1;i:2;i:2;i:3;}”),应优先使用 unserialize 而非 json_decode。该方法保留 PHP 原生类型和结构,无需语法转换。

1、检测字符串是否以字母开头且含冒号和分号组合,例如 /^([aOCS]):/ 匹配序列化 标识符

2、使用 @unserialize($str)执行反序列化,加 @抑制警告,随后用 is_array()判断结果。

3、若存在对象反序列化风险,设置 unserialize_callback_func 限制可实例化的类名。

4、对不可信数据,改用 igbinary_unserialize(需扩展支持)或先校验字符串哈希签名再解包。

以上就是

站长
版权声明:本站原创文章,由 站长 2025-12-17发表,共计1879字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
1a44ec70fbfb7ca70432d56d3e5ef742
text=ZqhQzanResources