PHP处理大型CSV文件内存溢出?goodby-csv帮你高效导入导出

最近在做一个数据导入的项目,需要处理大量的 CSV 文件。这些文件动辄几百 MB 甚至几 GB,如果使用传统的 php 函数,例如 fgetcsv(),很容易导致内存溢出。为了解决这个问题,我开始寻找更高效的 CSV 处理方案。经过一番调研,我发现了 handcraftedinthealps/goodby-csv 这个库。

composer在线学习地址:学习地址

handcraftedinthealps/goodby-csv 是一个 PHP CSV 导入/导出库,它的主要特点是内存效率高、灵活且可扩展。它通过逐行读取 CSV 文件并执行回调函数的方式,避免了将整个文件加载到内存中,从而解决了内存溢出的问题。

使用 composer 安装 goodby-csv 非常简单:

composer require handcraftedinthealps/goodby-csv

以下是一个简单的 CSV 导入示例:

use GoodbyCSVImportStandardLexer; use GoodbyCSVImportStandardInterpreter; use GoodbyCSVImportStandardLexerConfig;  $config = new LexerConfig(); // 可选:自定义分隔符、包围符、编码等 // $config->setDelimiter("t"); // $config->setEnclosure("'"); // $config->setToCharset('UTF-8'); // $config->setFromCharset('SJIS-win');  $lexer = new Lexer($config); $interpreter = new Interpreter();  $interpreter->addObserver(function(array $row) {     // 在这里处理每一行数据,例如插入数据库     // var_dump($row); });  $lexer->parse('data.csv', $interpreter);

在这个例子中,我们创建了一个 Lexer 对象和一个 Interpreter 对象。Lexer 对象负责解析 CSV 文件,Interpreter 对象负责处理解析后的数据。我们通过 addObserver() 方法注册一个回调函数,这个回调函数会在每一行数据被解析后执行。

立即学习PHP免费学习笔记(深入)”;

goodby-csv 还支持 CSV 导出,以下是一个简单的示例:

use GoodbyCSVExportStandardExporter; use GoodbyCSVExportStandardExporterConfig;  $config = new ExporterConfig(); // 可选:自定义分隔符、包围符、编码等 // $config->setDelimiter("t"); // $config->setEnclosure("'"); // $config->setToCharset('SJIS-win'); // $config->setFromCharset('UTF-8');  $exporter = new Exporter($config);  $data = [     ['id', 'name', 'email'],     ['1', 'alice', 'alice@example.com'],     ['2', 'bob', 'bob@example.com'], ];  $exporter->export('output.csv', $data);

goodby-csv 的优势在于:

  • 内存效率高: 逐行读取和处理 CSV 数据,避免内存溢出。
  • 灵活可配置: 支持自定义分隔符、包围符、编码等。
  • 支持多字节字符: 支持处理包含多字节字符的 CSV 文件。
  • 单元测试完善: 库的质量有保障。

通过使用 goodby-csv,我成功解决了大型 CSV 文件的导入问题,大大提高了数据处理效率,并避免了内存溢出的风险。如果你也遇到了类似的问题,不妨试试 goodby-csv,相信它会给你带来惊喜。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享