Windows文件换行符转Linux换行符

前段时间,我的一个朋友因为windowslinux的换行符不同而导致程序无法编译。这个问题我之前也遇到过,网上的资料很多,但通过总结和实践,我发现这种方式能更好地提升自己。

首先,让我们了解一下操作系统文件的换行符。在ASCII中,有两个字符CR(编码为13)和LF(编码为10),在编程中我们通常称它们为’r’和’n’。它们被用作换行标志,但在不同系统中的使用方式不同。以下是不同操作系统使用的换行符:

unix和类Unix系统(如linux):使用’n’作为换行符。 windows和MS-DOS:使用’rn’作为换行符。 Mac OS X之前的系统:使用’r’作为换行符。 Mac OS X:使用’n’作为换行符。

在Linux中查看文件的换行符有许多方法,这里介绍两种常见的方法。

第一种方法是使用”cat -A [Filename]”命令查看,如下图所示,显示的是Windows形式的换行符,其中’r’对应符号’^M’,’n’对应符号’$’。

Windows文件换行符转Linux换行符

第二种方法是使用vi编辑器查看,并使用”set list”命令显示特殊字符:

Windows文件换行符转Linux换行符

细心的朋友可能会发现’^M’没有显示出来,这里提醒大家,需要用VI的二进制模式(”vi -b [FileName]”)打开文件,才能显示出’^M’:

Windows文件换行符转Linux换行符

接下来介绍三种将Windows换行符转换为Linux格式的方法,选择哪一种取决于个人喜好,当然你也可以选择其他方法。

(1)第一种方法是使用VI:在VI的普通模式下打开文件,然后运行命令”set ff=unix”,即可将Windows换行符转换为Linux换行符,非常简单!命令中的”ff”全称为file encoding。

(2)第二种方法是使用”dos2unix”命令,如下所示:

[root@localhost test]# dos2unix gggggggg.txt

dos2unix: converting file gggggggg.txt to UNIX format …

(3)第三种方法是使用sed命令删除’r’字符:

[root@localhost test]# sed -i ‘s/r//g’ gggggggg.txt

通常,我们需要处理一批文件,比如一个目录下的所有文件都需要转换。我编写了一个简单的脚本来遍历目录和子目录下的所有文件,并将其转换为Linux换行格式。代码如下:

#!/bin/sh

#Checkinput

#Check Whether the input is valid

#0 means not valid

CheckInput()

{

ret=1;

Check the number of parameter

And Check whether the argument is a folder

if [ $# -lt 1 ]

then

echo “Please use the command like ./dos2u.sh [Folder]”;

ret=0

elif [ ! -d $1 ]

then

echo “Please use an invalid Folder as the shell argument”;

ret=0

fi

return $ret;

}

#TraverseFolder

#Traser all the files under the folder

TraverseFolder()

{

oldPath=

pwd

cd $1;

for file in

ls

do

if [ -d $file ]

then

TraverseFolder $file;

else

echo $file;

sed -i ‘s/r//g’ $file

dos2unix $file

fi

done

cd $oldPath;

}

CheckInput $*

if [ $ret -ne 1 ]

then

exit -1

fi

TraverseFolder $1

这个脚本主要是作为练习使用,当然可以用更简单的方式解决,比如使用find命令结合dos2unix命令。大家可以自己尝试一下。我这样写的主要目的是为了方便以后扩展功能,当然还有一些bug需要修复,^_^。

参考资料:

  1. How To Convert Files from Linux/Unix format to Windows and Vice Versa:

https://www.php.cn/link/e1cb9ebefa419a866a655b1a74d4b0df

  1. Difference Between n and r?

https://www.php.cn/link/312e53ccba0b2ddfefd4a1f05b55bcdd

  1. 美国信息交换标准代码

https://www.php.cn/link/2e34e565526802985f40f7c11146406d

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享