前段时间,我的一个朋友因为windows和linux的换行符不同而导致程序无法编译。这个问题我之前也遇到过,网上的资料很多,但通过总结和实践,我发现这种方式能更好地提升自己。
首先,让我们了解一下操作系统文件的换行符。在ASCII中,有两个字符CR(编码为13)和LF(编码为10),在编程中我们通常称它们为’r’和’n’。它们被用作换行标志,但在不同系统中的使用方式不同。以下是不同操作系统使用的换行符:
unix和类Unix系统(如linux):使用’n’作为换行符。 windows和MS-DOS:使用’rn’作为换行符。 Mac OS X之前的系统:使用’r’作为换行符。 Mac OS X:使用’n’作为换行符。
在Linux中查看文件的换行符有许多方法,这里介绍两种常见的方法。
第一种方法是使用”cat -A [Filename]”命令查看,如下图所示,显示的是Windows形式的换行符,其中’r’对应符号’^M’,’n’对应符号’$’。
第二种方法是使用vi编辑器查看,并使用”set list”命令显示特殊字符:
细心的朋友可能会发现’^M’没有显示出来,这里提醒大家,需要用VI的二进制模式(”vi -b [FileName]”)打开文件,才能显示出’^M’:
接下来介绍三种将Windows换行符转换为Linux格式的方法,选择哪一种取决于个人喜好,当然你也可以选择其他方法。
(1)第一种方法是使用VI:在VI的普通模式下打开文件,然后运行命令”set ff=unix”,即可将Windows换行符转换为Linux换行符,非常简单!命令中的”ff”全称为file encoding。
(2)第二种方法是使用”dos2unix”命令,如下所示:
[root@localhost test]# dos2unix gggggggg.txt
dos2unix: converting file gggggggg.txt to UNIX format …
(3)第三种方法是使用sed命令删除’r’字符:
[root@localhost test]# sed -i ‘s/r//g’ gggggggg.txt
通常,我们需要处理一批文件,比如一个目录下的所有文件都需要转换。我编写了一个简单的脚本来遍历目录和子目录下的所有文件,并将其转换为Linux换行格式。代码如下:
#!/bin/sh
#Checkinput
#Check Whether the input is valid
#0 means not valid
CheckInput()
{
ret=1;
Check the number of parameter
And Check whether the argument is a folder
if [ $# -lt 1 ]
then
echo “Please use the command like ./dos2u.sh [Folder]”;
ret=0
elif [ ! -d $1 ]
then
echo “Please use an invalid Folder as the shell argument”;
ret=0
fi
return $ret;
}
#TraverseFolder
#Traser all the files under the folder
TraverseFolder()
{
oldPath=
pwd
cd $1;
for file in
ls
do
if [ -d $file ]
then
TraverseFolder $file;
else
echo $file;
sed -i ‘s/r//g’ $file
dos2unix $file
fi
done
cd $oldPath;
}
CheckInput $*
if [ $ret -ne 1 ]
then
exit -1
fi
TraverseFolder $1
这个脚本主要是作为练习使用,当然可以用更简单的方式解决,比如使用find命令结合dos2unix命令。大家可以自己尝试一下。我这样写的主要目的是为了方便以后扩展功能,当然还有一些bug需要修复,^_^。
参考资料:
- How To Convert Files from Linux/Unix format to Windows and Vice Versa:
https://www.php.cn/link/e1cb9ebefa419a866a655b1a74d4b0df
- Difference Between n and r?
https://www.php.cn/link/312e53ccba0b2ddfefd4a1f05b55bcdd
- 美国信息交换标准代码