批量转换文档到纯文本txt文件的时候,格式都会搞得乱七八糟。运气好的话分段不会错,但是文件里会有很多空行,一般都是软件太傻,行间距大一点就当成空了一段。
清洁文本的时候,空行需要删掉。可是一个文件夹里上千个txt文件,一个文件里到处都是空行,怎么删?
凡是这种重复劳动,不需要脑子的活,就一定要找脑子笨而又不抱怨的人做,就是计算机没错了。
处理txt纯文本文件,最强大的软件之一,是EmEditor,运作轻巧敏捷而又功能强大丰富,支持多文档搜索替代和正则表达式。贵是贵了点,但脑力劳动者一定要支持脑力劳动者,入正版!
多文档搜索替代能解决批量处理。接下来用正则表达式定位空行就好了。
所谓空行,就是这一行没有可见的内容,但是可能有空格、制表符等等不可见内容。一个空行的正则表达式为:
^[\s]*\n
按照正则表达式的语法解释:^ 表示一个段落开始了,在这个段落里有[\s],即不可见的符号,也就是空白字符,包括空格、制表符、换页符等等。有多少个呢?有n个,所以是[\s]*,表示把前面的子表达式重复零次或多次。之后,\n是换行符,表示这一行结束。
操作方法:
- 1. 点开功能栏“搜索”,选“在文件中替换”
- 2. 按照下图,查找“^[\s]*\n”,替换为空,就等于删除。文件夹选择需要处理的txt文件所在的文件夹,而且一定要勾选“使用正则表达式”,保险起见,也可以勾选“保存备份”。
完成!