【解决】请教：如何在文本文件中去除所有中文。

小松鼠 发表于 2008-4-25 14:22

有一文本，很长很长，90%是英文和数字。中文不要，保留英文和数字。谢谢！！

[ Edited by小松鼠 on 2008-4-26 13:45 ]

xcode 发表于 2008-4-25 14:30

cxcx 发表于 2008-4-25 14:31

你有支持正则表达式的文本编辑器吗，例如EmEditor或者EditPlus之类，很容易替换的

小松鼠 发表于 2008-4-25 15:53

把#号后面的全去掉

notepad++V4.6应该支持正则表达式，可不会用正则表达式。

xcode 发表于 2008-4-25 15:56

cxcx 发表于 2008-4-25 16:15

回复 #5 xcode 的帖子

这个方法好啊，简单易用。我也学了一招。

fay2003hiend 发表于 2008-4-25 22:44

没写就写了个。附源码

grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

fay2003hiend 发表于 2008-4-25 22:47

右边的参数可以换成别的，用来过滤别的玩意

硬盘是我家 发表于 2008-4-26 08:45

xcode朋友的方法非常简单实用！！！学了一招！
我又想如果没有一致的分列符该如何应对呢？非得去看看头痛的正则表达式？？

硬盘是我家 发表于 2008-4-26 08:49

xcode朋友的方法非常简单实用！！！学了一招！
我又想如果没有一致的分列符该如何应对呢？非得去看看头痛的正则表达式？？

abiu 发表于 2008-4-26 09:51

学习了。

phoenixnzd 发表于 2008-4-26 12:21

小松鼠 发表于 2008-4-26 13:43

xcode的方法产生的文件392k,fay2003hiend 的方法产生的文件196K.谢谢二位，送上nb以表示感谢！！！

小松鼠 发表于 2008-4-26 13:46

grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

------------------------------
#前的空格，是一定要这个空格的吗？

ycren 发表于 2008-4-26 16:38

^,^学习了，，，

fay2003hiend 发表于 2008-4-26 19:04

Posted by 小松鼠 on 2008-4-26 13:46 http://www.ibmnb.com/images/common/back.gif
grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

------------------------------
#前的空格，是一定要这个空格的吗？

你也看到你文本中#前面是有空格的
如果不加这个空格，则过滤后生成的文件中这些行末尾会有一个空格

页: [1]

专门网's Archiver

【解决】请教：如何在文本文件中去除所有中文。

回复 #5 xcode 的帖子