小松鼠 发表于 2008-4-25 14:22

【解决】请教:如何在文本文件中去除所有中文。

有一文本,很长很长,90%是英文和数字。中文不要,保留英文和数字。谢谢!!

[ Edited by小松鼠 on 2008-4-26 13:45 ]

xcode 发表于 2008-4-25 14:30

cxcx 发表于 2008-4-25 14:31

你有支持正则表达式的文本编辑器吗,例如EmEditor或者EditPlus之类,很容易替换的

小松鼠 发表于 2008-4-25 15:53

把#号后面的全去掉

notepad++V4.6应该支持正则表达式,可不会用正则表达式。

xcode 发表于 2008-4-25 15:56

cxcx 发表于 2008-4-25 16:15

回复 #5 xcode 的帖子

这个方法好啊,简单易用。我也学了一招。

fay2003hiend 发表于 2008-4-25 22:44

没写就写了个。附源码

grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

fay2003hiend 发表于 2008-4-25 22:47

右边的参数可以换成别的,用来过滤别的玩意

硬盘是我家 发表于 2008-4-26 08:45

xcode朋友的方法非常简单实用!!!学了一招!
我又想如果没有一致的分列符该如何应对呢?非得去看看头痛的正则表达式??

硬盘是我家 发表于 2008-4-26 08:49

xcode朋友的方法非常简单实用!!!学了一招!
我又想如果没有一致的分列符该如何应对呢?非得去看看头痛的正则表达式??

abiu 发表于 2008-4-26 09:51

学习了。

phoenixnzd 发表于 2008-4-26 12:21

小松鼠 发表于 2008-4-26 13:43

xcode的方法产生的文件392k,fay2003hiend 的方法产生的文件196K.谢谢二位,送上nb以表示感谢!!!

小松鼠 发表于 2008-4-26 13:46

grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

------------------------------
#前的空格,是一定要这个空格的吗?

ycren 发表于 2008-4-26 16:38

^,^学习了,,,

fay2003hiend 发表于 2008-4-26 19:04

Posted by 小松鼠 on 2008-4-26 13:46 http://www.ibmnb.com/images/common/back.gif
grep_txt hosts.txt " #" > new_hosts.txt 就可生成。

------------------------------
#前的空格,是一定要这个空格的吗?

你也看到你文本中#前面是有空格的
如果不加这个空格,则过滤后生成的文件中这些行末尾会有一个空格
页: [1]
查看完整版本: 【解决】请教:如何在文本文件中去除所有中文。