使用场景:需要去除txt文本中的空格、数字、特定字母等。
需要修改的txt文本叫做:train.txt
修改之后保存成:train_output.txt
# ecoding=utf-8 ifn = r"train.txt" ofn = r"train_output.txt" infile = open(ifn,'rb') outfile = open(ofn,'wb') for eachline in infile.readlines(): #去掉文本行里面的空格、\t、数字(其他有要去除的也可以放到' \t1234567890'里面) lines = filter(lambda ch: ch not in ' \t1234567890', eachline) outfile.write(lines) # 写入train_output.txt(此处是一股脑的全写进去,并没有做任何的分行处理) infile.close outfile.close
以上这篇python 去除txt文本中的空格、数字、特定字母等方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。