f1=open('论语-网络版.txt','r+')
f2=open('论语-提取版.txt','w+')
for l in f1.readlines():
list=[]
for i in l:
if i not in ['\n',' ']:
list.append(i)
if list!=[]:
f2.writelines(''.join(list)+'\n')
f1.close()
f2.close()
每次都报错,报错内容如下:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence
python3中用的是Unicode编码,不是可以向所有的编码进行兼容吗?而且我头部已经指定了编码
那是读取文件的字符编码问题
把open的那两句改成这样:
open('论语-网络版.txt','r+',encoding='UTF-8')