1、有一个程序如图,读取一个网站的源码存入文件并打印在控制台窗口。


4、将文件改为gb2312编码时直接报错,原因是该网站源码中有一个字符是python不能转换的,该字符是\xee。

6、解决办法,data = r.text.encode("latin1").decode("gbk&鳎溻趄酃quot;)将读取的源码采用函数encode()转换为latin1编码,再将该编码转换为gbk,再利用发下代码with open('c:/test.txt','w',encoding='utf-8') as f: f.write(data)写入文件。注意写入时的encoding是utf-8的编码。
