shevonWang's Blog

Python字符编码

用python爬学校官网,发现抓取的中文乱码,所以就 pip 下了个 chardet 包,感觉挺好。

先用 chardet.detect(str) 判断字符格式,然后搭配着 unicode(str, "字符格式").encode("UTF-8") ,将 GBKGB2312 等格式的字符转为 UTF-8

这样咱们的中文就可以正常显示啦! ^-^

(≧▽≦) 开心!