用python爬学校官网,发现抓取的中文乱码,所以就 pip
下了个 chardet
包,感觉挺好。
先用 chardet.detect(str)
判断字符格式,然后搭配着 unicode(str, "字符格式").encode("UTF-8")
,将 GBK
、 GB2312
等格式的字符转为 UTF-8
。
这样咱们的中文就可以正常显示啦! ^-^
用python爬学校官网,发现抓取的中文乱码,所以就 pip
下了个 chardet
包,感觉挺好。
先用 chardet.detect(str)
判断字符格式,然后搭配着 unicode(str, "字符格式").encode("UTF-8")
,将 GBK
、 GB2312
等格式的字符转为 UTF-8
。
这样咱们的中文就可以正常显示啦! ^-^