用python爬学校官网,发现抓取的中文乱码,所以就 pip 下了个 chardet 包,感觉挺好。
先用 chardet.detect(str) 判断字符格式,然后搭配着 unicode(str, "字符格式").encode("UTF-8") ,将 GBK 、 GB2312 等格式的字符转为 UTF-8。
这样咱们的中文就可以正常显示啦! ^-^
用python爬学校官网,发现抓取的中文乱码,所以就 pip 下了个 chardet 包,感觉挺好。
先用 chardet.detect(str) 判断字符格式,然后搭配着 unicode(str, "字符格式").encode("UTF-8") ,将 GBK 、 GB2312 等格式的字符转为 UTF-8。
这样咱们的中文就可以正常显示啦! ^-^