UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position

  • 2017-09-04
  • 301
  • 0

在写python脚本爬取网页html代码时,使用函数decode('GBK').encode('utf-8')转码时,有时会报类似这样的错误: UnicodeDecodeError: 'gbk' codec can't decode bytes in position

加上 ignore参数就没问题了

html = urllib.urlopen('爬取页面地址' ).read().decode('GBK','ignore').encode('utf-8','ignore')

评论

还没有任何评论,你来说两句吧