程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

python 網絡爬蟲 爬取網頁數據時網站字符集不是默認編碼“UTF-8”,導致爬取出來的網頁數據出現其它語言的亂碼情況,需要手動添加網頁相對應的字符集encoding=“ ”

編輯:Python

在對網頁數據爬取時會出現字符集不對應而影響爬取出來的數據是一些看不懂的語言

 

本次解決方法使用的是某電影網站

 

所以我們要添加上網頁對應的字符集編碼

字符集編碼存放的兩個位置

1.浏覽器網頁的源代碼靠前位置有一個叫做 charset=      的東西這就是字符集編碼

 

 2.在爬取出來的頁面源代碼也可以找到charset=       這個字符集編碼

 

 

                                        ##添加指定字符集編碼代碼##

resp.encoding = 'gb2312'

 


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved