程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> 編程綜合問答 >> 編碼-python抓取網頁,網頁源碼無法解碼

編碼-python抓取網頁,網頁源碼無法解碼

編輯:編程綜合問答
python抓取網頁,網頁源碼無法解碼

抓取的網頁:http://esf.nanjing.fang.com/
浏覽器查看源碼顯示content="text/html; charset=gb2312"
python chardet 結果顯示{'confidence': 0.0, 'encoding': None}
通過page=page.decode('gb2312','ignore').encode('utf-8'),解碼後print為亂碼

求問應該如何對這個網頁的源代碼進行解碼從而抓取需要的信息?

最佳回答:


python3 +.
需要安裝urllib3.

你也可以試試,直接轉換成gb2312.下面的代碼親測可用。

 http = urllib3.PoolManager()
    r=http.request('GET','http://esf.nanjing.fang.com/')
    print((r.data).decode('gb2312','ignore'))
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved