程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> 編程綜合問答 >> firefox-小弟想寫個可以解析js的網絡爬蟲,C++,不知如何下手,故在此請教各位大神

firefox-小弟想寫個可以解析js的網絡爬蟲,C++,不知如何下手,故在此請教各位大神

編輯:編程綜合問答
小弟想寫個可以解析js的網絡爬蟲,C++,不知如何下手,故在此請教各位大神

小弟我曾經寫過HttpClient的網絡爬蟲
但是那種爬蟲對於html內部內嵌的js無能為力,有的js會有跳轉指令

還有的js會對部分html代碼混淆(有個公布http代理的網站,看網頁源代碼基本是亂的,全部是document.write)

所以想到利用開源的浏覽器實現真實模擬訪問+抓取正確內容(總之就是要實現真實的訪問)
查詢了c++的js引擎有duktape(這個好像只是js執行器),v8
浏覽器內核有webkit
但是確實不知該怎麼下手
不知有哪位朋友做過類似的東西,可否給些提示?
萬分感謝

最佳回答:


c++用webkit來加載頁面執行js,然後得到頁面的dom內容等。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved