十月二十四日,1024,程序員的節日~ 祝大家 節日快樂了!


今晚別加班,下面給你吃!
不要委屈了自己,晚上回家吃頓好的把。
一直都對爬蟲,數據方面挺感興趣的,也爬過很多數據。當然了,必須使用的是c#了~~
今天公布一個很早之前做的小偷程序。數據來自世紀佳緣。
Demo: find.izk.cloud


我是直接在世紀佳緣的頁面找到接口地址,然後構造相關參數,進行post請求,然後數據就出來了...就這樣出來了!!!
像這種公開了接口,還沒做任何限制的,簡直是...不要太簡單!
接口地址:http://search.jiayuan.com/v2/search_v2.php
可能需要注意就是參數的構造,貼個代碼片段:
1 string postdata = string.Format("sex={4}&key=&stc=1:{0},2:{1}.{2},23:1&sn=default&sv=1&p={3}&f=select&listStyle=bigPhoto&pri_uid=0&jsversion=v5", area, ages, agee, pageindex,sex);
地區,年齡段,分頁,性別
因為是早期的項目了,Http請求最早用的別人封裝好的一個HttpHelper。
1 HttpHelper http = new HttpHelper();
2 HttpItem item = new HttpItem()
3 {
4 URL = "http://search.jiayuan.com/v2/search_v2.php",//URL 必需項
5 Method = "Post",//URL 可選項 默認為Get
6 Timeout = 100000,//連接超時時間 可選項默認為100000
7 ReadWriteTimeout = 30000,//寫入Post數據超時時間 可選項默認為30000
8 IsToLower = false,//得到的HTML代碼是否轉成小寫 可選項默認轉小寫
9 Cookie = "",
10 UserAgent = "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36",//用戶的浏覽器類型,版本,操作系統 可選項有默認值
11 Accept = "text/html, application/xhtml+xml, */*",// 可選項有默認值
12 ContentType = "application/x-www-form-urlencoded; charset=UTF-8",
13 Postdata = postdata,
14 };
15 HttpResult result = http.GetHtml(item);
16 string html = result.Html;
當然了,爬了那麼多的數據,我也有一套自己封裝的httphelper~~之後有時間也分享給大家。
目前,項目已托管在GitHub上,有需要的朋友可以拿去~
代碼地址