程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> ASP.NET >> ASP.NET基礎 >> ASP.net(C#)從其他網站抓取內容並截取有用信息的實現代碼

ASP.net(C#)從其他網站抓取內容並截取有用信息的實現代碼

編輯:ASP.NET基礎
1. 需要引用的類庫
復制代碼 代碼如下:
using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;

2. 獲取其他網站網頁內容的關鍵代碼
復制代碼 代碼如下:
WebRequest request = WebRequest.Create("http://目標網址.com/");
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
//reader.ReadToEnd() 表示取得網頁的源碼
TextBox1.Text = reader.ReadToEnd();

3. 獲取其他網站網頁源碼之後通過{正則表達式}帥選有用信息
復制代碼 代碼如下:
MatchCollection TitleMatchs = Regex.Matches(reader.ReadToEnd(), @"發表評論</a></p></div><div class=""body"">([\s\S]*?)</div><div class=""share"">", RegexOptions.IgnoreCase | RegexOptions.Multiline);
foreach (Match NextMatch in TitleMatchs)
{
s += "<br>" + NextMatch.Groups[1].Value;
TextBox1.Text += "\n" + NextMatch.Groups[1].Value;
}

RegexOptions.IgnoreCase: 表示不區分大小寫, 一般網站源碼大小寫不敏感所以取消之.

RegexOptions.Multiline: 表示對多行內容進行帥選.
4. 大功告成
不上圖了! 影響不好! 見諒見諒
文中代碼打包下載
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved