程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#入門知識 >> .net(C#)從html中提取中文字(正則表達式)

.net(C#)從html中提取中文字(正則表達式)

編輯:C#入門知識

用正則表達式提取html中的純文本,代碼實現如下: 

using System.Text.RegularExpressions;      

 private string StripHT(string strHtml)  //從html中提取純文本
        {
            Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);
            string strOutput = regex.Replace(strHtml, "");//替換掉"<"和">"之間的內容
            strOutput = strOutput.Replace("<", "");
            strOutput = strOutput.Replace(">", "");
            strOutput = strOutput.Replace("&nbsp;", "");
            return strOutput;
        }

    

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved