asp.net

去除HTML代码的类

2013-04-11
  1. using System.Text.RegularExpressions;     //包含正则表达式   
  2.   
  3.      public static string NoHTML(string Htmlstring) //去除HTML标记   
  4.       {   
  5.           //删除脚本   
  6.           Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]×?>.×?</script>""", RegexOptions.IgnoreCase);   
  7.           //删除HTML   
  8.           Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]×)>""", RegexOptions.IgnoreCase);   
  9.           Htmlstring = Regex.Replace(Htmlstring, @"([/r/n])[/s]+""", RegexOptions.IgnoreCase);   
  10.           Htmlstring = Regex.Replace(Htmlstring, @"-->""", RegexOptions.IgnoreCase);   
  11.           Htmlstring = Regex.Replace(Htmlstring, @"<!--.×""", RegexOptions.IgnoreCase);   
  12.   
  13.           Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);""/"", RegexOptions.IgnoreCase);   
  14.           Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);""&", RegexOptions.IgnoreCase);   
  15.           Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);""<", RegexOptions.IgnoreCase);   
  16.           Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);"">", RegexOptions.IgnoreCase);   
  17.           Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);"" ", RegexOptions.IgnoreCase);   
  18.           Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);""/xa1", RegexOptions.IgnoreCase);   
  19.           Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);""/xa2", RegexOptions.IgnoreCase);   
  20.           Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);""/xa3", RegexOptions.IgnoreCase);   
  21.           Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);""/xa9", RegexOptions.IgnoreCase);   
  22.           Htmlstring = Regex.Replace(Htmlstring, @"&#(/d+);""", RegexOptions.IgnoreCase);   
  23.   
  24.           Htmlstring.Replace("<""");   
  25.           Htmlstring.Replace(">""");   
  26.           Htmlstring.Replace("/r/n""");   
  27.           Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();   
  28.   
  29.           return Htmlstring;   
  30.       }