ASP.NET过滤采集内容的链接URL
在网上采集文章内容,固定有网址连接,而你想过滤掉这些连接,只留连接标题,下面告诉你怎么做?要使用到正则表达式,先看例子:
1、过滤特定URL
string aa = "<a href="http://www.sina.com/zt/"><strong>新浪网</a>文字文字文字<a href="http://www.sina.com">测试新浪</a>";//需要替换的字符串
Response.Write(System.Text.RegularExpressions.Regex.Replace(aa, "<a href="http://www.sina.com/zt/(.*?)">(.*?)</a>", "$2"));
说明下:$2 表示 前面的第2个(.*?)
2、过滤所有连接
//过滤链接
string Htmlstring="<a href=http://baidu.com>百度</a>|<a href=http://www.hao123.com>hao123</a>;
Htmlstring = Regex.Replace(Htmlstring, @"<a href=(.*?)>(.*?)</a>", "$2",
RegexOptions.IgnoreCase);