需要提取的內容如下:
代碼如下: <a href="http://baidu.com">http://baidu.com</a>這是第一個A標簽, <a href="http://blog.baidu.com">成長腳印-專注於互聯網發展</a>這是第二個A標簽。 http://www.jb51.net這是第一個需要被提取的URL地址, http://blog.baidu.com這是第二個需要被提取的URL地址'。 <img border="0" alt="" src="http://baidu.com/css/sitelogo_zh-cn.gif">,這是一個IMG標簽 類似微博中的自動提取URL為超鏈接地址。即內容提取出來添加A標簽,轉換成真正的超鏈接。網上搜索了很久,沒有找到一個切實可行的解決方案。大都只是簡單的提取URL(A標簽和IMG標簽內的地址也被提取替換了),並不能滿足以上需求。正則表達式中也沒發現能夠實現提取時過濾掉A標簽的方法。於是轉換了一下思路,“曲線救國”。即,先將所有的A標簽和IMG標簽正則替換為某一個統一的標記,然後再提取URL地址替換為超鏈接,最後再將統一的標記還原替換為以前的A標簽和IMG標簽便解決了。 代碼如下: function linkAdd($content){ //提取替換出所有A標簽(統一標記<{link}>) preg_match_all('/<a.*?href=".*?".*?>.*?</a>/i',$content,$linkList); $linkList=$linkList[0]; $str=preg_replace('/<a.*?href=".*?".*?>.*?</a>/i','<{link}>',$content); //提取替換出所有的IMG標簽(統一標記<{img}>) preg_match_all('/<img[^>]+>/im',$content,$imgList); $imgList=$imgList[0]; $str=preg_replace('/<img[^>]+>/im','<{img}>',$str); //提取替換標准的URL地址 $str=preg_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_/+.~#?&//=]+)','<a href="