程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> dedeCMS采集過濾規則

dedeCMS采集過濾規則

編輯:PHP綜合
dede采集過程中最麻煩的莫過於采集的正則過濾函數的編寫。說實在的,dede在這點上和很多ASP CMS系統比如說動易等,采集的時候直接選擇幾個選項就可以了,簡單的完成想過濾的東西。不過他們只局限於對文章內容的過濾不是很好。而DEDE卻能對所有采集的字段進行過濾,功能上彌補了易用性的缺陷,期待柏拉圖在後續版本中加上選擇性過濾功能。 下面是在綜合論壇上網友的各種正則的一個全集: {dede:trim} {/dede:trim} {dede:trim}<param([^>]*)>{/dede:trim} {dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim} {dede:trim}<embed([^>]*)>{/dede:trim} {dede:trim}</embed>{/dede:trim} {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim} {dede:trim}<object([^>]*)>{/dede:trim} {dede:trim}</object>{/dede:trim} {dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim} {dede:trim}<OBJECT([^>]*)>{/dede:trim} {dede:trim}</OBJECT>{/dede:trim} {dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim} {dede:trim}<iframe([^>]*)>{/dede:trim} {dede:trim}</iframe>{/dede:trim} {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim} {dede:trim}<IFRAME([^>]*)>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim} {dede:trim}<font([^>]*)>{/dede:trim} {dede:trim}</font>{/dede:trim} {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim} {dede:trim}<a([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim} {dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim} {dede:trim}<td([^>]*)>{/dede:trim} {dede:trim}</td>{/dede:trim} {dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim} {dede:trim}<tr([^>]*)>{/dede:trim} {dede:trim}</tr>{/dede:trim} {dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim} {dede:trim}<tbody>{/dede:trim} {dede:trim}</tbody>{/dede:trim} {dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim} {dede:trim}<table([^>]*)>{/dede:trim} {dede:trim}</table>{/dede:trim} {dede:trim}<img([^>]*)>{/dede:trim} {dede:trim}<span([^>]*)>{/dede:trim} {dede:trim}</span>{/dede:trim} {dede:trim} {/dede:trim} {dede:trim}<stong>{/dede:trim} {dede:trim}</stong>{/dede:trim}   應用示例一:標題中空格的過濾 經常在采集文章的時候,標題文字裡面有空格,采回來後應用很是麻煩,所以需要在過濾處添加下面正則過濾 {dede:trim} {/dede:trim} 應用示例二:來源作者中連接的過濾 在采集文章的時候,有的系統裡面作者或者來源處都有連接,直接采集的話將連接采集回來了,然後由於這兩個字段有限制,通常會造成需要采集的內容沒有采集回來,所以需要在過濾處添加下面正則過濾   {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}   應用示例三:文章內容中連接以及其他廣告代碼的過濾 這個就不用說了,當需要對所有東西過濾的時候,直接用上面所有的代碼過濾就可以,但是實際應用中,我們只需要對連接、動畫、調用等進行過濾。(這個需要按照對方內容裡面具體含有什麼代碼來具體操作) 一般的只有鏈接,使用二中的代碼進行過濾就可以了,但是實際上一般的網站現在都在內容裡面加有廣告等,所以采取下面的過濾正則就可以完成過濾:   {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim} {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim} {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim} {dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}   應用示例四:過濾GG廣告代碼 其實這個就是在上面的內容過濾,但是很多論壇裡的網友經常問這個,所以單獨作為一個應用列出來: {dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim} 好了,上面四種應用基本上涵蓋了采集的各種應用,掌握了這個,過濾基本上就不用求人了! *
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved