程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> 總結php刪除html標簽和標簽內的內容的方法

總結php刪除html標簽和標簽內的內容的方法

編輯:PHP綜合
經常扒別人網站文章的坑們;我是指那種批量式采集的壓根不看內容的,少不了都會用到刪除html標簽的函數;這裡介紹3種不同用途上的方法;

$str='<div><p>這裡是p標簽</p><img src="" alt="這裡是img標簽"><a href="">這裡是a標簽</a><br></div>';
1:刪除全部或者保留指定html標簽

php自帶的函數strip_tags即可滿足要求,

使用方法:strip_tags(string,allow);

string:需要處理的字符串;

allow:需要保留的指定標簽,可以寫多個;

<?php
echo strip_tags($str,'<p><a>');
?>
//輸出:<p>這裡是p標簽</p><a href="">這裡是a標簽</a>
次函數的優點是簡單粗暴,但是缺點也很明顯;如果有一大堆標簽;而我只是想刪除指定的某一個;那要寫很多需要保留的標簽; 所以有了第二個方法;

2:刪除指定的html標簽

使用方法:strip_html_tags($tags,$str);

$tags:需要刪除的標簽(數組格式)

$str:需要處理的字符串;

<?php
function strip_html_tags($tags,$str){
$html=array();
foreach ($tags as $tag) {
$html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i";
}
$data=preg_replace($html, '', $str);
}
echo strip_html_tags(array('p','img'),$str);
?>
//輸出<div>這裡是p標簽<a href="">這裡是a標簽</a><br></div>;
3:刪除標簽和標簽的內容

使用方法:strip_html_tags($tags,$str);

$tags:需要刪除的標簽(數組格式)

$str:需要處理的字符串;

<?php
function strip_html_tags($tags,$str){
$html=array();
foreach ($tags as $tag) {
$html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/';
}
$data=preg_replace($html,'',$str);
}
echo strip_html_tags(array('a','img'),$str);
?>
//輸出<div><p>這裡是p標簽</p><img src="" alt="這裡是img標簽"><br></div>;
很多網站文章裡面會帶上網站名和鏈接,比如<a href="http://www.baijunyao.com">白俊遙博客</a>;這個函數就是專治這種; 別拿這個函數采集本站啊;不然保證不打死你;

4:終極函數,刪除指定標簽;刪除或者保留標簽內的內容;

使用方法:strip_html_tags($tags,$str,$content);

$tags:需要刪除的標簽(數組格式)

$str:需要處理的字符串;

$ontent:是否刪除標簽內的內容 0保留內容 1不保留內容

<?php
/**
* 刪除指定的標簽和內容
* @param array $tags 需要刪除的標簽數組
* @param string $str 數據源
* @param string $content 是否刪除標簽內的內容 默認為0保留內容 1不保留內容
* @return string
*/
function strip_html_tags($tags,$str,$content=0){
if($content){
$html=array();
foreach ($tags as $tag) {
$html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/';
}
$data=preg_replace($html,'',$str);
}else{
$html=array();
foreach ($tags as $tag) {
$html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i";
}
$data=preg_replace($html, '', $str);
}
return $data;
}
echo strip_html_tags(array('a'),$str,1);
?>
//輸出<div><p>這裡是p標簽</p><img src="" alt="這裡是img標簽"><br></div>;
前面扯了那麼多;其實最後這個函數才是干貨;一口氣搞定各種標簽刪除的疑難雜症不費勁;
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved