程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> 抓取並下載CSS中所有圖片文件的php代碼

抓取並下載CSS中所有圖片文件的php代碼

編輯:關於PHP編程

這篇文章的亮點是,正則式更加復雜鳥,╮(-_-)╭,再就是 Copy 函數的灰常強大的一個用法。
> 話說剛才聽 NsYta 說小邪的主題太白了,杯具。最近太忙,沒有空,不然就自己搞一個新主題。

一. 抓取 CSS 中的圖片:
> 1. 首先做好准備工作:
> 第一步,先把 CSS 原本的路徑存到 $url 變量裡,然後把 CSS 的內容保存在 abc.css 中。
> 因為考慮到經常碰到多個 CSS 文件的狀況,所以小邪沒有直接填一個 CSS 路徑。
> 而是把幾個 CSS 文件的內容合並到一起,全部塞到 abc.css 文件裡面即可,嘎嘎嘎。

$data = file_get_contents('abc.css');

> 接著讀取 CSS 文件的內容到 $data 變量中,然後用正則式把域名給取出來。
> 因為這裡考慮到很多圖片文件用到了相對根路徑,比方說 /img/1.gif 和 img/1.gif。
> 然後 CSS 原地址在 http://www.jb51.net/css/ 那麼上面的兩個文件位置是不同的。

> 第一個文件在 /upload/201109/20110926143903807.gif,因為它的路徑用到了相對根路徑。
> 而第二個在 /upload/201109/20110926143903169.gif,它的路徑只是普通的相對路徑。
復制代碼 代碼如下:
$url = 'http://www.jb51.net/css/'; preg_match('/(.*\/\/.*?)\//',$url,$host);
//這裡用正則式把 http://www.jb51.net/ 給取出來,後端不要忘記加斜槓喔。
//.*? 是懶惰匹配,也就是能匹配得越少就匹配越少的內容,這樣就不會取過頭了。
$host = $host[1];


2. 把圖片存儲文件夾建好:
> 小邪這裡用了 is_dir 來確定文件夾是否存在,存在的話,就不用再建立第二遍了。
> 呵呵,順便說下,is_file 函數可以確定此文件是否為正常文件,也可以確定是否存在。
> 但 file_exists() 優越一點,因為某次看到有人在 Webmasterworld.com 上面討論過。

if (!is_dir('img')) { mkdir('img'); }

> 3. 用正則式把圖片相對地址取出來:

$regex = '/url\(\'{0,1}\"{0,1}(.*?)\'{0,1}\"{0,1}\)/';
//這裡用正則式匹配出圖片地址,要考慮三種情況,即 url(1.gif) url('1.gif') url("1.gif")。
//這三種寫法都是可以使用的,所以咱們就用上面的正則把裡面的 1.gif 取出來。
//\'{0,1} 表示單引號可能出現1次或0次,\" 則表示雙引號可能出現1次或0次。
//中間必須使用懶惰匹配,不然取出來的就是 1.gif" 而不是 1.gif 鳥,O(∩_∩)P。
preg_match_all($regex,$data,$result);

> 4. 處理這些圖片:

> 首先使用一個循環,把上面是用正則提取出來的第一分支內容數組給處理一下。
> 額,這裡的第一分支表示正則式裡面的第一個括號來著,呵呵,以此類推。

foreach ($result[1] as $val) { }

> 然後是用正則式判定,因為還要考慮到這樣 /upload/201109/20110926143903807.gif。
> 這樣是使用了完整的路徑了,而不是想其他的一樣是 /img/1.gif 或者 img/1.gif。
> 所以單獨判斷一下,然後接著判斷這兩個,看看是 /img/1.gif 還是 img/1.gif。
復制代碼 代碼如下:
if (preg_match('/^http.*/',$val)) { $target = $val; }
else if (preg_match('/^\/.*/',$val)) { $target=$host.$val; }
else { $target=$url.$val; }
echo $target."<br/>\r\n";

> 最後把文件名取出來,即 /img/1.gif 中的 1.gif,用於保存文件。
復制代碼 代碼如下:
preg_match('/.*\/(.*\.\D+)$/',$val,$name);

> 然後咱們就可以開始下載了,這裡要介紹一個強大的 Copy 函數用法。
復制代碼 代碼如下:
if (!is_file('./img/'.$name[1])) {
$imgc = file_get_contents($target);
$handle = fopen('./img/'.$name[1],'w+');
fwrite($handle,$imgc);
fclose($handle);
}

> 上面那個是咱們的老方法了,嘎嘎,很麻煩。某次,小邪突然發現 Copy 的強大。
> Copy 居然也可以下載,所以可以輕松使用下面的代碼來處理,上面的可以退休鳥。
復制代碼 代碼如下:
if (!is_file('./img/'.$name[1])) {
copy($target,'./img/'.$name[1]);
}

> 5. 完整源代碼:

> 使用的時候把 $url 填好即可,然後把所有 CSS 內容存到 abc.css 中即可。
復制代碼 代碼如下:
<?php
$url = 'http://www.jb51.net/css/';
$data = file_get_contents('abc.css');
preg_match('/(.*\/\/.*?)\//',$url,$host);
$host = $host[1];
if (!is_dir('img')) { mkdir('img'); }
$regex = '/url\(\'{0,1}\"{0,1}(.*?)\'{0,1}\"{0,1}\)/';
preg_match_all($regex,$data,$result);
foreach ($result[1] as $val) {
if (preg_match('/^http.*/',$val)) { $target = $val; }
else if (preg_match('/^\/.*/',$val)) { $target=$host.$val; }
else { $target=$url.$val; }
echo $target."<br/>\r\n";
preg_match('/.*\/(.*\.\D+)$/',$val,$name);
if (!is_file('./img/'.$name[1])) {
copy($target,'./img/'.$name[1]);
}
}?>

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved