程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> 自己寫的php curl庫實現整站克隆功能

自己寫的php curl庫實現整站克隆功能

編輯:PHP綜合

有時候經常會用到一些在線手冊,比如國內或國外的,有些是訪問速度慢,有些是作者直接吧網站關閉了,有些是服務器總是宕機,所以還是全盤克隆到自己服務器比較爽。

庫特點:

給定一初始連接,初始鏈接以下的層級所有文件會拷貝到本地。
多次克隆可以配置是否覆蓋。
可以配置是否下載圖片。
所有鏈接替換為相對鏈接,所以可以隨便rewrite。
絕對不會出現文件覆蓋等問題。
最NB的特點是,沒有比這更NB的庫了。

SVN:http://svn.phpdr.net/repos/ares/php/library/trunk/lib/CurlMulti/MyCurl/Clone.php

下載:http://xiazai.jb51.net/201502/other/CurlMulti.rar

克隆結果展示(這個克隆操作幾秒鐘就完成了):

克隆源網站:http://www.laruence.com/manual/
克隆結果:http://manual.phpdr.net/yaf/

Demo代碼:
復制代碼 代碼如下:
<?php
class Controller_Spider extends MyYaf_Controller_Base{
 function init(){
  parent::init();
  if(!$this->getRequest()->isCli()){
      Ares_Http::error403();
  }
  include 'CurlMulti/CurlMulti.php';
  include 'CurlMulti/MyCurl.php';
  include 'phpQuery.php';
 }
}

復制代碼 代碼如下:
<?php
class YafdocController extends Controller_Spider {
 function init() {
  parent::init ();
  include 'CurlMulti/MyCurl/Clone.php';
 }
 function indexAction() {
  $url = 'http://www.laruence.com/manual';
  $dir = Yaf_Application::app ()->getAppDirectory () . '/data/manual';
  $cacheDir = $this->getBaseDir () . '/cache/curl';
  if (! is_dir ( $cacheDir )) {
   mkdir ( $cacheDir );
  }
  $curl = new CurlMulti ();
  $curl->maxThread = 10;
  $curl->cache ['enable'] = true;
  $curl->cache ['enableDownload'] = true;
  $curl->cache ['dir'] = $cacheDir;
  $curl->cache ['compress'] = true;
  $clone = new MyCurl_Clone ( $curl, $url, $dir );
  $clone->overwrite = true;
  $clone->start ();
  return false;
 }
}

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved