程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> PHP 抓取新浪讀書頻道的小說並生成txt電子書的代碼

PHP 抓取新浪讀書頻道的小說並生成txt電子書的代碼

編輯:PHP綜合
復制代碼 代碼如下:
/* Author: Yang Yu <[email protected]> */
//想看什麼電子書,先去新浪讀書搜索,然後填入對應的參數即可
//http://vip.book.sina.com.cn/
//電子書參數
$array_book[0] = 38884; //小說id
$array_book[1] = 22172; //章節起始id
$array_book[2] = 32533; //章節結束id
$array_book[3] = '中國特種部隊生存實錄:狼牙'; //小說名字

//匹配參數
$title_pre = "/<h1>(.*?)<\/h1>/"; //標題部分
$contents_pre = "/<div id=\"contTxt\" class=\"contTxt1\">(.*?)<\/div>/"; //內容部分

//生成電子書
for( $i = $array_book[1]; $i <= $array_book[2]; $i++){
$url = "http://vip.book.sina.com.cn/book/chapter_{$array_book[0]}_{$i}.html";
$html = file_get_contents($url);
preg_match_all($title_pre,$html,$title);
preg_match_all($contents_pre,$html,$contents);
$fh = fopen($array_book[3].'.txt','a+');
$write_contents = $title[1][0]."\r\n".str_replace('</p>',"\r\n",str_replace('<p>',' ',$contents[1][0]))."\r\n";
if( fwrite($fh,$write_contents) ){
echo '第'.$i.'節抓取完畢< /br>';
}
fclose($fh);
}
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved