程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 編程語言 >> 更多編程語言 >> 更多關於編程 >> python采集百度百科的方法

python采集百度百科的方法

編輯：更多關於編程

　　本文實例講述了python采集百度百科的方法。分享給大家供大家參考。具體如下：

　　?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 #!/usr/bin/python # -*- coding: utf-8 -*- #encoding=utf-8 #Filename:get_baike.py import urllib2,re import sys def getHtml(url,time=10): response = urllib2.urlopen(url,timeout=time) html = response.read() response.close() return html def clearBlank(html): if len(html) == 0 : return '' html = re.sub('r|n|t','',html) while html.find(" ")!=-1 or html.find(' ')!=-1 : html = html.replace(' ',' ').replace(' ',' ') return html if __name__ == '__main__': html = getHtml('http://baike.baidu.com/view/4617031.htm',10) html = html.decode('gb2312','replace').encode('utf-8') #轉碼 title_reg = r'<h1 class="title" id="[d]+">(.*?)</h1>' content_reg = r'<div class="card-summary-content">(.*?)</p>' title = re.compile(title_reg).findall(html) content = re.compile(content_reg).findall(html) title[0] = re.sub(r'<[^>]*?>', '', title[0]) content[0] = re.sub(r'<[^>]*?>', '', content[0]) print title[0] print '#######################' print content[0]

　　希望本文所述對大家的Python程序設計有所幫助。

上一頁:Java中break、continue、return語句的使用區別對比
下一頁:python實現數值積分的Simpson方法實例分析

更多關於編程

談C#與C++在靜態構造函數上的區別

在C#中，類的靜態構造函數用於在使用類之前進行相關的初始化工

notepad++正則表達式

　　正則表達式是一個查詢的字符串，它包含一般的字

哪門編程語言影響力最大？

TIOBE每個月都會給編程語言排名，從側面說明哪些編程語言使

在Mac OS上部署Nginx和FastCGI以及Flask框架的教程

　　這篇文章主要介紹了在Mac OS上部署Ng

Python線程詳解

　　這篇文章主要介紹了Python線程詳解,本文

如何編寫NSIS自定義界面腳本

　　微軟公司推出的近兩款操作系統Windows

相關文章

閱讀排行榜

Python中title()方法的使用簡介 VB 通過Grid Report 顯示時間 Java導出txt文件的方法 python計算牛頓迭代多項式的方法 PHP的數據庫操作類介紹Python中的floor()方法 C#數字圖像處理的3種方法用Python實現通過哈希算法檢測圖片重復的教程 win7 iis7.5 Request 對象錯誤 ASP 0104 : 80004005 Java中StringUtils工具類的一些用法實例 ajaxForm和ajaxSubmit 粘貼就可用示例代碼

熱門圖文

hdu 2317 Nasty Hacks HDU 4288 Coder（12年成都網絡賽-線段樹） asp.net中Request.QueryString與Request.Param的區別分析 .net 讀取非標准配置文件的小例子 JavaBeans至XML的相互轉換 PHP技巧--通過COM使用ADODB 總體了解C#（5 事件）2 Solaris下core dump文件的分析方法

欄目導航

匯編語言 Delphi Groovy WebSphere Rational Python Ruby 編程解疑編程綜合問答更多關於編程編程問題解答

Copyright © 程式師世界 All Rights Reserved