程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

想看,但電腦沒網怎麼辦,python教你保存整本成TXT~

編輯:Python

各位大佬好鴨!又是我小熊貓啦
咱這次直接上代碼 開始之前先解釋下:

模塊:

requests >>> pip install requests
parsel >>> pip install parsel
re

環境:

解釋器: python 3.8
編輯器: pycharm

代碼實現:

發送請求
獲取數據
解析數據
保存數據

代碼 點擊此處領取

代碼裡一些東西被我刪了好過審核,有需要得小伙伴可看評論或私聊我領取~

import requests # 發送請求
import re
# 偽裝
headers = {
'cookie': '',
'referer': '',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = ''
html_data = requests.get(url=url, headers=headers).text
info_list = re.findall('<h2 class="book_name"><a href="(.*?)" target="_blank" data-eid=".*?" data-cid=".*?" alt=".*?" title=".*?">(.*?)</a></h2>', html_data)
for link, title in info_list:
link = 'https:' + link
# print(link, title)
# 1. 發送請求
response = requests.get(url=link, headers=headers)
# 2. 獲取數據
link_data = response.text
# print(html_data)
# 3. 解析數據
# 網頁標簽 <p></p> <a></a> <div></div> <img />
# <div class="read-content j_readContent" id=".*?">(.*?)</div>
text = re.findall('<div class="read-content j_readContent" id=".*?">(.*?)</div>', link_data, re.S)[0]
text = text.replace('<p>', '\n')
text = title + '\n\n' + text
print(text)
# 4. 保存數據
with open('網戀女友竟是九天神凰.txt', mode='a', encoding='utf-8') as f:
f.write(text)

好了,我的這篇文章寫到這裡就結束啦!

有更多建議或問題可以評論區或私信我哦!一起加油努力叭(ง •_•)ง

喜歡就關注一下博主,或點贊收藏評論一下我的文章叭!!!

我是小熊貓,咱下篇文章見


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved