程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

怎麼使用Python代碼實現模擬百度搜索

編輯:Python

怎麼使用Python代碼實現模擬百度搜索

本文小編為大家詳細介紹“怎麼使用Python代碼實現模擬百度搜索”,內容詳細,步驟清晰,細節處理妥當,希望這篇“怎麼使用Python代碼實現模擬百度搜索”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

1. 獲取百度搜索接口

地址欄中有很多參數,但實際有用的參數只有 wd ,只需要保留這一個參數即可,其余刪掉。

url = 'https://www.baidu.com/s?wd=士別三日wyx'

2. 指定搜索內容

搜索內容肯定不能寫死,需要由用戶「輸入」

kw = input('百度一下:')url = 'https://www.baidu.com/s?wd=' + kw

3. UA偽裝

利用百度的接口發送「請求」,獲取響應內容。

大部分網站都會對用戶的請求進行「過濾」,以防止惡意攻擊行為,比如查看是否是浏覽器發出的請求

「UA偽裝」是指在HTTP請求頭中添加 User-agent ,偽裝成浏覽器的請求,網站檢查請求頭時,發現有UA請求頭,就會認為是浏覽器的請求,從而放行。

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0',}response = requests.get(url=url, headers=headers)

4. 將響應內容寫入文件

響應的內容實際上就是構成頁面的 HTML 代碼,將響應內容寫入HTML文件,就獲得了百度搜索的響應頁面

fileName = 'a.html'with open(fileName, 'w', encoding='utf-8') as fp:    fp.write(response.text)

5. 使用浏覽器打開頁面

頁面生成以後肯定不能再手動打開,那也太low了,使用默認「浏覽器」自動打開生成的頁面

webbrowser.open(fileName)

源碼如下

import webbrowserimport requestskw = input('百度一下:')url = 'https://www.baidu.com/s?wd=' + kwheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0',}response = requests.get(url=url, headers=headers)fileName = 'a.html'with open(fileName, 'w', encoding='utf-8') as fp:    fp.write(response.text)webbrowser.open(fileName)

輸入想要百度的內容,按下回車

即可自動使用默認浏覽器打開搜索結果的頁面

讀到這裡,這篇“怎麼使用Python代碼實現模擬百度搜索”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速雲行業資訊頻道。


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved