程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

python爬蟲入門案例day03:攝圖網

編輯:Python

python爬蟲入門案例day03:攝圖網

目標網站

攝圖網

目標網址

https://699pic.com/tupian/3d-yuanyuzhouxunixianshi.html

開發環境

1、window11
2、python3.7
3、PyCharm Community Edition 2021.2.1
4、雙核浏覽器
5、浏覽器自帶開發者工具

網站分析

攝圖網是一個包含各種樣式圖片的網站,通過python爬蟲我們可以實現批量下載該網站上的圖片,網站如圖:


抓包,打開浏覽器自帶的開發者工具,刷新網頁,找到第一個數據包,就是該網頁的網絡請求數據包,如圖:

對元素標簽進行定位,發現圖片鏈接都在img標簽的src屬性值中,但是鏈接不完整,需要後期進行拼接,如圖:

使用正則表達式對所有圖片的鏈接進行匹配,str_image = ‘data-original=“(.*?)”’

源代碼

注意事項

保存二進制數據時,不要使用encoding參數,否則會報錯如下:ValueError: binary mode doesn’t take an encoding argument


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved