程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 編程語言 >> 更多編程語言 >> 編程綜合問答 >> str-Python 爬蟲 index溢出

str-Python 爬蟲 index溢出

編輯：編程綜合問答

Python 爬蟲 index溢出

import urllib2
import re
from xlsxwriter.workbook import Workbook
from io import BytesIO
import json

workbook = Workbook('images.xlsx')
print "FETCHING YHD ..."
u = urllib2.urlopen('http://www.yhd.com/')
data = u.read()

ol_tag = re.findall(r'

.*?', data, flags = re.DOTALL)
li_tag = re.findall(r'', ol_tag[0], flags = re.DOTALL)

yhd_link = []
for item in li_tag:
link = re.findall(r'(?<=wi=").*?(?=")', item)
yhd_link += link

yhd_href_link = []
for item in li_tag:
link = re.findall(r'(?<=href=").*?(?=")', item)
yhd_href_link += link

worksheet = workbook.add_worksheet('yhd')

print "Total: " + str(len(yhd_link))
for i in range(len(yhd_link)):
print "yhd => Downloading Picture " + str(i+1)
image_data = BytesIO(urllib2.urlopen(yhd_link[i]).read())
if i % 4 == 0:
worksheet.set_row(i, 240)
else:
worksheet.set_row(i, 120)
worksheet.insert_image('A' + str(i+1), yhd_link[i], {'image_data': image_data, 'url': yhd_href_link[i]})

print "COMPLETE YHD ..."
workbook.close()

Traceback (most recent call last):
File "C:\Python27\project\banner\banneryhd.py", line 16, in
li_tag = re.findall(r'', ol_tag[0], flags = re.DOTALL)
IndexError: list index out of range

最佳回答：

ol_tag = re.findall(r'.*?', data, flags = re.DOTALL)

這裡如果沒有找到結果下一句話裡的ol_tag[0] 就會導致索引錯誤，所以你應該加保護語句，沒找到就給出相應的提示

li_tag = re.findall(r'', ol_tag[0], flags = re.DOTALL)

上一頁:android-安卓no compatible targets were found
下一頁:spring 配置文件-spring 一個配置文件如何被多個項目引用

編程綜合問答

mysql-如何把MySQL表的列名輸出到PHP頁面顯示？

如何把MySQL表的列名輸出

javascript-關於網頁布局顯示的問題(界面顯示不完全)

關於網頁布局顯示的問題(界面

編程-我按照書上的步驟做到這裡，就不卡住了，能幫忙嗎？鼠標該點哪裡？

我按照書上的步驟做到這裡，就

springmvc-spring mvc做上傳圖片，文件小於10k就不生成臨時文件了

spring mvc做上傳圖

沒有數據-C#水晶報表不顯示數據？

C#水晶報表不顯示數據？

編程-隨機生成10個100位素數

隨機生成10個100位素數

相關文章

閱讀排行榜

android-如何以程序化的方式隱藏 imageview reverse-c語言中有關字符串轉置的問題 wifi-路由器如何擴大網絡范圍 js-兩個div都隱藏的，當一個div顯示的時候另一個div也跟著顯示方法-類的使用問題，請教！浏覽器-關於servlet如何停止的問題 java- 輸入十個數，只輸出不一樣的數（用JAVA）（多種方法）（已解決） web api-.net基於AttributeRouting的Web API路由設置的POST DELETE方法 js-請教a標簽click事件問題 android-如何在編輯框添加一個按鈕？ android listview-android listView中按鈕設為不可點

熱門圖文

PHP優於Node.js的五大理由分享購物車中數據的存放方式讓程序在前端顯示和最小化時在系統欄裡取出任意日期內的所有日期，可以區分大小月 JSP中的JSTL、POJO、MVC php 圖片加水印與上傳圖片加水印php類 .net core 1.1.0 MVC 控制器接收Json字串（JObject對象） (一），jsonjobject LINQ（3）：使用LINQPad學習LINQ

欄目導航

匯編語言 Delphi Groovy WebSphere Rational Python Ruby 編程解疑編程綜合問答更多關於編程編程問題解答

Copyright © 程式師世界 All Rights Reserved