Java中應用正則表達式獲得網頁中一切圖片的途徑。本站提示廣大學習愛好者:(Java中應用正則表達式獲得網頁中一切圖片的途徑)文章只能為提供參考,不一定能成為您想要的結果。以下是Java中應用正則表達式獲得網頁中一切圖片的途徑正文
/**
* 從HTML源碼中提取圖片途徑,最初以一個 String 類型的 List 前往,假如不包括任何圖片,則前往一個 size=0 的List
* 須要留意的是,此辦法只會提取以下格局的圖片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic
* @param htmlCode HTML源碼
* @return <img>標簽 src 屬性指向的圖片地址的List聚集
* @author Carl He
*/
public static List<String> getImageSrc(String htmlCode) {
List<String> imageSrcList = new ArrayList<String>();
Pattern p = Pattern.compile("<img//b[^>]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(htmlCode);
String quote = null;
String src = null;
while (m.find()) {
quote = m.group(1);
src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2);
imageSrcList.add(src);
}
return imageSrcList;
}