程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> 基於lucene的案例開發:ClassUtil & CharsetUtil

基於lucene的案例開發:ClassUtil & CharsetUtil

編輯:C++入門知識

基於lucene的案例開發:ClassUtil & CharsetUtil


 


這篇博客主要介紹ClassUtil類和CharsetUtil類。這兩個也是項目中比較常用的類,一個用於指定文件路徑,一個用於檢測文件的編碼方式。


ClassUtil
ClassUtil類中的方法主要是返回class文件所在的文件目錄或工程的根目錄地址,這主要用於指定工程中配置文件的路徑,不至於環境遷移而導致配置文件路徑錯誤。源代碼如下:
/**
 * @Description:  類工具
 */
package com.lulei.util;

public class ClassUtil {
	
	/**
	 * @param c
	 * @return
	 * @Description: 返回類class文件所在的目錄
	 */
	public static String getClassPath(Class c) {
		return c.getResource("").getPath().replaceAll("%20", " ");
	}
	
	/**
	 * @Description: 
	 * @param c
	 * @param hasName 是否顯示文件名
	 * @return 返回類class文件的地址
	 */
	public static String getClassPath(Class c, boolean hasName) {
		String name = c.getSimpleName() + ".class";
		String path = c.getResource(name).getPath().replaceAll("%20", " ");
		if (hasName) {
			return path;
		} else {
			return path.substring(0, path.length() - name.length());
		}
	}
	
	/**
	 * @Description: 返回類class文件所在的頂級目錄
	 * @param c
	 * @return
	 */
	public static String getClassRootPath(Class c) {
		return c.getResource("/").getPath().replaceAll("%20", " ");
	}
	
	public static void main(String[] args) {
		System.out.println(ClassUtil.getClassPath(ClassUtil.class, true));
		System.out.println(ClassUtil.getClassPath(Math.class, true));
		System.out.println(ClassUtil.getClassRootPath(Math.class));
	}
}


main函數運行結果如下:
\

CharsetUtil
CharsetUtil類是基於cpdetector第三方jar包實現的編碼檢測工具類。如果接觸過實際項目,你絕對會碰到程序讀取文件亂碼或更新運營文件網站就無法正常顯示等一系列問題,而這些問題多數都是因為文件編碼問題導致的。當然這個工具類,在下一部分的爬蟲程序中也扮演著重要的角色。源程序如下:
 /**  
 *@Description:  編碼方式檢測類  
 */ 
package com.lulei.util;  

import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.nio.charset.Charset;

import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;
  
public class CharsetUtil {
	private static final CodepageDetectorProxy detector;
	
	static {//初始化探測器
		detector = CodepageDetectorProxy.getInstance();
		detector.add(new ParsingDetector(false));
		detector.add(ASCIIDetector.getInstance());
		detector.add(UnicodeDetector.getInstance());
		detector.add(JChardetFacade.getInstance());
	}

	/**
	 * @param url
	 * @param defaultCharset
	 * @Author:lulei  
	 * @return 獲取文件的編碼方式
	 */
	public static String getStreamCharset (URL url, String defaultCharset) {
		if (url == null) {
			return defaultCharset;
		}
		try {
			//使用第三方jar包檢測文件的編碼
			Charset charset = detector.detectCodepage(url);
			if (charset != null) {
				return charset.name();
			}
		} catch (Exception e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		return defaultCharset;
	}
	
	/**
	 * @param inputStream
	 * @param defaultCharset
	 * @return
	 * @Author:lulei  
	 * @Description: 獲取文件流的編碼方式
	 */
	public static String getStreamCharset (InputStream inputStream, String defaultCharset) {
		if (inputStream == null) {
			return defaultCharset;
		}
		int count = 200;
		try {
			count = inputStream.available();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		try {
			//使用第三方jar包檢測文件的編碼
			Charset charset = detector.detectCodepage(inputStream, count);
			if (charset != null) {
				return charset.name();
			}
		} catch (Exception e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		return defaultCharset;
	}
	
	public static void main(String[] args) throws Exception {
		URL url = new URL("http://www.csdn.net");
		System.out.println(CharsetUtil.getStreamCharset(url, "default"));
	}
}


main函數運行結果如下:
\


ps:最近發現其他網站可能會對博客轉載,上面並沒有源鏈接,如想查看更多關於 基於lucene的案例開發 請點擊這裡。或訪問網址www.Bkjia.com

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved