程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 編程語言 >> .NET網頁編程 >> ASP.NET >> ASP.NET基礎 >> 使用pdfbox實現pdf文本提取和合並功能示例

使用pdfbox實現pdf文本提取和合並功能示例

編輯：ASP.NET基礎

有時我們需要對PDF文件進行一些處理，提取文本、合並等。以前我們使用A-PDF Text Extractor免費工具,為什麼不自己寫一個呢?
現在我們可以使用PDFBox-0.7.3這個開源類庫. 下載解包後引用:
復制代碼代碼如下:
PDFBox-0.7.3.dll
IKVM.GNU.Classpath.dll

新建一個項目,代碼很簡單:
復制代碼代碼如下:
public static string ParseToTxtStringUsingPDFBox(string filename){
PDDocument doc = PDDocument.load(filename);
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}

獲得這個textString,再把它們寫成磁盤文件就可以了, 像這樣的方法:
復制代碼代碼如下:
public static void WriteToTextFile(string str,string txtpath)
{
if (string.IsNullOrEmpty(txtpath))
throw new ArgumentNullException("Output file path should not be Null");
using (var txtWriter = new StreamWriter(txtpath))
{
txtWriter.Write(str);
txtWriter.Close();
}
}

其它的功能您可以自行發揮了. 這個類庫目前支持:

PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF

上一頁:使用linq讀取分隔符文本文件
下一頁:mstest實現類似單元測試nunit中assert.throws功能

ASP.NET基礎

ASP.NET技巧：為Blog打造個性日歷

日歷控件是.net自帶的控件之一，功能強大，在很多項目開發中

ASP.NET AJAX 4.0的模版編程(Template Programming)介紹

ASP.NET AJAX 4.0 模版的使用 1. Intr

asp.net中一款極為簡單實用的圖表插件(jquery)

一柱狀圖 (1) 豎狀單行條形直方圖

在ASP.NET 2.0中操作數據之四十四：DataList和Repeater數據排序（三）

第七步: 在自定義分頁的Repeater 裡添加排序功能　　

LINQ操作數組代碼（交集,並集,差集,最值,平均,去重復）

下面以數組為例，展示一些常用LINQ操作。復制代碼代碼如

密碼綁定至密碼文本框中(TextMode設為Password)

一般情況之下TextBox的TextMode設為Passwo

相關文章

閱讀排行榜

asp.net導出excel的簡單方法實例 ASP.NET 2.0,C#----圖像特效處理 asp.net項目開發中用到的小技巧 asp.net登錄驗證碼實現方法 KindEditor圖片上傳的Asp.net代碼實例 Visual Studio快速開發以及Visual Studio 2010新功能介紹分析10個ASP.NET控件最有用的屬性詳解 ASP.NET 調用百度搜索引擎的代碼 asp.net 生成靜態頁時的進度條顯示 asp.net中MVC借助Iframe實現無刷新上傳文件實例如何創建一個AJAXControlToolKit的擴展控件

熱門圖文

Java網絡編程從入門到精通（4）：DNS緩存 PHP性能優化大全(整理) C#基礎-變量與常量（2），使用C語言讀取properties文件V1.0 委托揭秘 linux編程-android源碼編譯失敗，出現以下圖問題理解C#生成驗證碼的過程 asp.net(c#)實現從sqlserver存取二進制圖片的代碼

欄目導航

ASP.NET基礎關於ASP.NET

Copyright © 程式師世界 All Rights Reserved