在項目開發中,尤其是企業的業務系統中,對文檔的操作是非常多的,有時幾乎給人一種錯覺的是”這個系統似乎就是專門操作文檔的“。畢竟現在的很多辦公中大都是在PC端操作文檔等軟件,在這些龐大而繁重的業務中,單單依靠人力去做文檔的操作需要的代價是巨大的,比如數據統計,數據分析等業務要求。這就需要我們在開發系統時,應該盡量減少使用者的一些工作量,例如將數據直接寫入文檔,獲取網頁信息後直接存為PDF保存,以便以後繼續查看。軟件開發的目地是對使用者便捷,但這一要求未必對開發者來說也是便捷的。
在前面介紹過一款開源免費的組件DocX,這個組件主要是對文檔進行操作。另一種對Excel操作的組件NPOI組件。今天介紹一款.NET Office操作組件Spire,這是一個企業級的.NET Office操作組件,但是這是一款不免費也不開源的組件。可能很多人聽到這裡就不想再讀下去了,的確,在國內畢竟免費才可以占用主流市場,因為很多客戶希望減少成本,所以希望采用免費的工具。
作為開發者,我也會有這樣的觀點,不過有的時候也會思考收費與免費的工具到底哪一個好,其實這樣的思考到最後似乎是沒有意義的,因為事物存在既有價值,免費的可以減少成本,收費的可以獲取穩定而安全的支持,各有優勢和特點。任何一個軟件的生成都是需要成本的,因為任何軟件都是人員開發出來的,需要支付對應的成本,此處不收錢,其他的地方也會收費。無論收費與免費的哪一個好,技術總是沒有錯的,收費的東西,我們也可以了解,做一個技術儲備。
今天要介紹的一款組件有收費的部分和免費的部分,但是這款軟件的功能的確比較的強大,使用起來也比較簡單,因為要收費的東西,畢竟需要做到人性化,不然誰會出錢去買,畢竟便宜而好用的東西很少。此組件的使用方式很簡單,官方提供了比較完備的操作demo,所以今天的文章只做為一個引子。
由於Spire的組件較多,今天就用Spire.PDF for .NET做個引子,不一定收費就沒有客戶會選擇,如果需要穩定的服務支持,收費的組件是可以考慮的,或者遇到土豪客戶,也可以在項目中使用一下,畢竟使用起來很便捷。
一.Spire.PDF for .NET組件概述:
Spire.PDF for .NET是一個專業的PDF組件,用於在.NET應用程序中創建,編寫,編輯,處理和閱讀PDF文件,而不需要任何外部依賴。 使用這個.NET PDF庫,您可以實現豐富的功能從頭開始創建PDF文件或完全通過C#/ VB.NET處理現有的PDF文檔,而無需安裝Adobe Acrobat。
.NET PDF API支持許多豐富的功能,例如安全設置(包括數字簽名),PDF文本/附件/圖像提取,PDF合並/拆分,元數據更新,段,圖像/圖像繪制和插入,表創建 以及處理和導入數據等。
此外,Spire.PDF for .NET可以應用於使用C#/ VB.NET以高質量輕松地將文本,圖像和HTML轉換為PDF。
以下是一個官方給出的組件解析圖:

Spire.PDF for .NET支持將HTML,RTF,XPS,文本和圖像轉換為具有高效性能的PDF文檔。 開發人員可以將PDF轉換為Word,XPS,SVG,EMF,JPG,PNG,BMP,TIFF,文本格式。 此外,隨著Spire.Doc for .NET和Spire.XLS for .NET,開發人員可以將Word(Doc / Docx),Excel(Xls / Xlsx)和XML轉換為PDF。
此組件的功能還是非常強大的,每個開發人員都知道,產品做得不好,想要客戶的錢還是很難的。看一下組件的主要功能:
1.文本格式,多語言支持,文本對齊等。
2.筆和畫筆將形狀元素,文本,圖像繪制成PDF文檔。
3.圖層,透明圖形,顏色空間和條形碼創建可以呈現為PDF文檔。
4.PDF / A-1b和PDF / x1a:2001合規性,可以應用這兩種標准。
5.添加標量/矢量圖像和掩碼,並將它們放在指定的位置。
6.Spire.PDF for .NET可支持表和表樣式
7.插入交互式元素,包括注釋,操作,JavaScript,附件,書簽和指定地點和外觀。
以上對組件的相關背景做了一個簡單的介紹,並且對組件的功能和使用情形做了簡單的羅列。
二.Spire.PDF for .NET相關類的解析:
在這裡主要介紹Spire的Spire.PDF組件部分,此組件有免費的和收費的兩個版本,免費的版本在功能沒有收費的多,但是穩定性和實用性還是較高的。我們具體看一下此組件的主要的類和方法,這裡是主要介紹PDF的操作,就先看一下有關PDF的操作類和方法。
這裡看以下命名空間的主要類:




以上的方法中只是操作PDF部分類,由於包含的類較多,過大的介紹篇幅就顯得多余,在對PDF的操作中提供了較多的方法,因此在功能上會較為的豐富,使用起來也較為的便捷。
1.PdfDocument類:聲明PDF文檔:
(1).PdfDocument類的構造函數:
public PdfDocument(); public PdfDocument(string filename); public PdfDocument(byte[] bytes); public PdfDocument(Stream stream); public PdfDocument(string filename, string password); public PdfDocument(byte[] bytes, string password); public PdfDocument(Stream stream, string password);
該類提供了7個構造函數的重載版本,對應的參數類型就不做詳細的介紹
(2).PdfDocument.LoadFromHTML():加載HTML頁面:
public void LoadFromHTML(string Url, bool enableJavaScript, bool enableHyperlinks, bool autoDetectPageBreak)
{
// This item is obfuscated and can not be translated.
PdfHtmlLayoutFormat format;
int num;
goto Label_001E;
Label_008F:
num = 0;
Label_0002:
switch (num)
{
case 0:
break;
case 1:
if (!autoDetectPageBreak)
{
format.Layout = PdfLayoutType.OnePage;
format.FitToPage = Clip.Width;
format.FitToHtml = Clip.Height;
num = 2;
}
else
{
num = 3;
}
goto Label_0002;
case 2:
switch ((1 == 1))
{
case 2:
goto Label_008F;
}
if (0 != 0)
{
}
break;
case 3:
format.Layout = PdfLayoutType.Paginate;
format.FitToPage = Clip.Width;
goto Label_008F;
default:
goto Label_001E;
if (1 != 0)
{
}
format = new PdfHtmlLayoutFormat();
num = 1;
goto Label_0002;
}
this.Sections.Add().LoadFromHTML(Url, enableJavaScript, enableHyperlinks, format);
}
2.HtmlConverter名稱空間:Html轉換器。
namespace Spire.Pdf.HtmlConverter
{
public enum AspectRatio
public enum Clip
[ToolboxItem(false)]
public class HtmlConverter : UserControl, sprᰐ, sprᶪ, sprṳ, sprẝ, sprẏ
public enum ImageType
public class PdfHtmlLayoutFormat
}
private Metafile (); static HtmlConverter(); public HtmlConverter(); public int Authenticate(ref IntPtr phwnd, ref IntPtr pszUsername, ref IntPtr pszPassword); public HtmlToPdfResult Convert(string url, ImageType type, int width, int height, AspectRatio aspectRatio); public HtmlToPdfResult Convert(string html, string baseurl, ImageType type, int width, int height, AspectRatio aspectRatio); public HtmlToPdfResult Convert(string url, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password); public Image ConvertToImage(string url, ImageType type); public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type); public Image ConvertToImage(string url, ImageType type, int width); public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width); public Image ConvertToImage(string url, ImageType type, int width, int height); public Image ConvertToImage(string url, ImageType type, string username, string password); public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width, int height); public Image ConvertToImage(string url, ImageType type, int width, int height, AspectRatio aspectRatio); public Image ConvertToImage(string url, ImageType type, int width, string username, string password); public Image ConvertToImage(Stream stream, Encoding encoding, ImageType type, int width, int height, AspectRatio aspectRatio); public Image ConvertToImage(string url, ImageType type, int width, int height, string username, string password); public Image ConvertToImage(string url, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password); [DispId(-5512)] public int CustomizeDownload(); protected override void Dispose(bool disposing); public Image FromString(string html, ImageType type, int width); public Image FromString(string html, string baseUrl, ImageType type); public Image FromString(string html, ImageType type, int width, int height); public Image FromString(string html, string baseUrl, ImageType type, int width); public Image FromString(string html, ImageType type, int width, int height, AspectRatio aspectRatio); public Image FromString(string html, string baseUrl, ImageType type, int width, int height); public Image FromString(string html, string baseUrl, ImageType type, int width, int height, AspectRatio aspectRatio); public Image FromString(string html, string baseUrl, ImageType type, int width, int height, AspectRatio aspectRatio, string username, string password); public Image[] GetImagesFromString(string html, string baseUrl, ImageType type); public int QueryService(ref Guid guidService, ref Guid riid, out IntPtr ppvObject);int sprẏ.GetSecurityId(string pwszUrl, IntPtr pbSecurityId, ref uint pcbSecurityId, ref uint dwReserved); int sprẏ.GetSecuritySite(out IntPtr pSite); int sprẏ.GetZoneMappings(uint dwZone, out IEnumString ppenumString, uint dwFlags); int sprẏ.MapUrlToZone(string pwszUrl, out uint pdwZone, uint dwFlags); int sprẏ.ProcessUrlAction(string pwszUrl, uint dwAction, IntPtr pPolicy, uint cbPolicy, IntPtr pContext, uint cbContext, uint dwFlags, uint dwReserved); int sprẏ.QueryCustomPolicy(string pwszUrl, ref Guid guidKey, out IntPtr ppPolicy, out uint pcbPolicy, IntPtr pContext, uint cbContext, uint dwReserved); int sprẏ.SetSecuritySite(IntPtr pSite); int sprẏ.SetZoneMapping(uint dwZone, string lpszPattern, uint dwFlags); int sprᶪ.GetContainer(object ppContainer); int sprᶪ.GetMoniker(uint dwAssign, uint dwWhichMoniker, object ppmk); int sprᶪ.OnShowWindow(bool fShow); int sprᶪ.RequestNewObjectLayout(); int sprᶪ.SaveObject(); int sprᶪ.ShowObject();
以上是對PDF操作的相關類和方法的查看,由於此軟件為商業軟件,只能查看部分對外公開的代碼,但是從可以查看到的代碼就可以看出其內部實現的復雜度。
三.Spire.PDF for .NET實例:
由於本文主要講解HTML頁面轉換為PDF文檔,所以先提供一種GET請求HTML頁面,以及一種獲取頁面圖片的操作方法。接著介紹創建PDF文檔、Text轉化為PDF, XPS轉換為PDF,Image轉換為PDF等操作方法。
1.創建HTTP的GET請求,獲取網頁信息:
/// <summary>
/// 指定路徑發送GET請求
/// </summary>
/// <param name="getUrl"></param>
/// <returns></returns>
public static string HttpGet(string getUrl)
{
try
{
if (string.IsNullOrEmpty(getUrl))
throw new ArgumentNullException(getUrl);
var request = WebRequest.Create(getUrl) as HttpWebRequest;
if (request == null)
return null;
var cookieContainer = new CookieContainer();
request.CookieContainer = cookieContainer;
request.AllowAutoRedirect = true;
request.Method = "GET";
request.ContentType = "application/x-www-form-urlencoded";
var response = request.GetResponse() as HttpWebResponse;
if (response != null)
{
var instream = response.GetResponseStream();
if (instream == null)
throw new ArgumentNullException("getUrl");
string content;
using (var sr = new StreamReader(instream, Encoding.UTF8))
{
content = sr.ReadToEnd();
}
return content;
}
}
catch (Exception er)
{
throw new Exception(er.Message);
}
return null;
}
2.取得HTML中所有圖片的 URL:
/// <summary>
/// 取得HTML中所有圖片的 URL。
/// </summary>
/// <param name="url">HTML代碼</param>
/// <returns>圖片的URL列表</returns>
public static string HtmlCodeRequest(string url)
{
if (string.IsNullOrEmpty(url))
{
throw new ArgumentNullException(url);
}
try
{
//創建一個請求
var httprequst = (HttpWebRequest)WebRequest.Create(url);
//不建立持久性鏈接
httprequst.KeepAlive = true;
//設置請求的方法
httprequst.Method = "GET";
//設置標頭值
httprequst.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
httprequst.Accept = "*/*";
httprequst.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
httprequst.ServicePoint.Expect100Continue = false;
httprequst.Timeout = 5000;
//是否允許302
httprequst.AllowAutoRedirect = true;
ServicePointManager.DefaultConnectionLimit = 30;
//獲取響應
var webRes = (HttpWebResponse)httprequst.GetResponse();
//獲取響應的文本流
string content;
using (var stream = webRes.GetResponseStream())
{
using (var reader = new StreamReader(stream, Encoding.GetEncoding("utf-8")))
{
content = reader.ReadToEnd();
}
}
//取消請求
httprequst.Abort();
//返回數據內容
return content;
}
catch (Exception ex)
{
throw new Exception(ex.Message);
}
}
3.創建PDF文檔:
PdfDocument doc = new PdfDocument();
doc.LoadFromHTML(url, false, true, true);
doc.Close();
以上沒有將操作組裝為一個方法,由於創建操作較為簡單,所以不做詳細介紹,url為網頁路徑地址。
HtmlConverter.Convert
("http://www.wikipedia.org/","HTMLtoPDF.pdf",
//enable javascript
true,
//load timeout
* 1000,
//page size
new SizeF(612, 792),
//page margins
new PdfMargins(0, 0));
4.Text轉化為PDF:
public static void TextLayout()
{
//Create a pdf document.
PdfDocument doc = new PdfDocument();
// Create one page
PdfPageBase page = doc.Pages.Add();
float pageWidth = page.Canvas.ClientSize.Width;
float y = 0;
//page header
PdfPen pen1 = new PdfPen(Color.LightGray, 1f);
PdfBrush brush1 = new PdfSolidBrush(Color.LightGray);
PdfTrueTypeFont font1 = new PdfTrueTypeFont(new Font("Arial", 8f, FontStyle.Italic));
PdfStringFormat format1 = new PdfStringFormat(PdfTextAlignment.Right);
String text = "Demo of Spire.Pdf";
page.Canvas.DrawString(text, font1, brush1, pageWidth, y, format1);
SizeF size = font1.MeasureString(text, format1);
y = y + size.Height + 1;
page.Canvas.DrawLine(pen1, 0, y, pageWidth, y);
//title
y = y + 5;
PdfBrush brush2 = new PdfSolidBrush(Color.Black);
PdfTrueTypeFont font2 = new PdfTrueTypeFont(new Font("Arial", 16f, FontStyle.Bold));
PdfStringFormat format2 = new PdfStringFormat(PdfTextAlignment.Center);
format2.CharacterSpacing = 1f;
text = "Summary of Science";
page.Canvas.DrawString(text, font2, brush2, pageWidth / 2, y, format2);
size = font2.MeasureString(text, format2);
y = y + size.Height + 6;
//icon
PdfImage image = PdfImage.FromFile(@"..\..\..\..\..\..\Data\Wikipedia_Science.png");
page.Canvas.DrawImage(image, new PointF(pageWidth - image.PhysicalDimension.Width, y));
float imageLeftSpace = pageWidth - image.PhysicalDimension.Width - 2;
float imageBottom = image.PhysicalDimension.Height + y;
//refenrence content
PdfTrueTypeFont font3 = new PdfTrueTypeFont(new Font("Arial", 9f));
PdfStringFormat format3 = new PdfStringFormat();
format3.ParagraphIndent = font3.Size * 2;
format3.MeasureTrailingSpaces = true;
format3.LineSpacing = font3.Size * 1.5f;
String text1 = "(All text and picture from ";
String text2 = "Wikipedia";
String text3 = ", the free encyclopedia)";
page.Canvas.DrawString(text1, font3, brush2, 0, y, format3);
size = font3.MeasureString(text1, format3);
float x1 = size.Width;
format3.ParagraphIndent = 0;
PdfTrueTypeFont font4 = new PdfTrueTypeFont(new Font("Arial", 9f, FontStyle.Underline));
PdfBrush brush3 = PdfBrushes.Blue;
page.Canvas.DrawString(text2, font4, brush3, x1, y, format3);
size = font4.MeasureString(text2, format3);
x1 = x1 + size.Width;
page.Canvas.DrawString(text3, font3, brush2, x1, y, format3);
y = y + size.Height;
//content
PdfStringFormat format4 = new PdfStringFormat();
text = System.IO.File.ReadAllText(@"..\..\..\..\..\..\Data\Summary_of_Science.txt");
PdfTrueTypeFont font5 = new PdfTrueTypeFont(new Font("Arial", 10f));
format4.LineSpacing = font5.Size * 1.5f;
PdfStringLayouter textLayouter = new PdfStringLayouter();
float imageLeftBlockHeight = imageBottom - y;
PdfStringLayoutResult result
= textLayouter.Layout(text, font5, format4, new SizeF(imageLeftSpace, imageLeftBlockHeight));
if (result.ActualSize.Height < imageBottom - y)
{
imageLeftBlockHeight = imageLeftBlockHeight + result.LineHeight;
result = textLayouter.Layout(text, font5, format4, new SizeF(imageLeftSpace, imageLeftBlockHeight));
}
foreach (LineInfo line in result.Lines)
{
page.Canvas.DrawString(line.Text, font5, brush2, 0, y, format4);
y = y + result.LineHeight;
}
PdfTextWidget textWidget = new PdfTextWidget(result.Remainder, font5, brush2);
PdfTextLayout textLayout = new PdfTextLayout();
textLayout.Break = PdfLayoutBreakType.FitPage;
textLayout.Layout = PdfLayoutType.Paginate;
RectangleF bounds = new RectangleF(new PointF(0, y), page.Canvas.ClientSize);
textWidget.StringFormat = format4;
textWidget.Draw(page, bounds, textLayout);
//Save pdf file.
doc.SaveToFile("TextLayout.pdf");
doc.Close();
//Launching the Pdf file.
PDFDocumentViewer("TextLayout.pdf");
}
5.XPS轉換為PDF:
public void XPStoPDF()
{
//xps file
String file = @"..\..\..\..\..\..\Data\Sample4.xps";
//open xps document
PdfDocument doc = new PdfDocument();
doc.LoadFromXPS(file);
//convert to pdf file.
doc.SaveToFile("Sample4.pdf");
doc.Close();
//Launching the Pdf file.
PDFDocumentViewer("Sample4.pdf");
}
6.Image轉換為PDF:
public void ImageToPdf()
{
//Create a pdf document.
PdfDocument doc = new PdfDocument();
// Create one page
PdfPageBase page = doc.Pages.Add();
//Draw the text
page.Canvas.DrawString("Hello, World!",
new PdfFont(PdfFontFamily.Helvetica, 30f),
new PdfSolidBrush(Color.Black),
10, 10);
//Draw the image
PdfImage image = PdfImage.FromFile(@"..\..\..\..\..\..\Data\SalesReportChart.png");
float width = image.Width * 0.75f;
float height = image.Height * 0.75f;
float x = (page.Canvas.ClientSize.Width - width) / 2;
page.Canvas.DrawImage(image, x, 60, width, height);
//Save pdf file.
doc.SaveToFile("Image.pdf");
doc.Close();
//Launching the Pdf file.
PDFDocumentViewer("Image.pdf");
}
以上提供了對網站發起HTTP請求,獲取網站頁面信息,以及采用Spire.PDF組件創建PDF文檔。如果有需要可以直接將HTTP請求獲取到的信息直接加載如Spire.PDF的組件中,
由組件直接將網頁信息轉化為PDF文件,在這裡就不再做更多的贅述,由於官方提供了很完善的demo和操作文檔,在這裡就不再過多的介紹使用方法。
四.總結:
以上介紹了一款收費不開源的組件,沒有更多的深入的去介紹,由於組件不開源,無法進行反編譯,畢竟存在版權問題,如果需要使用到企業級的文檔操作組件,並且公司不缺錢的話,可以使用一下此組件,組件的底層方法封裝度較高,所以在使用的時候,開發者所需要考慮的是如何去使用組件完成功能。
個人認為軟件收費應該是趨勢,畢竟任何軟件都是需要投入,無論是人力成本,還是資金和時間成本。本文雖然是一篇介紹技術的文章,但是也提出了一個所有開發者都在想的問題,在項目開發中到底需不需要使用收費的軟件,其實這個就是看使用環境。