程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> 基於PHP與XML的PDF文檔生成技術

基於PHP與XML的PDF文檔生成技術

編輯:關於PHP編程

摘要

本論文簡要介紹了PHP、XML、PDF等技術的原理以及它們的應用情況。力圖運用PHP面向對象的特性,構建出一套基於PHP和XML的在線PDF文檔生成系統。文中詳細探討了整個系統的組成部分以及各自的實現過程。並在最後給出一個運用這套系統實現的動態創建報表的實例。

Abstract

This article introduced the fundamentls of PHP,XML and PDF and their application situation at present,expecting to build a PHP&XML-based dynamic PDF documents creating system through the PHP's OO features. Furthermore,we discussed in detail on the components of the whole system and their respective realizing methods. Finally,we represented an example of creating reports dynamically using this system.

 

關鍵詞

PHP      XML       XSLT       DTD      PDF   

 

 

1.       引言

        在信息技術飛速發展的時代,無論政府、企業還是個人,他們對如何通過信息技術提高自身工作效率,節省開支具有濃厚的興趣。他們急切要找到一種優秀的技術,可以把傳統上以紙張為媒介的文件、報表、票單據、手冊、申請書等等等等轉化為一種可以非常方便的在互聯網以及內部網絡自動生成、傳播、下載、浏覽、打印的電子文檔。而如今最為熱門的“無紙化辦公”、“電子商務”等等都將以此為基礎。

 

        這種文檔格式就Adobe公司的PDF(可移植文檔格式),它已是全世界電子版文檔分發的公開實用標准 。   任何浏覽器只要安裝Acrobat reader 5.0 的插件,便可以自由浏覽、下載、打印PDF文檔。PDF無疑具有其它電子文檔格式不可比擬的優越性。

       

我們知道B/S系統作為當前以及將來最流行的一種軟件架構,可以很好的實現各種基於浏覽器的Web應用程序,而PHP作為一種優秀的Web編程語言,特別適合開發用於處理用戶表單輸入,查詢數據庫等針對浏覽器用戶的前端應用程序。由於PHP是開放源碼的,這使得它的使用比其它同類的Web腳本語言更為廣泛,它的功能也在不斷的擴充和完善之中。現在最新的PHP版本已經可以很好的支持PDF,XML等。通過系統提供的API,我們能非常快捷的生成PDF文檔,而最具魅力的是,我們可以通過PHP,查詢數據庫或XML數據文件並將結果插入所生成的PDF文檔之中,形成各種具有絕佳的浏覽和打印效果的報表、單據、手冊等。

        

不難看出,結合PHP、XML、PDF三項技術,構造出一種可以在線動態生成PDF文檔的系統是極具現實意義的,其主要表現在:

 

    ·文檔可以在網絡上生成,並通過網絡分發。節省大量的人力物力。具有精確美觀的打印效果,真正實現了無紙化辦公。

    ·電子商務交易過程中的各種票據、 憑證都可以通過PHP腳本程序在線生成,並轉為PDF格式發送給客戶。

   ·企業MIS系統中各種面向打印的報表的生成,並可直接通過浏覽器獲得,無須安裝任客戶端,使用極為方便。

·以前文件流轉是"先打印,後分發",每年花在印刷上的費用是政府、企業沉重的負擔。而PDF文檔"先散發,後打印",接件人可以在浏覽後,再按需要打印。印刷的費用大大減少。而且,很有利於環保事業。

2.       課題簡介

 

        在某些軟件項目的開發過程中,我們遇到一個很關鍵的問題就是大量面向打印的報表、單據的生成。我們知道,HTML適合浏覽,但不適合格式規范的打印。因此必需找到一種可以由PHP動態生成,且具有良好的打印效果的文檔格式。而這正是我研究這個課題的最直接的需求。 明白了這一點,我們就很自然的想到了PDF以及PHP的PDF支持庫PDFLib。通過PDFLib提供的一套API,我們可以很容易在PHP腳本動態創建PDF文檔。但是這只是一套非常基本的函數,只能進行一些簡單的輸出,如線條、文本、矩形框等,而且每輸出一個對象之前,都要為其指定坐標。如果直接使用來這套函數來做一些實際的應用,比如復雜的報表的生成,其困難程度是難以想象的。我們不可能為創建這樣一個報表,而事先算好各個元素的坐標,並把單元格用矩形框一個一個的畫出來。

       

所以,我們第一步要做的就是利用PHP面向對象的編程方法將這套基本的API進行封裝,以產生多個實用的具有獨立功能的對象模塊(如page對象、table對象、text對象等)。應該說,這一塊是此項目最基本,也是最重要的部分。我參考並部分采用

了國外一些類似的開放源碼的程序,在此基礎上開發出了一套功能較為強大的類庫。大大簡化了PDF文檔的生成,特別是其中的table對象,可以象HTML中的TABLE標記一樣任意嵌套,輕松快捷的實現各種復雜的表格的繪制(這對動態生成報表是非常有用的)。

 

        生成PDF的問題解決以後,我們面臨了新的問題,舉個例子來說,數據庫查詢頁面如何將包含大量信息的結果集以及其它信息傳給PDF生成頁面? 最初我們想到的方法是通過文本文件傳遞,即在數據庫查詢頁面將數據寫到一個文本文件當中,並對其

中不同類別的數據定義一套區分的標記,PDF生成頁面讀取此文件,將內容插入到PDF中。 但是這樣做,並不可靠。因為在這個文本文件中,我們采用特定的字符(或空格)來分離數據,如果恰好有用數據中也包含同樣的字符或空格呢?可見,以這種方式傳遞數據是有隱患的。其實上面我們提到在文本文件中用不同的標記區分不同類別的數據。而這正是XML技術的思想。何不一步到為采用XML來作為數據傳遞的手段呢? 況且PHP對XML和XSLT具有很好的支持,通過expat解析器,我們可以任意提取XML文檔中的數據,也可以通過PHP的XSLT引擎Sablotron對XML文檔進行任意轉換。

 

首先由“XML生成器”將數據(來自數據庫或用戶輸入等)放到一個符合事先定義好的DTD的XML文檔中,此文檔對其中的數據內容進行描述,不包含任何格式信息。 然後由“XML轉換器”將這個XML文檔轉換成包含顯示樣式信息的另一個XML文檔。 最後由“PDF生成器”讀取這個文檔,根據其中的內容和顯示樣式生成相應的PDF文檔。在這一個過程中,我要做的是再次運用 PHP的面向對象特性,構建出可重用的類:XMLWriter(生成XML文件)、XMLParser(解析XML文件)以及XMLTransformer(對XSLT函數的封裝)。

    

系統構建成功後,就是具體的應用了。主要是進銷存系統中各種報表、單據的動態生成。

 

3.       可行性分析

 

開發一個功能強大、適應性好的PDF文檔在線生成系統,必然需要彈性大、靈活性

高的開發模型。我們提出的基於PHP和XML的PDF文檔在線生成技術,為各種面向打印的應用,如報表、單票據、手冊等提供了新的思路。我們用PHP來查詢數據庫,處理用戶輸入,並在此基礎上生成原始的XML文檔;然後通過XSLT將該XML文檔加上顯示層信息,生成另外一個新的XML文檔。最後利用“PDF生成器”將這個新的XML文檔轉化為相應格式的PDF文檔。對於最初生成的XML文檔,我可以做二度利用,因為該文檔包含了所有的有用信息,可以非常容易的被其它應用程序處理。如果我們想改變信息在PDF文檔顯示的樣式,可以非常容易的實現。只要專門人員修改相應的XSL樣式單文件即可,不需要對其它環節做任何修改,具有非常好的靈活性。除此之外,PHP、XML、PDF三者都具有極好的可移植性,可以跨平台使用。 對該系統的研究並非憑空想象的,它建立在直接的需求之上的。到目前為止,這套技術已經投入實際應用,收到了極為滿意的效果。實踐證明,運用PHP和XML開發出的一套在線PDF文檔生成系統具有廣闊和非常實際的應用前景。

 

4 總體設計

 

本課題主要完成四個基礎模塊的設計及編程實現。這四個類模塊分別為PDFCreator、XMLWriter、XMLTransfomer以及XMLParser。它們分布於系統的各個環節之中,具有各自獨立的功能和作用,是系統的核心組成部分(見下圖)。

 

系統構成圖

 

從圖中可見,四者在本系統中又是緊密聯系的有機整體。XMLWriter作為系統的輸

入接口,負責生成原始的XML數據文件。該文件的格式規范(DTD)由我們事先編寫好,而XMLWriter按照該DTD生成相應的XML文檔。這個XML文檔接著交由XMLTransfomer處理,XMLTransfomer其實是對PHP提供的XSLT函數的封裝,它一般接受兩個參數,其中之一是需要轉換的XML文檔,另一個是相應的XSL樣式單文件。XMLTransfomer正是根據該樣式單文件將原始的XML文檔轉化為符合這個樣式單樣式的另一個XML文檔(包含信息在PDF文檔中放置的格式)。然後,這個新的XML文件繼續交由“PDF生成器”進行處理。而這個過程有分為兩個部分:首先,必需對這個XML文檔進行解析,提取其中所需的數據,這一步有XMLParser來完成,XMLParser對此XML文檔進行解析,將其轉化為一棵對象樹,XML文檔中每一個節點都是一個對象,每個對象都有各自的屬性(即相應節點的所有信息)。這樣一來,我們可以非常方便的訪問這個XML文檔的任意內容。之後,要做的就是將該XML文檔中讀出的信息(包括格式信息和內容信息)用PDFCreator轉化為最終的PDF文檔的輸出。

 

5.應用示例

  

         在這裡,我們運用上面的這套系統創建一個面向打印的報表——“庫存歷史事

表”。這個報表包含的信息有:報表名稱(協和庫存歷史事務表)、單位、建表日期等,另外就是從數據庫中提取的數據了,品名(LLPROD)、批號(LLOC)、等級(LCLS)、倉庫(LWHS)、庫位(LLOCT)、數量(LNUM)、日期(LDATE)等。假設我們已經用XMLWriter生成了下面的原始XML文檔(report.xml):

          <?xml version="1.0" encoding="gb2312"?>

<report>

              <report_param>

                 <title>庫存歷史事務表</title>

                 <unit>平方米</unit>

                 <date>20020611</date>

             </report_param>

             <report_records>

                  <record>

                           <llprod>W2308</llprod>

                           <lloc>1234</lloc>

                            <lcls>a</lcls>

                            <lwhs>01</lwhs>

                            <lloct>0001</lloct>

                            <lnum>200</lnum>

                            <ldate>20020609</ldate>

                    </record>

                    <record>

                            <llprod>W2307</llprod>

                            <lloc>4321</lloc>

                            <lcls>a</lcls>

                            <lwhs>01</lwhs>

                            <lloct>0001</lloct>

                            <lnum>100</lnum>

                            <ldate>20020609</ldate>

                     </record>

            </report_records>

</report>

 

該文檔包含了這張報表的所有有用信息,我們需要用特定的XSL樣式單為其加上格式信息。XMLTransformer執行轉換的代碼如下:

<?php

    $xslt = new XMLTransformer ("report.xsl", "report.xml");

    $xslt->apply("pdfreport.xml");

?>

 

轉換後生成的新的XML文檔如下:

 

<?xml version="1.0" encoding="gb2312"?>

<pdfreport pagetype="a4" pagesize="25" top="20" bottom="20" left="20" right="20">

  <head>

     <line top="5" bottom="5" size="50%" linetype="single" show="false"/>

     <text fontsize="30" fontlaguage="cn" align="center">庫存歷史事務表</text>

     <line top="5" bottom="30" size="80%" linetype="double" show="true"/>

     <text fontsize="12" fontlaguage="cn" align="left">單位:平方米</text>

  </head>

 

  <body>

     <table>

       <tr><th>品名</th><th>批號</th><th>等級</th><th>倉庫</th><th>庫位</th><th>數量</th><th>日期</th></tr>

        <tr><td>W2308</td><td>1234</td><td>a</td><td>01</td><td>0001</td><td>200</td><td>20020609</td></tr>     

    <tr><td>W2307</td><td>4321</td><td>a</td><td>01</td><td>0001</td><td>100</td><td>20020609</td></tr>

     </table>

   </body>

   <foot>

      <line top="5" bottom="5" size="50%" linetype="single" show="false"/>

      <text fontsize="12" fontlaguage="cn" align="center">建表日期:20020611</text>

   </foot>

</pdfreport>

        用XMLParser對該XML文檔解析後,得到一個包含所有信息的對象樹,我們可以非常方便的訪問其中的內容。生成的PDF報表如下圖:

 

 

 程序片斷如下:

 

<?   include( "../include/pc_init.inc" );?>

<?   include( "xmlparser.inc" );

<?

$xmlobject=getRootNode("report.xml");

// get the attrs of root element

$pageSet=$xmlobject->attrs;

// get the report-head

$head=$xmlobject->nodes[0];

// code ignored...

?>

<?

 

  function draw_line(&$parent,$line){

    $line = &pc_create_object( $parent, "line" );

    $line->pc_set_linestyle( $line->attrs["LINETYPE"]);

    $line->pc_set_width( $line->attrs["SIZE"] );

    $line->pc_set_alignment( "center" );

    if($line->attrs["SHOW"]==false){

        $line->pc_set_linecolor( "white" );

    }

        $line->pc_set_margin( array( "top" => $line->attrs["TOP"], "bottom" => $line->attrs["BOTTOM"], "left" => 0, "right" => 0 ) );

   }

 

  function draw_text(&$parent,$text){

    // code ignored...

  }

  function draw_table(&$parent,$table){

       // code ignored...

  }

 

  function addhead(&$parent,$head){

    for($i=0;$i< $head->n;$i++){

        switch ($head->nodes[$i]->name){

            case "LINE":draw_line($parent,$head->nodes[$i]);break;

            case "TEXT":draw_text($parent,$head->nodes[$i]);break;

            }

        }

   }

//..

?>

<?

 // Create a PDF Document

  $PDF = &pc_create_pdf( array( "Author" => "cyman", "Title" => "a report example" ) );

 // Create an A4-format page

  $Page1 = &pc_create_page( $PDF, $pageSet["PAGETYPE"]);

  addhead($Page1,$head);

  $PDF->pc_draw();

?>

 

 

6.總結

          在幾個月來的畢業設計過程中,雖然忙碌,卻非常充實。通過對一個實際的課題的分析,研究,論證,實現。感覺收獲頗多。目前,這套系統已投入使用,收到了非常滿意的效果,可以很容易的做出美觀實用的報表、單據等。但是,由於時間上的倉促以及自己水平的有限,這套系統仍有許多不足之處。其中最遺憾就是,沒有能定義出一套對各種文檔(包括報表、單據、手冊等等)都通用的XML標記,並編制通用的程序將這個XML文檔轉化為PDF,就如同浏覽器解析HTML一樣。這樣就不必為每一種文檔都定義各自的XML標記並編寫相對應的轉換程序,可以大大提高工作效率。

      雖然畢業設計已經結束,但是我將會今後的日子裡繼續這個課題的研究。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved