基于PHP與XML的PDF文檔生成技術(shù)
發(fā)表時間:2024-01-24 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]摘要本論文簡要介紹了PHP、XML、PDF等技術(shù)的原理以及它們的應(yīng)用情況。力圖運用PHP面向?qū)ο蟮奶匦,?gòu)建出一套基于PHP和XML的在線PDF文檔生成系統(tǒng)。文中詳細(xì)探討了整個系統(tǒng)的組成部分以及各自的實現(xiàn)過程。并在最后給出一個運用這套系統(tǒng)實現(xiàn)的動態(tài)創(chuàng)建報表的實例。 AbstractThis art...
摘要
本論文簡要介紹了PHP、XML、PDF等技術(shù)的原理以及它們的應(yīng)用情況。力圖運用PHP面向?qū)ο蟮奶匦,?gòu)建出一套基于PHP和XML的在線PDF文檔生成系統(tǒng)。文中詳細(xì)探討了整個系統(tǒng)的組成部分以及各自的實現(xiàn)過程。并在最后給出一個運用這套系統(tǒng)實現(xiàn)的動態(tài)創(chuàng)建報表的實例。
Abstract
This article introduced the fundamentls of PHP,XML and PDF and their application situation at present,expecting to build a PHP&XML-based dynamic PDF documents creating system through the PHP’s OO features. Furthermore,we discussed in detail on the components of the whole system and their respective realizing methods. Finally,we represented an example of creating reports dynamically using this system.
關(guān)鍵詞
PHP XML XSLT DTD PDF
1. 引言
在信息技術(shù)飛速發(fā)展的時代,無論政府、企業(yè)還是個人,他們對如何通過信息技術(shù)提高自身工作效率,節(jié)省開支具有濃厚的興趣。他們急切要找到一種優(yōu)秀的技術(shù),可以把傳統(tǒng)上以紙張為媒介的文件、報表、票單據(jù)、手冊、申請書等等等等轉(zhuǎn)化為一種可以非常方便的在互聯(lián)網(wǎng)以及內(nèi)部網(wǎng)絡(luò)自動生成、傳播、下載、瀏覽、打印的電子文檔。而如今最為熱門的“無紙化辦公”、“電子商務(wù)”等等都將以此為基礎(chǔ)。
這種文檔格式就Adobe公司的PDF(可移植文檔格式),它已是全世界電子版文檔分發(fā)的公開實用標(biāo)準(zhǔn) 。 任何瀏覽器只要安裝Acrobat reader 5.0 的插件,便可以自由瀏覽、下載、打印PDF文檔。PDF無疑具有其它電子文檔格式不可比擬的優(yōu)越性。
我們知道B/S系統(tǒng)作為當(dāng)前以及將來最流行的一種軟件架構(gòu),可以很好的實現(xiàn)各種基于瀏覽器的Web應(yīng)用程序,而PHP作為一種優(yōu)秀的Web編程語言,特別適合開發(fā)用于處理用戶表單輸入,查詢數(shù)據(jù)庫等針對瀏覽器用戶的前端應(yīng)用程序。由于PHP是開放源碼的,這使得它的使用比其它同類的Web腳本語言更為廣泛,它的功能也在不斷的擴充和完善之中,F(xiàn)在最新的PHP版本已經(jīng)可以很好的支持PDF,XML等。通過系統(tǒng)提供的API,我們能非?旖莸纳PDF文檔,而最具魅力的是,我們可以通過PHP,查詢數(shù)據(jù)庫或XML數(shù)據(jù)文件并將結(jié)果插入所生成的PDF文檔之中,形成各種具有絕佳的瀏覽和打印效果的報表、單據(jù)、手冊等。
不難看出,結(jié)合PHP、XML、PDF三項技術(shù),構(gòu)造出一種可以在線動態(tài)生成PDF文檔的系統(tǒng)是極具現(xiàn)實意義的,其主要表現(xiàn)在:
·文檔可以在網(wǎng)絡(luò)上生成,并通過網(wǎng)絡(luò)分發(fā)。節(jié)省大量的人力物力。具有精確美觀的打印效果,真正實現(xiàn)了無紙化辦公。
·電子商務(wù)交易過程中的各種票據(jù)、 憑證都可以通過PHP腳本程序在線生成,并轉(zhuǎn)為PDF格式發(fā)送給客戶。
·企業(yè)MIS系統(tǒng)中各種面向打印的報表的生成,并可直接通過瀏覽器獲得,無須安裝任客戶端,使用極為方便。
·以前文件流轉(zhuǎn)是"先打印,后分發(fā)",每年花在印刷上的費用是政府、企業(yè)沉重的負(fù)擔(dān)。而PDF文檔"先散發(fā),后打印",接件人可以在瀏覽后,再按需要打印。印刷的費用大大減少。而且,很有利于環(huán)保事業(yè)。
2. 課題簡介
在某些軟件項目的開發(fā)過程中,我們遇到一個很關(guān)鍵的問題就是大量面向打印的報表、單據(jù)的生成。我們知道,HTML適合瀏覽,但不適合格式規(guī)范的打印。因此必需找到一種可以由PHP動態(tài)生成,且具有良好的打印效果的文檔格式。而這正是我研究這個課題的最直接的需求。 明白了這一點,我們就很自然的想到了PDF以及PHP的PDF支持庫PDFLib。通過PDFLib提供的一套API,我們可以很容易在PHP腳本動態(tài)創(chuàng)建PDF文檔。但是這只是一套非;镜暮瘮(shù),只能進(jìn)行一些簡單的輸出,如線條、文本、矩形框等,而且每輸出一個對象之前,都要為其指定坐標(biāo)。如果直接使用來這套函數(shù)來做一些實際的應(yīng)用,比如復(fù)雜的報表的生成,其困難程度是難以想象的。我們不可能為創(chuàng)建這樣一個報表,而事先算好各個元素的坐標(biāo),并把單元格用矩形框一個一個的畫出來。
所以,我們第一步要做的就是利用PHP面向?qū)ο蟮木幊谭椒▽⑦@套基本的API進(jìn)行封裝,以產(chǎn)生多個實用的具有獨立功能的對象模塊(如page對象、table對象、text對象等)。應(yīng)該說,這一塊是此項目最基本,也是最重要的部分。我參考并部分采用
了國外一些類似的開放源碼的程序,在此基礎(chǔ)上開發(fā)出了一套功能較為強大的類庫。大大簡化了PDF文檔的生成,特別是其中的table對象,可以象HTML中的TABLE標(biāo)記一樣任意嵌套,輕松快捷的實現(xiàn)各種復(fù)雜的表格的繪制(這對動態(tài)生成報表是非常有用的)。
生成PDF的問題解決以后,我們面臨了新的問題,舉個例子來說,數(shù)據(jù)庫查詢頁面如何將包含大量信息的結(jié)果集以及其它信息傳給PDF生成頁面? 最初我們想到的方法是通過文本文件傳遞,即在數(shù)據(jù)庫查詢頁面將數(shù)據(jù)寫到一個文本文件當(dāng)中,并對其
中不同類別的數(shù)據(jù)定義一套區(qū)分的標(biāo)記,PDF生成頁面讀取此文件,將內(nèi)容插入到PDF中。 但是這樣做,并不可靠。因為在這個文本文件中,我們采用特定的字符(或空格)來分離數(shù)據(jù),如果恰好有用數(shù)據(jù)中也包含同樣的字符或空格呢?可見,以這種方式傳遞數(shù)據(jù)是有隱患的。其實上面我們提到在文本文件中用不同的標(biāo)記區(qū)分不同類別的數(shù)據(jù)。而這正是XML技術(shù)的思想。何不一步到為采用XML來作為數(shù)據(jù)傳遞的手段呢? 況且PHP對XML和XSLT具有很好的支持,通過expat解析器,我們可以任意提取XML文檔中的數(shù)據(jù),也可以通過PHP的XSLT引擎Sablotron對XML文檔進(jìn)行任意轉(zhuǎn)換。
首先由“XML生成器”將數(shù)據(jù)(來自數(shù)據(jù)庫或用戶輸入等)放到一個符合事先定義好的DTD的XML文檔中,此文檔對其中的數(shù)據(jù)內(nèi)容進(jìn)行描述,不包含任何格式信息。 然后由“XML轉(zhuǎn)換器”將這個XML文檔轉(zhuǎn)換成包含顯示樣式信息的另一個XML文檔。 最后由“PDF生成器”讀取這個文檔,根據(jù)其中的內(nèi)容和顯示樣式生成相應(yīng)的PDF文檔。在這一個過程中,我要做的是再次運用 PHP的面向?qū)ο筇匦,?gòu)建出可重用的類:XMLWriter(生成XML文件)、XMLParser(解析XML文件)以及XMLTransformer(對XSLT函數(shù)的封裝)。
系統(tǒng)構(gòu)建成功后,就是具體的應(yīng)用了。主要是進(jìn)銷存系統(tǒng)中各種報表、單據(jù)的動態(tài)生成。
3. 可行性分析
開發(fā)一個功能強大、適應(yīng)性好的PDF文檔在線生成系統(tǒng),必然需要彈性大、靈活性
高的開發(fā)模型。我們提出的基于PHP和XML的PDF文檔在線生成技術(shù),為各種面向打印的應(yīng)用,如報表、單票據(jù)、手冊等提供了新的思路。我們用PHP來查詢數(shù)據(jù)庫,處理用戶輸入,并在此基礎(chǔ)上生成原始的XML文檔;然后通過XSLT將該XML文檔加上顯示層信息,生成另外一個新的XML文檔。最后利用“PDF生成器”將這個新的XML文檔轉(zhuǎn)化為相應(yīng)格式的PDF文檔。對于最初生成的XML文檔,我可以做二度利用,因為該文檔包含了所有的有用信息,可以非常容易的被其它應(yīng)用程序處理。如果我們想改變信息在PDF文檔顯示的樣式,可以非常容易的實現(xiàn)。只要專門人員修改相應(yīng)的XSL樣式單文件即可,不需要對其它環(huán)節(jié)做任何修改,具有非常好的靈活性。除此之外,PHP、XML、PDF三者都具有極好的可移植性,可以跨平臺使用。 對該系統(tǒng)的研究并非憑空想象的,它建立在直接的需求之上的。到目前為止,這套技術(shù)已經(jīng)投入實際應(yīng)用,收到了極為滿意的效果。實踐證明,運用PHP和XML開發(fā)出的一套在線PDF文檔生成系統(tǒng)具有廣闊和非常實際的應(yīng)用前景。
4 總體設(shè)計
本課題主要完成四個基礎(chǔ)模塊的設(shè)計及編程實現(xiàn)。這四個類模塊分別為PDFCreator、XMLWriter、XMLTransfomer以及XMLParser。它們分布于系統(tǒng)的各個環(huán)節(jié)之中,具有各自獨立的功能和作用,是系統(tǒng)的核心組成部分(見下圖)。
系統(tǒng)構(gòu)成圖
從圖中可見,四者在本系統(tǒng)中又是緊密聯(lián)系的有機整體。XMLWriter作為系統(tǒng)的輸
入接口,負(fù)責(zé)生成原始的XML數(shù)據(jù)文件。該文件的格式規(guī)范(DTD)由我們事先編寫好,而XMLWriter按照該DTD生成相應(yīng)的XML文檔。這個XML文檔接著交由XMLTransfomer處理,XMLTransfomer其實是對PHP提供的XSLT函數(shù)的封裝,它一般接受兩個參數(shù),其中之一是需要轉(zhuǎn)換的XML文檔,另一個是相應(yīng)的XSL樣式單文件。XMLTransfomer正是根據(jù)該樣式單文件將原始的XML文檔轉(zhuǎn)化為符合這個樣式單樣式的另一個XML文檔(包含信息在PDF文檔中放置的格式)。然后,這個新的XML文件繼續(xù)交由“PDF生成器”進(jìn)行處理。而這個過程有分為兩個部分:首先,必需對這個XML文檔進(jìn)行解析,提取其中所需的數(shù)據(jù),這一步有XMLParser來完成,XMLParser對此XML文檔進(jìn)行解析,將其轉(zhuǎn)化為一棵對象樹,XML文檔中每一個節(jié)點都是一個對象,每個對象都有各自的屬性(即相應(yīng)節(jié)點的所有信息)。這樣一來,我們可以非常方便的訪問這個XML文檔的任意內(nèi)容。之后,要做的就是將該XML文檔中讀出的信息(包括格式信息和內(nèi)容信息)用PDFCreator轉(zhuǎn)化為最終的PDF文檔的輸出。
5.應(yīng)用示例
在這里,我們運用上面的這套系統(tǒng)創(chuàng)建一個面向打印的報表——“庫存歷史事
表”。這個報表包含的信息有:報表名稱(協(xié)和庫存歷史事務(wù)表)、單位、建表日期等,另外就是從數(shù)據(jù)庫中提取的數(shù)據(jù)了,品名(LLPROD)、批號(LLOC)、等級(LCLS)、倉庫(LWHS)、庫位(LLOCT)、數(shù)量(LNUM)、日期(LDATE)等。假設(shè)我們已經(jīng)用XMLWriter生成了下面的原始XML文檔(report.xml):
<?xml version="1.0" encoding="gb2312"?>
<report>
<report_param>
<title>庫存歷史事務(wù)表</title>
<unit>平方米</unit>
<date>20020611</date>
</report_param>
<report_records>
<record>
<llprod>W2308</llprod>
<lloc>1234</lloc>
<lcls>a</lcls>
<lwhs>01</lwhs>
<lloct>0001</lloct>
<lnum>200</lnum>
<ldate>20020609</ldate>
</record>
<record>
<llprod>W2307</llprod>
<lloc>4321</lloc>
<lcls>a</lcls>
<lwhs>01</lwhs>
<lloct>0001</lloct>
<lnum>100</lnum>
<ldate>20020609</ldate>
</record>
</report_records>
</report>
該文檔包含了這張報表的所有有用信息,我們需要用特定的XSL樣式單為其加上格式信息。XMLTransformer執(zhí)行轉(zhuǎn)換的代碼如下:
<?php
$xslt = new XMLTransformer ("report.xsl", "report.xml");
$xslt->apply("pdfreport.xml");
?>
轉(zhuǎn)換后生成的新的XML文檔如下:
<?xml version="1.0" encoding="gb2312"?>
<pdfreport pagetype="a4" pagesize="25" top="20" bottom="20" left="20" right="20">
<head>
<line top="5" bottom="5" size="50%" linetype="single" show="false"/>
<text fontsize="30" fontlaguage="cn" align="center">庫存歷史事務(wù)表</text>
<line top="5" bottom="30" size="80%" linetype="double" show="true"/>
<text fontsize="12" fontlaguage="cn" align="left">單位:平方米</text>
</head>
<body>
<table>
<tr><th>品名</th><th>批號</th><th>等級</th><th>倉庫</th><th>庫位</th><th>數(shù)量</th><th>日期</th></tr>
<tr><td>W2308</td><td>1234</td><td>a</td><td>01</td><td>0001</td><td>200</td><td>20020609</td></tr>
<tr><td>W2307</td><td>4321</td><td>a</td><td>01</td><td>0001</td><td>100</td><td>20020609</td></tr>
</table>
</body>
<foot>
<line top="5" bottom="5" size="50%" linetype="single" show="false"/>
<text fontsize="12" fontlaguage="cn" align="center">建表日期:20020611</text>
</foot>
</pdfreport>
用XMLParser對該XML文檔解析后,得到一個包含所有信息的對象樹,我們可以非常方便的訪問其中的內(nèi)容。生成的PDF報表如下圖:
程序片斷如下:
<? include( "../include/pc_init.inc" );?>
<? include( "xmlparser.inc" );
<?
$xmlobject=getRootNode("report.xml");
// get the attrs of root element
$pageSet=$xmlobject->attrs;
// get the report-head
$head=$xmlobject->nodes[0];
// code ignored...
?>
<?
function draw_line(&$parent,$line){
$line = &pc_create_object( $parent, "line" );
$line->pc_set_linestyle( $line->attrs["LINETYPE"]);
$line->pc_set_width( $line->attrs["SIZE"] );
$line->pc_set_alignment( "center" );
if($line->attrs["SHOW"]==false){
$line->pc_set_linecolor( "white" );
}
$line->pc_set_margin( array( "top" => $line->attrs["TOP"], "bottom" => $line->attrs["BOTTOM"], "left" => 0, "right" => 0 ) );
}
function draw_text(&$parent,$text){
// code ignored...
}
function draw_table(&$parent,$table){
// code ignored...
}
function addhead(&$parent,$head){
for($i=0;$i< $head->n;$i++){
switch ($head->nodes[$i]->name){
case "LINE":draw_line($parent,$head->nodes[$i]);break;
case "TEXT":draw_text($parent,$head->nodes[$i]);break;
}
}
}
//..
?>
<?
// Create a PDF Document
$PDF = &pc_create_pdf( array( "Author" => "cyman", "Title" => "a report example" ) );
// Create an A4-format page
$Page1 = &pc_create_page( $PDF, $pageSet["PAGETYPE"]);
addhead($Page1,$head);
$PDF->pc_draw();
?>
6.總結(jié)
在幾個月來的畢業(yè)設(shè)計過程中,雖然忙碌,卻非常充實。通過對一個實際的課題的分析,研究,論證,實現(xiàn)。感覺收獲頗多。目前,這套系統(tǒng)已投入使用,收到了非常滿意的效果,可以很容易的做出美觀實用的報表、單據(jù)等。但是,由于時間上的倉促以及自己水平的有限,這套系統(tǒng)仍有許多不足之處。其中最遺憾就是,沒有能定義出一套對各種文檔(包括報表、單據(jù)、手冊等等)都通用的XML標(biāo)記,并編制通用的程序?qū)⑦@個XML文檔轉(zhuǎn)化為PDF,就如同瀏覽器解析HTML一樣。這樣就不必為每一種文檔都定義各自的XML標(biāo)記并編寫相對應(yīng)的轉(zhuǎn)換程序,可以大大提高工作效率。
雖然畢業(yè)設(shè)計已經(jīng)結(jié)束,但是我將會今后的日子里繼續(xù)這個課題的研究。