基于PDF文档的网络学习资源建设
基于PDF文档的网络学习资源建设 基于PDF文档的网络学习资源建设 基于PDF文档的网络学习资源建设摘 要】 目前最流行的电子文档格式--PDF文档,集多媒体信息于一身,交互方式丰富,并且可在Web上发布和传递具有独特优势。本文在分析PDF文档和Web数据库进行双向数据传递机理的基础上,对如何利用PDF文档结合ASP技术开发网络学习资源进行了探讨。
【关键词】 PDF文档;ASP;网络资源
数字化、网络化、信息化成了新世纪人们生活的一种状态。每个角落、每个部门、每个领域都渗透着计算机和计算机网络。计算机网络的大撞击,网络学习资源使教育也在发生质的飞跃,给远程教育带来了欣欣向荣的景象。面对众多纷繁的网络学习资源,也存在一个物竞天择的问题。PDF文档作为一种跨平台的通用电子格式,对文档信息及多媒体信息的传播有独特的优势。
一、PDF文档在Web上的技术优势
1. PDF文档集多媒体信息于一身
PDF(Portable Document Format便携文档格式)为Adobe公司开发的一种电子文档格式,它将文字、字型、格式、颜色、图形图象、超文本链接、声音、动态图象等信息封装在一个文件当中的一种通用电子格式,目前已成为数字化信息上的一个工业标准。和普通的Web不同,PDF文档能将多媒体信息捆绑在一起,文件位置发生变化时根本不用担心其他信息的丢失。利用PDF文档在网络上传递多媒体信息具有一定的技术优势。
2. PDF文档具有交互性
PDF文档在Web上发布信息时常用的交互事件驱动行为(Action)有下面几种类型:
● Go to View:跳转到当前文档某处,显示文档内容或打开另一个PDF文档某处显示文档内容。此行为和HTML中的超链结相比更具灵活性。
● Open file:打开一个非PDF文档文件,如与PDF文档同在Web上的HTML程序、ASP(Active Server Pages)程序、Flash动画文件等。
● Wold Wide Web Link:跳转到指定的URL,可以使用http、ftp、mailto协议定义的超级链接。
● Reset form:清除PDF文档表单中各域当前内容,恢复原设计时定义的缺省值。此行为能够实现动态信息更新。
● Submit form:提交PDF文档表单中各域变量的值给指定的URL,如CGI(Common Gateway Interface)程序、ASP程序等。
● Show/hide field:显示或隐藏指定的交互元素对象。它非常适用于建立动态信息显示、动态交互窗口显示的页面。
这些交互事件驱动行为类型,在Web上可以产生丰富的交互方式,使得PDF文档在Web上增色不少。
3. PDF文档在Web上出版和传输能力
PDF文档是一种通用的文件格式,不论什么样的应用程序或平台,PDF都可以保存所有原始文档的文本信息及多媒体信息,文件占用的空间很小,非常便利于电子邮件或互联网的发放和携带信息传播。
只要使用含Acrobat Reader插件的网络浏览器都可以在Web上阅读PDF文档。对于支持PDF文档分页下载显示的服务器,并且在Acrobat Reader浏览插件的选项设置中使用了后台下载选项, PDF文档页面内容显示的速度将大大提高。目前支持PDF文档分页下载显示的Web服务器很多,常见的有:WebSite,WebSite Professional,Fastrack server 2.0,Enterprise server 2.0等。对于不支持PDF文档分页下载显示的服务器产品,通过网关接口程序(CGI)、ActiveX技术,可以能轻而易举地达到这一目的。
二、PDF文档的结构
PDF文档的组成,有三个层次:
● 内容层。包含文件中所有文字和图象的内容。
● 基本信息层。包含有关文件的基本信息,如字体信息、导航器引用表等。
● 增强信息层。包含♀增强功能的信息,如超文®本链接、书签内容、文章信息♋等。
在PDF文档中包含了一种数据存贮格式FDF(Form Data Format),处理于表单域数据输出和导入,是一种纯文本文件。PDF文件由文件头、文件主体、交叉引用表、文件尾四个部分组成。
FDF文件头的首行表明了当前文件所使用的FDF规范版本。
FDF文件主体主要由catalog对象组成。Catalog对象仅含一个关键字FDF。关键字FDF的值包含如下项目:
Fields:包含一组域属性的定义
F:指定Form输出或导入数据的PDF文件名等
项目Fields的属性定义包含下列描述:
T:域名
V:域值
OPT:选择项域的各项值等
PDF文件尾由关键字trailer间接引用FDF文件体的catalog对象关键字root的一个值对及文件结束标记%%EOF组成。
PDF文档是通过一系列对象序列来构造的。PDF对象包括直接对象和间接对象,间接对象是经过标识了的PDF对象,直接对象通常有布尔型、数值型、字符串型、名字型、数组型、字典型、空对象、流对象等基本类型。一个PDF文档包含了一个以上的页面,而每一个页面都可以包含文档、图形图象,继而加入声音和动画。在多媒体信息的组合上,完全将多种媒体信息融会在一起。
三、PDF文档与Web数据库
PDF文档的表单是PDF页面控制的对象,也是PDF向Web数据库进行数据信息传递的接口,还可以向Web数据库读取相应数据。表单的域、字段变量都能和Web数据库建立数据通道。通常Web数据库接受来自客户端的数据一般都采用CGI程序实现。开发CGI程序的语言工具众多纷繁。PDF文档作为目前电子文档的一种通用格式,其中提供的和Web数据库接口的内部结构域和字段变量,大大增强了它在互联网上的使用。我们在构建PDF文档携带的多媒体网络信息资源过程中,借助了ASP技术向Web上发布PDF,同时接受来自客户端的交互数据。
1. PDF文档表单向Web数据库提交数据
在Adobe Acrobat 4.0 PDF开发环境中,构造一个学习者登录注册(以学习者注册信息为例)信息表单的PDF文档,文件名为Login.pdf,表单中各域名与Web数据库字段名一一相对应起来。如图所示:
表单中,按钮“注册”通过鼠标事件Mouse Up驱动行为Submit form实现向服务器应用程序传递参数信息。在定义Submit form行为时,保持服务器应用程序的URL和提交信息的ASP程序相一致。输出格式为HTML form(URL encoded),选择输出的表单域的域名。
在服务器的ASP应用程序中,利用VBScript语句Request来获取PDF文档表单域的域名参数信息,书写格式为:
Request(“field_name”)
对于接受到的PDF文档的表单数据,将通过ODBC驱动注入Web数据库中。服务器中的ASP程序关键代码如下:
<% d1= Request(“name”)%><%=d1%>
data.path=server.MapPath“login.mdb”
set conn=server.createObject“ADOBE.Connection”
conn.Open “Drive=Microsoft Access Drive .mdb
dbp=&data_path
SQL=“INSERT INTO dataname……” '和PDF表单域字段对应
SQL=SQL+VALUES'“&D1&”'' “&d2&” '…
Set RS=Conn.ExcuteSQL%>
<a href=/login.pdf>Return login.pdf</a>
在构造进行网络试题测试时,Web数据库取数据库Networktest.mdb,ASP程序中部分代码同上,都是接受PDF文档表单域的参数。
2. 从Web数据库中提取数据生成PDF文档
在构造的网络学习资源中,少不了要给客户端实时生成、传送试题,利用PDF文档也能轻易实现。主要就是从Web数据库中读取字段数据,生成相应PDF文档表单域字段。对于上面的程序就ภ是一个逆过程。建立一个名为test.pdf文档文件表单域字段和数据库相对应。其他设置同上所述。
服务器ASP应用程序,从Web数据库读取字段数据后,生成FDF文件返送浏览器PDF文档。在这里PDF文档中的FDF文件格式是ASP和PDF文档的数据接口,在生成FDF格式之前必须定义服务器端的MIME类型为Application/Vnd.fdf的语句。
从Web数据库读取记录动态生成PDF文档,ASP应用程序代码如下:
<% Name=Request“name” %>
<% if Not trimName=“ ” then
data_path=server.mapPath“networktest.mdb”
set conn=server.createObject“Adobe.connection”
conn.Open“Drive= Microsoft Access Drive.mdb dbp=”& data_p♚ath
SQL=“ selectform data where name like ' ”&name&”'
Set RS=Conn.ExcuteSQL
IF Not RS.EOF then
Number=RS0A=RS1B=RS2
C=RS3D=RS4right=RS5
Else
Number=“ No found”
End if
RS.close
Conn.close
Endid%>
<</fdf
<</field I<</T number/V<%=number%>>>
<</T A/V<%=A%>>>
<</T B/V<%=B%>>>
<</T C/V<%=C%>>>
<</T D/V<%=D%>>>
/FNetworktest.pdf
>>
>>end obj trailer
<</Root 1OR>>
四、资源系统的主要组成部分
该网络学习资源系统采用了最常见的客户机/服务器网络模型(即C/S模型),如图所示:
1. PDF文档库
服务器端提供了以PDF文档为依托的多媒体信息资源库。对于所有的学习内容或测试题信息,全部以PDF文档携带。在客户浏览端,不管其浏览目的如何,附带上Adobe公司的Acrobat reader插件,就能很好地显示出学习的内容。其页面上的内容,不会因为浏览器的设置不同而出现异样。PDF文档的制作简单,可以使用Word97、2000,也可以使用Acrobat 4.0。(目前Acrobat 5.0新版本的功能有了很大的扩充,和PDF文档相关的主要有:基于Adobe PDF 文件快速编制新文档和使用 Adobe PDF表单搜集更为准确的信息,降低成本。文档的结构和制作方式没有多大的变化。作为在4.0版本环境中开发的文档和资源,在5.0版本中同样可以使用。)这为后期的维护提供了极大的方便。图为PDF文档的制作流程:
本网络资源开发应用于摄影技术基础的网络学习。现以照相机的结构原理一节为例,对PDF文档的制作过程和应注意的事项加以说明。照相机结构原理的讲解采用文本描述、图象展示、声音解说和动画演示。制作一个完整的、包含上述信息组合的PDF文档的步骤如下:
(1)制作、收集素材 即对以上的四种媒体信息进行制作、加工。文字描述应尽量形象化,并结合图片来讲解照相机的内部结构。考虑网络传输及显示的速度,所有的图象均采用JPG格式;由于PDF文档只支持wav声音格式,因此要配置的音频内容要尽量精简;PDF文档支持所有的动画格式,如MPEG、AVI、Flash动画等。AVI格式的动画在PDF文档中有两种播放形式:一种是嵌入式,即画面嵌在文档里面,占用了文档的部分面积;另一种是浮动式,即浮在文档上面。当画面布局过于紧凑时,浮动式可以节省页面空间。
(2)页面布局及生成 当素材收集完成后,就要将媒体信息布局组合。只要安装了Acrobat4.0,Word97、2000就可以将Word文档生成PDF文档。Word具有很强的排版功能,因此将文字和图像预先在Word中处理好后,再将Word文档转换成PDF文档比较方便。安装了Acrobat4.0后,Word“文件”菜单下就会多出一项“Create PDF”子菜单。点击此命令,按照框中的提示,即可完成PDF文档的生成。此时注意,要为声音和动画留出空间。
(3)启动Acrobat4.0环境,加入声音和动画 在Acrobat4.0中提供了给PDF文档添加声音和动画的工具。在生成的 PDF文档的适当位置加入声音和动画后即告完成。
(4)对所使用的素材利用目录进行归类,以方便后期的维护和修改 这也是比较关键的一步。制作完成的PDF文档放置在服务器的PDF文档库中,即可用ASP技术向Interne