CADAL门户简化版培训张寅CADAL南方技术中心浙江大学计算机学院zhangyin98@cs.zju.edu.cn内容简化版简介简化版安装简化版管理常见问题近期门户变动简化版简介设计目标:(2007年4月)专用于CADAL项目参建馆,服务于CADAL项目参建单位。实现功能:CADAL主门户的功能精简版高级检索初级个性化后台管理工具(java控制台)图书元数据(opf文件)图书资源定位简化版截图-基本功能高级检索详细信息阅读器fig简化版截图-个性化功能图书过滤规则图书收藏图书书签个人信息简化版系统运行环境主要开发、测试、运行环境:Windows2003JDK5.0Tomcat5.0.xxSQLServer2000(必须安装SP4)如下系统运行环境,还待测试:Linux/UnixWebLogic/WebSphereOracle/MySQL简化版文件列表光盘上的简化版目录下:CADAL.zipConsoleGUI/简化版文档.doc门户安装演示.exe(视频教学)添加新图书演示.exe(视频教学)内容简化版简介简化版安装简化版管理常见问题最佳实践简化版安装CADAL.zip解压缩后,得到的目录树结构:/runtime/runtime/lib/portal/WEB-INF/portal/WEB-INF/web.xml/portal/WEB-INF/classes/portal/WEB-INF/lib/portal/WEB-INF/views/portal/js/portal/css/portal/doc简化版安装-配置运行环境(1)安装JDK5.0和Tomcat5.0.28上,在/runtime目录下面有JDK5.0和Tomcat5.0.28安装文件,两者都是.exe文件,点击安装即可。设置环境变量,在系统环境变量中新建变量“JAVA_HOME”,其值为JDK的安装目录$JAVA_HOME,本例中为“C:\ProgramFiles\Java\jre1.5.0_06”,并修改环境变量“Path”,添加路径$JAVA_HOME/bin简化版安装-配置运行环境(2)拷贝/runtime/lib下面的jtds1.2.jar到$TOMCAT_HOME/common/lib目录下,拷贝$JAVA_HOME/lib/下的tools.jar到$TOMCAT_HOME/common/lib下。门户运行时,通常需要400M内存。所以如果服务器内存多,推荐设置1280M简化版安装-配置运行环境(3)修改$TOMCAT_HOME/conf/server.xml.设置URIEncoding为UTF-8。在配置文件“$TOMCAT_HOME/conf/server.xml”中,找到下面这段配置文本,添加红字文字。Servicename=CatalinaConnectorURIEncoding=utf-8acceptCount=100connectionTimeout=20000disableUploadTimeout=trueport=8080redirectPort=8443maxSpareThreads=75maxThreads=150minSpareThreads=25简化版安装-门户应用/portal下是一个标准的J2EEWeb应用程序,其目录结构符合servlet2.4/jsp2.0规范定义。/portal/WEB-INF/classes下面放置javaclass可执行文件和配置文件。/portal/WEB-INF/lib下面放置javaclass可执行文件的jar压缩包。/portal/WEB-INF/web.xml是应用规范要求的web应用描述文件。(MIME设置)简化版安装-配置门户应用(1)修改/portal/WEB-INF/classes/hibernate.cfg.xml,设置数据库的jdbc驱动,访问地址,用户名,密码。propertyname=connection.driver_classnet.sourceforge.jtds.jdbc.Driver/propertypropertyname=connection.url(准备使用的数据库链接地址)jdbc:jtds:sqlserver://10.15.60.95:1433;DatabaseName=cadal/propertypropertyname=connection.usernamesa/property(用户名)propertyname=connection.passwordsa/property(密码)简化版安装-配置门户应用(2)/portal/WEB-INF/classes/log4j.properties,修改这个文件中的配置项,设置日志存放位置log4j.appender.R.File=d:/logs/portal/portal.loglog4j.appender.hibernate.File=d:/logs/portal/hibernate.log简化版安装-部署门户应用$TOMCAT_HOME/conf/Catalina/localhost目录下,添加应用描述文件CADAL.xml。?xmlversion='1.0'encoding='utf-8'?ContextdisplayName=CadalPortaldocBase=/$PATH_TO_PORTAL/portal/path=/CADAL/Context内容简化版简介简化版安装简化版管理常见问题近期门户变动简化版管理功能添加、修改、删除监视点本地目录(G:/ebooks)远程目录()扫描监视点下所有符合OEB规范的数字图书抽取数字图书里OPF文件中的元数据描述信息删除数据库中已有的图书元数据定期自动执行扫描/抽取(试验)数字图书对外发布$TOMCAT_HOME/conf/Catalina/localhost目录下面增加一个应用描述文件ebooks.xml。文件内容如下:?xmlversion='1.0'encoding='utf-8'?ContextdisplayName=CadalebooksdocBase=/$PATH_TO_ebooks/ebooks/path=/ebooks/Context内容简化版简介简化版安装简化版管理常见问题近期门户变动常见问题数据库连接失败图书扫描/图书抽取的线程异常终止了图书为何扫描不到图书元数据抽取为何失败最佳实践图书为何扫描不到?图书中没有meta/oeb目录,或者没有opf文件06000001/meta图书中又有同样编号的一本图书06000001/06000001图书重复出现不同监视点下有同样的图书检查网络或者硬盘数据库网络连接文件服务器网络连接硬盘是否损坏图书元数据抽取为何失败?Opf文件不存在,不合OEB规范。Opf文件存在,但其文件名有空格,或者就是.opf。Opf文件采用了utf-8编码,但是出现了utf-8编码中没有的字符。能够删除文件开头的非法字符,例??xmlOpf编码设置错误encoding=unicode错误encoding=utf-16正确Opf文件中,某些元数据项的数据过长某些西文图书Creator、Subject、Contributor有近1000个字符数据库元数据项字段长度限制CreateDate200Creator1000Publisher500Subject1000Coverage300Contributor2000ContentLanguage50Relation300Rights1000LastDate8CharCreateTime50Type200Title500Description8000Identifier200Format100最佳实践善用监视点中的路径可以扫描监视点下部分图书单个监视点下图书数量5万图书数量太多,则扫描时间长分成多个扫描点,可有效减少扫描时间元数据抽取失败的图书编号在日志文件portal.log中可以看到。形如:WARN:errorparsingbookno:xxxxx内容简化版简介简化版安装简化版管理常见问题近期门户变动近期门户变动增加Web2.0元素标签评论RSS/ATOM轻量级门户体系结构RESTWebService实例:AmazonS3/DeliciousBookmarks已包装:元数据搜索/推荐引擎(Restlet)待包装:元数据/图书定位/标签/书签/RSSGoogleYoutube/APP/豆瓣Python(Django)+MySQL门户安全架构集成HTTPSApacheSSODjvu6.1谢谢!