徐德芳
昨天下午,“互联网时代的国学复兴”高峰论坛在北京中华世纪坛召开。与此同时,Baidu.com宣布,正式开通“国学频道”。
Baidu.com已为该频道筹备数月。在去年10月就已经开始启用guoxue.baidu.com域名。记
者在该网站发现,Baidu.com“国学搜索”使用的主要是“国学网”的所有者北京国学时代文化传播有限公司制作的一款电子古籍产品“国学宝典”。“国学宝典”号称“全球最大的中华古籍数据库”,收书总数约3500种,总字数7.5亿汉字,其单机版本售价即高达8800元。目前在Baidu.com国学搜索频道可供查阅的有约10万个网页、1.4亿个汉字。这些内容收录上起先秦、下至清末2000多年以汉字为载体的历代典籍,并仍在增加和更新中。
两大搜索公司学术火拼?
此前Google已在其原有的学术搜索频道(scholar.google.com)中开通了中文搜索论文、书籍、学术文献、技术报告等服务。一定程度上成了Baidu.com国学搜索的强劲对手。
这次“交火”貌似巧合。Google总裁Kai-Fu Lee表示,这个产品大约2年前就开始孕育了。最初开发它的员工曾任加州大学教授,曾饱受查找文献的困扰,于是开始研发“学术搜索”。
记者在上线操作了这两个学术引擎以后发现,两者确实存在很多不同。Baidu.com国学搜索提供的主要是文献原文检索服务。用户可以通过这个工具了解到某些古文词句的出典,或者完整阅读传统典籍。虽然Baidu.com国学搜索的界面上设有“作者”和“书名”两个搜索项,但却尚未开通相关服务。
而Google学术搜索不仅可以抓取网上的论文资源,还可以搜索到“非在线”文章。比如爱因斯坦的很多著作并未在线发布,却被众多学者引用,Google通过提供这些引用信息,可使网民了解到重要的非在线论文。Google学术搜索还提供了图书馆链接、被引用次数等相关服务。因为Google提供的学术搜索偏重于论文检索,而Baidu.com国学频道则侧重原典检索,因此两者在提供的服务上有一定的互补性。
原典查询:早有蜻蜓立上头
记者从一些文献研究者处了解到,Baidu.com搜索实际上并不是提供原典搜索服务最早或者最优的网站。
在学院研究者的指引下,记者找到了由台湾“中央研究院”计算机中心主办的“瀚典全文检索系统1.3版”网站。这个搜索工具完成于1997年11月,可供搜索的资料包括“二十五史”、诸子古籍数十种。据专家介绍,该搜索系统的特点是全部搜索内容都是繁体字,各种古籍电子化过程中所依据的版本清晰可靠,并在搜索结果中附有纸版页码,为学术研究提供了非常方便有效的帮助。据了解,目前瀚典全文检索系统3.0版也正在测试中。
在北京大学中文系的网站上,记者看到了另一个文献搜索系统“全唐诗电子搜索系统”。这个系统由北京大学中文系李铎博士主持开发。该系统也是繁体字版,可按照册数、页码、作者、标题、内文、体裁、韵脚等线索查询唐及唐以前的几乎所有诗歌,并可以查阅相关的诗话、笔记资料及论文索引。相关的宋诗搜索工具也正在建立中。
上海师范大学中文系博士、青年教师王弘志告诉记者,Baidu.com推出的“国学搜索频道”,虽然在专业性方面有待加强,但是所收的文献数量较大。为一般用户提供了接触传统典籍的良好渠道。