IBM公司正在推广一种实现企业搜索软件间互操作性的新标准。这类企业搜索软件能够帮助企业搜索和分析企业网络上的非结构数据━━电子邮件、Word文档等非关系数据库中的数据。
IBM公司于当地时间本周一发布新版WebSphere Information Integration OmniFind Edition企业信息管理工具,它集成有名为“非结构信息管理架构”(UIMA)的技术,IBM公司
旨在改进文档和其它非结构性内容中文本的处理,帮助企业发现文档的关系和含义。
IBM公司将UIMA提交给了开放源代码技术集团。IBM公司现在就可以向客户新版软件,到今年年底,客户将能够从SourceForge网站上下载该软件。
IBM公司信息集成部门的副总裁尼尔森说,自2001年以来,IBM公司在帮助企业集成和查找企业信息的信息整合技术方面投入了巨资。他说,信息查找是企业世界的第一大问题。他指出,研究显示,员工平均将每天30%的时间用于查找相关技术。由于85%的企业数据是非结构化的,查找非常不方便,这一问题更严重了。IBM公司称,超过15家的公司已经表示它们计划将UIMA作为非结构化信息搜索和分析的框架。
Interarbor方案公司的分析师加特纳说,对非结构化的文本内容分析有多种不同的方法,但所有这些方法都只能使企业得到很肤浅的资料。通过利用UIMA,企业可以获得更广泛的信息。他说,不同的商业性产品支持该工具包,获得互操作性还需要一定的时间。