存储 频道

EMC创新日:基于行为关联的桌面搜索

【IT168 专稿】11月27日至28日,EMC在其成立不久的上海研发中心举办了主题为“创新无极限”2008年度创新日大会。作为EMC一年一度展示最新技术与产品的主要平台,每年的创新日活动都有大量EMC核心重要的行业客户参与,走进其研发中心,了解存储业界引领最新趋势的技术研发项目和存储系统产品。

本次的创新日主题围绕EMC 最新一代中端存储系统产品CLARiiON CX4,在为期两天的创新日日程中,我们不仅全面了解了EMC CLARiiON CX4各项增强功能和创新设计,还有幸近距离走入EMC研发试验室,观摩了许多还处于研发阶段的项目展示。这些目前还处于实验室阶段的技术都针对行业最为热点和前沿的存储应用,其中的一些研发项目非常有趣,不仅仅展示了EMC领先市场份额背后的强大技术实力,还体现了EMC研发中心创新与开放的思维个性。本次创新日之旅的精彩内容我们将在下面一一呈现给大家。

桌面关联搜索解决方案

一些尚处于实验室的技术的确非常有趣,在本次创新日活动上,我们见到了一项用于桌面搜索的研发项目。和传统的搜索方式不一样,这项尚处于研究阶段的项目能够让桌面电脑自动学习主人的使用习惯,通过关联的行为、动作等习惯来进行搜索。

由于个人信息越来越多,如何管理海量的个人信息成为目前的一个难题,当我们本地的文件越来越多的时候,我们很多时候都很难找到我们希望找到的文档或者网页。而个人搜索的特点在于,个人的信息都是自己存放进去的,存放的过程中其实包括了一部分的用户个人使用习惯。而这个研究项目则能够让电脑自动的“记忆”个人在浏览网页、保存文档中的一些习惯,从而进行基于行为特征的关联搜索,从而让电脑仿佛拥有人工智能一般。

必须说明的是,传统的搜索通常都使用关键词进行搜索,该项搜索功能则是对关键词搜索的一个补充,用于搜索那些关键词搜索无法获得的文档。

 
EMC工程师讲解桌面关联搜索解决方案

我们发现人们在进行某项活动的时候,通常都会残留一些记忆的碎片,然后把这些记忆的碎片关联起来。例如,我偶尔记得我在撰写某篇文章的时候察看了某些网页,也许我还发了一封邮件,所以我们试图建立起这些行为的关联,然后再查找的时候使用这些关系反映出人脑中的关联,然后一步步导航,直至最终找到所需要的文档。

 
被关联起来的文档和资源

我们使用计算机的行为实际上在某种程度上反映了以后我们需要查找文档的过程,我们会记录下用户在计算机上的一些行为一些动作,然后作一些数据挖掘。分析包括三部分的内容:

1. 基于资源内容的分析,例如某两个资源可能内容上较为相似或者包含一些相似的内容。

2. 做一些访问模式的分析,我们会发现用户在访问某一资源的时候通常是要完成某一项任务,例如完成某项技术报告等等,我们需要搜索一些文档,在网页上搜索一些资料,或者查看一些E-mail,查看这些E-mail的附件。我们能够把这些资源通过任务来关联起来。

3. 关于来源的分析,例如某些文档通常都是通过电子邮件附件保存到本地上,或者是来自外部的某一站点save as保存到本地上的。

当对这些文档或者资源进行过三种分析后,我们就能够对这些资源建立起一些隐含的关系,在搜索的时候利用这些关系进行搜索。

根据EMC工程师的介绍,这种搜索的方式有自我学习的能力,使用者对某一台电脑使用时间越长,电脑对使用者使用习惯学习的越多,这种关联搜索的优势能够更好的发挥出来。

现在有很多公司在进行“语义分析”等等方面的电脑人工智能方面的研发,EMC认为对行为关联的研究是电脑人工智能方面的另外一个研究方向,并且能够更加简单的实现一定程度上的人工智能。

1
相关文章