发布时间:2015-03-10 发布者:本地
在实现个性化搜索时,必须要通过一定的方式和手段获取用户的兴趣爱好特征,之后要通过一定的方式对用户的个人信息进行描述和表示,这也是一个很重要的问题,而现阶段用户兴趣特征信息的表示方法主要有以下六种:
1.主题表示法
用户兴趣模型的主题表示法:利用用户感兴趣的信息内容和主题来表示用户兴趣模型的方法。比如,如果用户对科技、时尚和英语学习感兴趣,我们就采取如下的方式来表示{科技、时尚、英语学习}。但是,该表示方法并没有区分用户对这些主题感兴趣的程度。
2.关键词列表表示法
用户兴趣模型的关键词列表表示法对用户兴趣的描述更加详细,是要在能反映用户兴趣爱好的的信息中提取出能反映用户兴趣的特征词,将这些特征词作为关键词表示为用户兴趣模型。这些词汇可以通过和用户互动的方式主动获取,也可以通过机器的跟踪学习自动的获得。
3.书签表示法
用户兴趣模型的书签表示法:这要完全取决于用户,它是将用户曾经保存过得网页或者站点的书签表示为用户的兴趣模型。用户在使用网络浏览信息的过程中,如果发现了相对较感兴趣或者对于用户来说比较重要的网页、或者站点,并且将其作为书签保存下来,以便之后长期浏览和使用。而用户主动保存的信息内容会显得比较重要,更能反映用户的兴趣和爱好,但是我们都知道,用户主动保存的书签数量极少,不能反映客观事实。
4.基于本体的表示法
用户兴趣模型的本体论表示法:是使用本体来表示用户感兴趣主题,将本体应用到用户兴趣模型具有重要意义,它能够实现知识的重用和共享。将本体论应用在信息检索领域,对用户的个性化模型信息进行描述,可以提高兴趣模型的精确性,由于本体论应用于个性化搜索引擎还只是处于尝试阶段,还有一些不稳定因素,例如用户的兴趣特征是一个相对较大的集合,如何保证有效性也是一个重要问题。
5.基于向量空间模型的表示法向量空间模型的表示方法是经典的表示文本方法:采取向量的方式来表示用户兴趣特征,对于每一个特征词t,采用(t,w)的方式来表示每一个特征及其在用户兴趣模型的权重。