临沂网站建设网站导航聚类分析
访问网站的用户数量通常比较庞大,如果参考所有用户的访问路径并对当前用户进行推荐,一方面服务器的负荷很大,另一方面推荐的准确性也不高。因此,为给每个访问用户提供有价值的推荐,需要缩小参考用户的范围,确定与当前用户访问兴趣最相似的用户集合。在基于访问日志的推荐系统中,用户的兴趣体现在用户访问过的网页集合以及访问的先后次序上,亦即体现在数据预处理获得的路径向量中。而聚类分析算法可以按照访问行为的不同对先前的用户进行分类,从而达到缩小参考用户范围的目的。
聚类是一个将数据对象分组成为由类似的对象组成的多个类的过程,它的输出是一些簇,即数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。通过聚类,能够识别密集和稀疏的区域,发现数据的全局分布模式以及数据属性之间的相互关系。聚类算法需要符合一定格式的输入,即基础数据结构。
(责任编辑:admin) |