基于不同数据集的协作过滤算法评测 |
| |
引用本文: | 董丽,邢春晓,王克宏.基于不同数据集的协作过滤算法评测[J].清华大学学报(自然科学版)网络.预览,2009(4). |
| |
作者姓名: | 董丽 邢春晓 王克宏 |
| |
摘 要: | 现有协作过滤算法评测中普遍采用单一数据集,而忽略算法可能受不同数据集特征影响的情况。针对这一问题,该文将传统的User-based(近邻数为20)、Item-based、Item average、Item user average和Slope One 5种算法应用于MovieLens和Book-Crossing两种数据分布特征不同的数据集,通过试验得到其评测精度。结果显示,在Movielens这种评分值相对比较稠密的数据集上,Slope One算法的预测精度最好;而在评分值相对比较稀疏的Book-Crossing数据集上,Item-based算法的预测精度最好,Slope One的预测精度最差。应根据用户和资源分布具体情况选择合适的算法。
|
本文献已被 CNKI 等数据库收录! |
|