Knowledge
信息检索导论笔记(三) 信息检索导论笔记(三)
相关反馈主要思想RF (relevance feedback) 相关反馈的主要思想:在信息检索过程中通过用户交互来提高最终的检索结果。 基本过程 用户提交一个简短的查询 系统返回初次检索结果 用户对部分结果进行标注,将它们标注为相关或不相关
信息检索导论笔记(二) 信息检索导论笔记(二)
索引压缩统计特性压缩意义: 节省磁盘空间 增加高速缓存 (caching)技术的利用率 加快数据从磁盘到内存的传输速度 统计规律: 30定律(rule of 30):出现频率最高的30个词在书面文本占30%的出现比例 Heaps定律:
信息检索学习笔记(一) 信息检索学习笔记(一)
布尔检索信息检索基本概念信息检索定义: 从大规模非结构化数据(通常是文本)的集合中找出满足用户信息需求的资料的过程。 数据类型分类 结构化数据: 按照预定义的模型结构化或以预定义的方式组织的数据。例如,关系数据库。 非结构化数据:既没有按