返回首页
当前位置: 主页 > 教育技术学 > 应用研究 >

信息检索概述

时间:2013-08-25 00:19来源:知行网www.zhixing123.cn 编辑:麦田守望者

随着计算机网络技术的飞速发展,对计算机的信息存储、传输和处理能力的要求迅速增长,对海量信息的检索与利用成为当前计算机信息检索技术的一个重要研究和应用领域。目前实用化的信息检索系统主要基于人工分类目录或关键词匹配。前者对海量信息资源的揭示的效率不高、深度有限;后者在信息的语义和语用的揭示上有局限性。信息检索系统在智能处理能力上的缺乏,导致这些工具远远不能满足用户的需求。如何解决好诸如信息组织、知识表示、机器理解与人机交互等问题,对于提高信息利用的效率,是非常重要和迫切的。近年来,语义Web的提出为解决这些问题提供了锲机,由于语义Web中的资源被结构化,被计算机所理解和识别,这样提供了改进传统搜索技术的机会。语义检索的目的是通过从语义Web上获取的数据增强并改进传统的搜索结果(基于信息检索技术)。它实现了用户检索请求的本体化,整个搜索引擎像领域专家一样不仅给出查询结果,还给出了与检索请求相关的资源,大大提高检索的精度和覆盖率;实现了本体层次的检索,突破了关键词检索局限于形式的固有缺陷。它的出现提高了用户的满意度,减少了不相关的返回结果,提高了检索的精度和覆盖率   

人们在信息检索领域的研究由来己久,自人类文明出现时起,知识便开始积累,人们必须考虑如何有效地检索和使用这些长期积累一下来的丰富知识。计算机诞生以后,数据的管理、组织和利用逐渐从文件系统阶段发展到数据库系统阶段。及至当前,互联网技术迅猛发展,网络信息与知识不断膨胀,数据仓库、数据挖掘等技术方兴未艾。这些趋势无不昭示:信息资源越来越丰富,信息量越来越大,并且仍将持续地爆炸性增长,所以,对信息检索技术的研究日显重要一一信息检索日益成为信息社会中不可或缺的一种工具手段。但目前能够普遍或大规模使用的信息检索工具,其应对海量信息的能力却还很差,用户对其检索质量远不能满意,因而改善检索质量、推出令人满意的检索工具是信息检索研究的重点[4]

信息检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据用户的需要查找这些信息的过程。广义的信息检索又称为信息存储与检索(Information Storage and Retrieval)。狭义的信息检索则仅指从信息集合中查找所需信息的过程,相当于通常意义上的信息搜索(Information Search  。信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。

目前,依据不同的划分标准,可将信息检索划分为几大类,例如,依据检索对象划分可分为文本检索和多媒体检索;依据检索范围划分可分为全文检索和字段检索;依据匹配方式划分可分为模糊匹配和精确匹配两种;依据截词方式划分可分为左截词、右截词和中间截词三种方式;此外,还有布尔逻辑检索、限制检索、嵌套检索、二次检索、相似检索和邻接检索等

------分隔线----------------------------
标签(Tag):信息检索
------分隔线----------------------------
推荐内容
猜你感兴趣