搜索引擎按照功能可以分为如下几部分:
1. 巡视软件(robot/spider/crawler)
作用:自动从网上抓取信息。
2. 页面存储器
作用:将抓取回来的信息存储起来,也就是数据库。
3. 分析索引器
作用:对抓取回来的信息进行分析,建立索引。
4. 查询器
作用:根据用户的提问在索引库中进行查询,进行文档与提问相关性评价,并对将输出的结果进行排序。
在查询之前,查询器需要首先对用户输入的数据进行特征化表示,抽取其中的主题概念。
5. 用户接口
作用:提供用户与搜索引擎之间的界面,帮助用户更高效、更方便地使用搜索引擎查找信息。
具体而言,用户接口又分为三部分:(1)接受用户输入的提问;(2)将查询结果返回给用户;(3)提供用户相关反馈机制。