搜索引擎的工作原理其实很简单,搜索引擎分为四个部分。

1,蜘蛛爬虫

2,数据分析系统

3,索引系统

4,查询系统

搜索引擎原理:1,蜘蛛顺着网页中的超链接爬行,被抓去的网页被称为网页快照。

2,处理网页,搜索引擎抓取一段到网页后,还要做大量的预处理工作,才会提供检索服务。

其中,最重要的是提取关键词,建立索引库和索引,其他还包括去除重复网页、分词,判断网页类型,分析超链接、计算网页中的重要程度、丰富度等 。

3,提供检索服务,用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页中的标题和URL外,还会提供

一段来自网页的摘要以及其他信息。

 

此文章来源定州SEO,王伊璇博客