搜索引擎蜘蛛的工作原理是什么呢(搜索引擎的原理)

   百度SEO    

一个合格的SEO一定要对搜索引擎的基本原理有一定的了解,很多看似复杂的SEO问题,如果从搜索引擎的原理出发,这些问题就可以迎刃而解了。想要有效地开展SEO工作,一定要知其然并且知其所以然。下面担路网小编就简单为大家介绍一下搜索引擎的工作原理。

搜索引擎的工作过程大概包括三个阶段:

1.爬行和抓取:spider按照一定的策略发现访问页面,将网页抓回服务器。

在这过程中蜘蛛要做的是抓取重要的页面,影响页面重要程度的因素主要包括:网站和页面的权重;页面的更新度;导入链接的数量以及质量;与首页的点击距离;URL结构。

2.预处理:对抓回来的网页进行文字提取、分词、消除噪声、索引、倒排索引等处理。

现在的搜索引擎还是主要以文字为基础的,蜘蛛先将抓回来的网页中的文字去标签、程序。当然除了中文文字,蜘蛛还会提取一些重要的标签:meta标签、alt标签等。然后是分词,将容易产生歧义的词加粗换字体等形式提示搜索引擎。消除噪声是指将对页面主题没有意义的版权声明、广告等。搜索引擎还要对页面进行去重处理:提取页面的特征关键词比对数据库中是否有重复的。然后是建立正向索引:将每个网页简化成一个个关键词,再形成倒排索引:一个关键词对应相应的网页。

3.排名:用户查询关键词,调用排名程序,经过相关计算,形成排名。

搜索引擎接收到用户输入的搜索词之后,将搜索词进行分词、去停止词、指令处理、拼写错误的矫正,然后结合用户用户的地理位置、检索历史等,如果用户的搜索词在缓存中存在就可以直接将缓存结果提供给用户,如果不存在,就从索引库中将网页调取排名呈现,并将该关键词以及对应的结果加入到缓存中去。

SEO要在保证用户体验度的基础下迎合搜索引擎,SEO既要站在用户的角度,也要站在搜索引擎的角度,这样才能更好的优化好网站。

开通一个担路云账号,即可拥有:

一个可以像做PPT一样做网站的DIY云建站系统;

一个可以自定义主题的微信游戏系统;

一个线上线下的O2O电商系统;

一个手机号、微信号、邮箱三位一体的客户注册管理系统。

文档来源:简析搜索引擎工作原理(担路网原创,请勿转载)

 标签:

评论留言

我要留言

欢迎参与讨论,请在这里发表您的看法、交流您的观点。