做SEO必知:搜索引擎的工作过程与原理:
作为一个SEO从业者,应该了解搜索引擎的工作过程,这样才能更好的做好关键词的排名。百度等搜索引擎其实是机器里面的软件在工作,软件是人开发设计的,必然有其工作的原理。杭州SEO中心在这里简单介绍搜索引擎的工作原理。
搜索引擎的工作过程与原理
1、抓取
搜集器(也叫蜘蛛或者说爬虫)通过互联网抓取,下载网页给控制器。控制器进行搜集器的调度,控制抓取时间间隔,进行简单的分析,提取url,清楚噪音,并存储进数据库(原有数据库对比,存入新数据库)。
2、提取文字
由于搜索引擎蜘蛛抓取的是页面的html代码,里面包含了大量的html标签、js等无法用到排名上的内容,所以搜索引擎索引首先要做的就是把其中的HTML标签、js去掉,保留剩下的页面文字内容。
3、中文分词
中文分词是中文搜索引擎特有的步骤,英文单词之间会有空格作分隔,而中文词与词之间没有分隔符号,一个句子字与词都是连在一起的。中文搜索引擎必须首先分辨那几个字组成一个词,哪些字本身就是一个词。比如“健身方法”将被分词为“健身”和“方法”两个词。
4、去停止词
在页面内容中会存在很多对内容没有任何影响的词,比如"的"、"之"、"却"、"啊"之类。搜索引擎在索引时会把这些词去掉,让页面内容的主题更加突出。
5、去重(为什么伪原创弊大于利)
搜索引擎为了减少搜索结果中出现的重复内容会选取页面内容中出现频率最高的词,通常会选出10个左右关于页面的关键词来计算页面的“指纹”。
6、索引
经过以上步骤之后,搜索引擎就可以提炼出可以代表一个页面内容的一些关键词,同时记录这些词在页面上的出现频率、出现次数、格式、位置等信息。
7、链接关系计算
当页面中存在链接时,搜索引擎会计算这些链接都只想哪些页面,每个页面都有哪些导入链接,链接使用了什么锚文字,这些复杂的链接指向关系形成了网站和页面的链接权重。
这些链接关系也是百度计算权重的重要依据之一,至于百度权重和链接分析会在以后的文章中专门介绍。
8、页面质量判断
在这个阶段,搜索引擎会对页面内容质量、链接质量等作出判断,比如百度的绿萝、石榴算法。
9、进行排序给出排名
进行一系列算法之后,自然要对比数据库综合得分给出排名了。
小编提示:重点在看图理解,当然,搜索引擎的实际工作过程绝对不是这么简单,这里是简单介绍,是为了帮助大家更好的做SEO。
写在结尾:以上就是做SEO必知:搜索引擎的工作过程与原理的详细内容,更多请关注【杭州SEO博客】其它相关文章!
本文地址:http://seo.youqingshuyuan.com/9379.html
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系我们。
本文地址:http://seo.youqingshuyuan.com/9379.html
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系我们。