百度算法更新历程
2017年9月,清风算法
打击目标:网页标题作弊,包括但不限于标题关键字堆砌、与内容不符、张冠李戴等。主要针对修改TITLE堆砌关键词或进行内容劫持的黑帽子网站。净化搜索引擎索引。
官方文档:http://zhanzhang.baidu.com/wiki/1090
2017年6月,飓风算法
打击目标:大量进行恶劣采集低质量内容的网站。打击通过大量采集的行为快速增加内容,以加快收录的做法,以保护原创内容。净化搜索引擎索引。
2014年11月,冰桶算法2.0
打击目标:使用全屏的点击下载元素遮盖网页,在页面内布置面积过大的广告遮挡内容,强制用户登录的站点行为。增加用户浏览体验。
2014年8月,冰桶算法
打击目标:弹窗APP下载,在页面内布置面积过大的广告遮挡内容的站点行为。增加用户浏览体验。
2013年7月,绿萝算法2.0
打击目标:大量发布带外链文章的网站。本次增加文章外链过滤力度,增大了处罚力度。净化搜索引擎索引。
2013年5月,石榴算法
打击目标:弹窗广告泛滥,含有大量劣质广告的网站。增加用户浏览体验。
2013年2月,绿萝算法
打击目标:链接交易网站。包括出卖链接、购买链接等行为。净化搜索引擎索引。
2017年7月7日,百度搜索引擎推出“飓风算法”,全文如下:
百度推出飓风算法,严厉打击恶劣采集
百度搜索于近日推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。
飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在反馈中心进行反馈。
可以看出,“飓风算法”的主要目的是打击采集为主要来源的网站。这已经不是百度第一次提出要保护原创文章的网站了。那么为什么百度要这样做,“飓风算法”之后我们网站的内容该怎么样建设,网站SEO将会何去何从?今天CRAZYSEO工程师就和大家讨论一下。
首先,从原创网站的角度出发,如果自己原创的文章总是被其他网站采集,并且采集的网站关键词排名要高于自己的网站,原创网站的内容创作人员很容易失去信心。一篇原创文章需要至少30分钟的时间,如果是专业性的内容甚至需要几个小时才能完成,如果轻而易举的被别人采集,加上自己网站没有得到相应的排名和流程,这是非常痛苦的过程,久而久之会导致失去创作的动力。这种情况是百度不愿意看到了,如果没有了高质量的内容,搜索引擎将会是空中楼阁。这也就是为什么百度力推百家号的原因了,目的还是在于鼓励创作者的激情,获得源源不断的内容。
其次,站在搜索引擎用户的角度出发,如果一篇文章被大量采集,并且都能获得不错的排名,用户搜索看到了结果将会非常的雷同,这就失去了搜索引擎的本质。搜索结果的质量下降会直接导致用户的流失,这是搜索引擎最不愿意看到的结果。
最后,作为搜索引擎,如果不通过一次次的算法更新剔除恶劣采集的链接,搜索结果将会不断下降,毕竟搜索引擎是核心算法都是程序,不可能做到完美,每过一段时间就会有黑帽SEO总结出其中的算法规律,就像我们前面提到的采集贴吧内容的方法,哪个时期,这种方法几天之内就能把关键词排名做到前三。
那么“飓风算法”之后,作为SEOER该如何调整策略,才能让自己的网站排名快速上升了?其实作为一个白帽SEO,“飓风算法”的更新对我们的还是非常有利的。白帽SEO的核心就是关键词的挖掘和内容的建设。我们平时最头疼的问题就是自己辛苦原创的内容被别人抄袭,折腾了几个月,网站排名还没有黑帽SEO网站的效果好等等。
在“飓风算法”之后,我们应该更加坚定的坚持自己的SEO方向,将更多的精力和时间投入到挖掘用户的需求和内容的建设上面。如果遇到自己网站的内容被采集或者抄袭,可以到百度站长工具投诉,如图1:
内容方面要紧密结合用户需求,具体的方法主要有以下三步骤:
1、挖掘关键词;
2、分析隐藏在关键词背后的用户需求,这一点就需要对关键词进行深入的分析,了解用户搜索某一个关键词到底想要得到什么结果;
3、为关键词撰写内容,内容的撰写就要按照第二点中提到的满足用户的需求。千万不可自己臆想猜测,杜撰故事。这样的内容即便是逃过了搜索引擎的算法,也会最终被用户抛弃。
百度官方公告最后提出:“百度搜索对恶劣采集的零容忍”,这是一个信号,意味着后续百度搜索引擎会用更强的力度对待采集、低质量内容。我们在SEO过程中要更加的谨慎,切记不要越过红线。SEO的标准翻译是搜索引擎优化,不要和某些机构说的那样将SEO妖魔化,认为SEO就是作弊。
百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。
飓风算法主要针对以下页面内容质量问题:
1.1、存在大量从其他站点、智能小程序或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
问题示例1:文章有明显采集痕迹
1.2、存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
问题示例2:文章内容逻辑性差,阅读体验差
1.3、站点或智能小程序内存在大量采集内容,自身内容生产力极差。
指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。
问题示例:美食类智能小程序发布足球相关内容
第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
问题示例:智能小程序内容涉及多个领域
指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
问题示例:多个智能小程序复用同一模板,内容质量低、相似度高
关于飓风算法的更多信息请参考:
2019.8.22 【官方说法】飓风算法3.0解读
2019.8.8 飓风算法3.0即将上线,控制跨领域采集及站群问题
2018.9.20 【官方说法】飓风算法2.0解读
2018.9.13 百度搜索将推出飓风算法2.0,严厉打击恶劣采集行为
2017.7.4 百度推出飓风算法,严厉打击恶劣采集
百度搜索引擎14个算法
绿萝算法:首次发布于2013年2月,主要用于打击超链中介、出卖链接、购买链接等超链作弊行为。
石榴算法:首次发布于2013年7月,主要打击含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面。
冰桶算法:首次发布于2014年8月,针对强行弹窗app下载、用户登录、大面积广告等低质站点和页面进行调整,对用户可直接使用的优质资源进行优先展现。
天网算法:首次发布于2016年8月,主要是针对部分站点存在盗取用户隐私的行为进行打击。主要表现为网页嵌恶意代码(多为JS代码),用于盗取网民的QQ号、手机号。
蓝天算法:首次发布于2016年11月,目的是严厉打击新闻源网站售卖软文、目录行为。
烽火算法:首次发布于2017年2月,主要用于对出现恶意劫持行为的站点进行干预处理,全力打击有损用户体验和安全的行为。
飓风算法,首次发布于2017年7月,旨在严厉打击以恶劣采集为内容主要来源的网站。
清风算法:首次发布于2017年9月,在严惩网站通过网页标题作弊,欺骗用户并获得点击的行为;从而保证搜索用户体验,促进搜索生态良性发展。
闪电算法:首次发布于2017年10月,主要针对移动网站首屏加载时间,移动网页首屏在2秒之内完成打开的,在移动搜索下将获得提升页面评价优待。
惊雷算法:首次发布于2017年11月,旨在严厉打击通过刷点击,提升网站搜索排序的作弊行为;以此保证搜索用户体验,促进搜索内容生态良性发展。
极光算法:首次发布于2018年5月,给予符合落地页时间因子(文章的发布时间)要求且时效性较高的网页更多的收录、展现机会。
细雨算法:首次发布于2018年7月,主要是为了促进供求黄页类B2B站点生态健康发展。
信风算法:首次发布于2019年5月,主要打击用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)的行为。
劲风算法:首次发布于2020年2月,主要针对恶劣聚合页问题进行规范和控制。