在浏览完落地页返回搜索结果页时,会进入到虚假的百度移动搜索结果页,该页面模拟了百度搜索结果首页,但实际上是一个虚假的风险站点,用户访问存在极大的安全隐患,严重影响了用户的搜索体验。
百度搜索推出烽火算法,严厉打击危害用户隐私、恶意劫持站点的行为。
上线时间:2017年02月23日
打击对象:主要针对搜索域名跳转劫持,并模拟搜索引擎搜索结果的虚假、违法行为,其内容存在极大的安全隐患,严重影响了用户的搜索体验。
算法意义:保障了访客用户的搜索体验,杜绝了违规、违法的行为。域名部署https,可有效防劫持。
版本介绍
烽火算法1.0
2017年2月,百度推出烽火反劫持计划(简称“烽火计划”),对出现恶意劫持行为的站点进行干预处理,全力打击有损用户体验和安全的行为。
烽火算法2.0
2019年10月,烽火算法2.0 扩大了覆盖范围,1. 存在主动劫持问题的站点,请尽快清理问题页面,不要再尝试类似做法;2. 存在被动劫持的站点(常见的有:漏洞被黑、广告劫持、JS劫持、局域网劫持等),降低网站被劫持的风险。
2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。
1、未经用户允许恶意窃取用户手机号码等隐私数据的行为。
2、恶意劫持百度流量的行为,主要表现在:
搜索用户通过百度移动搜索到达网站后,完成阅读要离开网站页面时,通过浏览器返回上一级页面被劫持到虚假的百度搜索结果页中;
搜索用户通过百度移动搜索到达网站后,完成阅读要离开网站页面时,通过浏览器始终无法返回上一级百度搜索结果页,搜索用户会一直被困在站点内。
烽火算法3.0
百度搜索中的网站劫持有以下两种表现形式:
1、跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;
2、后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况:
2.1、无法后退,点击后退时页面无反应,内容无变化;
2.2、后退到“假百度页面”,搜索结果出现霸屏现象;
2.3、后退到用户之前没有访问过的垃圾、作弊等低质网页。
打击对象
未经用户允许恶意窃取用户手机号码等隐私数据的行为。
恶意劫持百度流量的行为。主要表现在:
搜索用户通过百度移动搜索到达网站后,完成阅读要离开网站页面时,通过浏览器返回上一级页面被劫持到虚假的百度搜索结果页中;
搜索用户通过百度移动搜索到达网站后,完成阅读要离开网站页面时,通过浏览器始终无法返回上一级百度搜索结果页,搜索用户会一直被困在站点内。
应对建议
对于网站被植入恶意代码等原因导致的劫持问题,尽快通过HTTPS改造来提升网站的安全性。
对于网页中自己主动放置恶意代码的问题,请尽快清理问题页面。
烽火算法3.0
一直以来,百度搜索对于危害用户隐私、恶意劫持站点的行为态度坚定,一经发现一律严惩。2017年2月,百度搜索发出针对恶意劫持行为的公告:《打击劫持 百度移动搜索推出烽火计划》,严惩恶意劫持的行为。2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。2019年3月,烽火算法升级至3.0版本。
跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;
后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况
(1)无法后退,点击后退时页面无反应,内容无变化;
(2)后退到“假百度页面”,搜索结果出现霸屏现象;
(3)后退到用户之前没有访问过的垃圾、作弊等低质网页。
为了能够更好的执行烽火算法,规定算法观察期如下:
1.站点首次被烽火算法覆盖,百度会通过站内信等方式发出站点问题说明及整改期限要求,未在规定时间内完成整改,将会限制站点在搜索结果中的展现,减少对用户的伤害。站点整改之后,经过算法观察期才可解除搜索展现的限制。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:一个月
2.第二次发现站点存在劫持问题,百度将限制搜索结果展现,并同步通知到站点。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:三个月
3.第三次及以上发现站点存在劫持问题,永久限制站点展现。
关于烽火算法2.0的更多信息请参考:
2021.8.9 烽火算法持续升级,控制回退按钮失效问题
2019.3.14 百度烽火算法升级,持续打击网络劫持问题
2018.5.17 严厉打击恶意劫持 百度移动搜索推出烽火算法2.0
2018.2.5 HTTPS改造全解析
2017.2.23 打击劫持 百度移动搜索推出烽火计划
被黑相关——针对被黑问题
2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。
网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。
以下是几种网站被黑后可能出现的页面:
● 内容非网站发布,内容中含大量博彩网站指向:
● 网站页面直接跳转到博彩网站:
网站被黑表明网站安全存在严重问题或漏洞。
如何防范网站被黑,请参考以下内容:
首先,自查站点是否被黑
1.通过百度搜索资源平台的“网站体检工具”,可以对网站各项指标进行安全检测,排查网站的安全隐患。
2.被黑网站在数据上有一个特点,即索引量和从搜索引擎带来的流量在短时间内数据异常。所以,站长可以利用百度搜索资源平台的索引量工具,观察站点索引量是否有异常;如果发现数据异常,再通过流量与关键词工具查看获得流量的关键词是否与网站有关、是否涉及博彩和色情;
3.通过Site语法查询站点,结合一些常见的色情、博彩类关键词效果更佳,有可能发现不属于站点的非法页面;
4.由于百度流量巨大,有些被黑行为仅针对百度带来的流量予以跳转,站长很难发现,所以在查看自己站点是否被黑时,一定要从百度搜索结果中点击站点页面,查看是否跳转到了其他站点;
5.站点内容在百度搜索结果中被提示存在风险;
6.后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。
其次,被黑之后如何处理
确认网站被黑后,网站运营人员除了要推动技术人员快速修正外,还需要做一些善后和预防的工作;
1.清理已发现的被黑内容,将被黑页面设置为404死链,并通过百度搜索资源平台的死链提交工具进行提交(我们发现有些站点采用了将被黑页面跳转至首页的做法,非常不可取);
2.网站如有变更页面,建议使用链接提交工具向百度提交变更页面数据;
3.立即停止网站服务,避免用户继续受影响以及影响其他站点;
4.排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;除此之外,技术人员还需要检查服务器中的用户管理设置,确认是否存在异常的变化。注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志。
5.更改服务器的用户访问密码。
6.做好安全工作,排查网站存在的漏洞,防止再次被黑。
最后,给大家一些网站自我防护的建议:
1.多种安全防护同步进行:适合中小型资讯网站
网站程序勤打补丁:现在很多资讯类网站用的系统使用了内容管理系统(CMS),作为比较常见的内容管理系统(CMS),有一个问题,那就是漏洞比较大众化,因为源码是公开的,所以很容易被研究出漏洞,需要对网站程序及时进行漏洞修复。
2.对服务器进行常规的安全防护
(1)在上班时间之外,对服务器上的网站权限做设置,禁止文件修改,后台文件隐藏或迁移到根目录之外。
(2)参考一些网站的安全设置,非限定的IP不能写入到数据库。
3.不使用开源程序默认的robots文件
下图是一个地级市的资讯类站点的robots文件,从robots文件中可以看出,该网站用的是织梦后台,那黑客就可以通过各种针对织梦攻击的软件进行操作,也可以针对织梦网站的常见漏洞进行扫描和针对性攻击。
4.进行HTTPS改造,强化网站安全
HTTPS主要由有两部分组成:HTTP+ SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。
关于网站被黑的更多信息请参考:
2018.3.21 网站被黑应该怎么做 — 网站被黑操作指南
2018.2.5 HTTPS改造全解析
百度搜索引擎14个算法
绿萝算法:首次发布于2013年2月,主要用于打击超链中介、出卖链接、购买链接等超链作弊行为。
石榴算法:首次发布于2013年7月,主要打击含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面。
冰桶算法:首次发布于2014年8月,针对强行弹窗app下载、用户登录、大面积广告等低质站点和页面进行调整,对用户可直接使用的优质资源进行优先展现。
天网算法:首次发布于2016年8月,主要是针对部分站点存在盗取用户隐私的行为进行打击。主要表现为网页嵌恶意代码(多为JS代码),用于盗取网民的QQ号、手机号。
蓝天算法:首次发布于2016年11月,目的是严厉打击新闻源网站售卖软文、目录行为。
烽火算法:首次发布于2017年2月,主要用于对出现恶意劫持行为的站点进行干预处理,全力打击有损用户体验和安全的行为。
飓风算法,首次发布于2017年7月,旨在严厉打击以恶劣采集为内容主要来源的网站。
清风算法:首次发布于2017年9月,在严惩网站通过网页标题作弊,欺骗用户并获得点击的行为;从而保证搜索用户体验,促进搜索生态良性发展。
闪电算法:首次发布于2017年10月,主要针对移动网站首屏加载时间,移动网页首屏在2秒之内完成打开的,在移动搜索下将获得提升页面评价优待。
惊雷算法:首次发布于2017年11月,旨在严厉打击通过刷点击,提升网站搜索排序的作弊行为;以此保证搜索用户体验,促进搜索内容生态良性发展。
极光算法:首次发布于2018年5月,给予符合落地页时间因子(文章的发布时间)要求且时效性较高的网页更多的收录、展现机会。
细雨算法:首次发布于2018年7月,主要是为了促进供求黄页类B2B站点生态健康发展。
信风算法:首次发布于2019年5月,主要打击用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)的行为。
劲风算法:首次发布于2020年2月,主要针对恶劣聚合页问题进行规范和控制。