怎样建设对搜索引擎比较友好的站点

敖游
2015-12-23
来源:遨游建站

  链接404后不消除内链入口:页面404后,除了需要向百度站长平台提交外,应该尽量关闭其在网站内部的入口,一来死链对用户的伤害是极大的,二来避免令蜘蛛产生错觉,认为你网站死链严重。

  只有入链没有出链:有些人认为网页上的出链太多会分散页面本身的得分,所以在重要页面上不设计出链,实际这与百度的认知是相悖的,百度认为一个优质的网站结构应该像一张网,所有页面都会与其他页面产生链接,蜘蛛会顺着一个页面遍历所以页面。只有入链而没有出链的结构对蜘蛛来说是不友好的。当然,整个网站仅一两个网页只有入链没有出链是无所谓的,但数量千万不要多。

  无返回上级目录的链接:我们提倡尽量在每个页面上使用面包屑导航,以告诉搜索引擎页面内容与首页的关系及距离;同时对于用户来说,面包屑导航也是延长用户平均访问时长的重要工具。只有内容而没有返回上级目录的页面就像一本永远无法访问目录的书,听起来是不是怪怪的?

  错误的锚文本:内链的作用并不仅仅是页面权值传递和内部投票,百度还会通过锚文本辅助判断网页的内容,错误的锚文本很可能会误导百度对于相关性的计算,对搜索排序产生负面影响。同时对于只能通过锚文本来判断是否要点击打开新网页的用户来说,无疑也是一种伤害。

  网站应该拒绝哪些外链

  百度搜索引擎虽然降低了对超链的依赖,但依然没有放弃对不同质量链接的识别,制定了一套针对优质外链、普通外链、垃圾外链、作弊外链的识别原则和方法。在继续信任优质外链的同时,加大对作弊外链的打击,同时对部分作弊外链的受益站点进行打击。为了避免被百度搜索引擎怀疑为超链作弊,建议站长定期检查站点的外链情况,发现异常及时通过百度站长平台的拒绝外链工具进行自我保护。同时如果你之前有过购买链接、群发外链的行为,可以通过拒绝外链工具进行修正。

  那么除了要拒绝被黑网页发出的链接、买来的链接外,还有哪些链接应该被拒绝呢。

  1, 来自垃圾站群的链接:有些黑帽会通过非法手段在你的站点产生大量页面,再组织站群发送外链至这批页面上。这样的链接必须及时处理。

  2, 来自不相关低质站点群的链接:百度认为相同主题网站之间的链接更友好,所以,如果你的网站被一批其它主题网站链接了,一定要及时查看这批网站的质量,如果质量不高,尽量拒绝。

  使用拒绝外链工具还有一些注意事项:

  1,您通过工具拒绝外链的需求将无法撤销或删除,所以需要谨慎使用

  2,我们不能保证短时间内就能去掉垃圾作弊外链对网站的负面影响,清理过程可能长达数周,请站长耐心等待

  第三节:网站安全

  UGC站点如何进行防护工作

  由于大多数UGC建站系统存在漏洞,攻克技术成本较低,且群发软件价格低廉,容易被作弊者利用,近期我们发现大量UGC站点被群发的垃圾信息困扰。这些垃圾群发内容无孔不入,除论坛、博客等传统的UGC站点受到困扰外,现已蔓延到微博、SNS、B2B商情页、公司黄页、分类信息、视频站、网盘等更多领域内,甚至连新兴的分享社区也受到了影响。从以前的论坛帖子、博客日志,扩展到供求信息页、视频页、用户资料页,这些任何由用户填写和生成内容的地方,都会被作弊者发掘利用,形成大量的UGC性质的垃圾页面。

  搜索引擎在发现UGC性质的垃圾页面后必将做出相应应对,但对真正操作群发的作弊者很难有效的打击,所以作弊者容易利用UGC站点极低成本且自身安全这些特点,做出更多危害网站、危害用户、危害搜索引擎的行为。若网站自身管理不严控制不力,很容易成为垃圾内容的温床;有些网站为了短期流量而对垃圾内容置之不理,这无异于饮鸩止渴。网站不应仅仅是平台的提供者,更应该是内容的管理者,积极维护网站自身质量非常重要。若网站任由垃圾内容滋长,不仅会影响网站的用户体验,同时也会破坏网站口碑和自身品牌建设,造成正常用户流失,严重时,还会使搜索引擎降低对网站的评价。

  对于作弊者来说,在UGC站点上发布垃圾内容的目的就是被搜索引擎收录,如果不能让垃圾页面在网站和搜索引擎上消失,他们依然会持续不断地产生更多垃圾内容。百度站长平台希望和站长一起打击垃圾页面,帮助网站良性发展,共同维护互联网生态环境。

  一,UGC垃圾典型case

  1、与网站或论坛版块主题不符的内容

  2、欺骗搜索引擎用户的内容

  1)使用夸大诱人的标题,或在内容中穿插堆积热门关键词

  2)有些文章看标题以为在说A事,而主要内容却在讲B,且与A毫无关系

  3)视频或音频文件标题所述不符

  4)欺骗网站诈取分帐式广告收益的内容

  5)专门利用UGC网站为自己做推广、谋福利

  6)诈骗中奖、虚假联系电话、不良信息

  二,UGC管理员该怎么做

  1,删除垃圾内容,并将这些页面设置为404页面后,及时通过百度站长平台的死链工具提交死链列表

  2,提高注册用户门槛,限制机器注册

  • 群发软件通常使用自动的程序探测论坛默认的注册文件名、发帖文件名。管理员可以不定期的修改注册用户文件名、发帖文件名;注册、发帖按钮使用图片;与程序默认的不同,可以防止被自动程序搜索到。

  • 发帖机通常是机器注册,行为模式单一。管理员可添加一些需要人工操作的步骤,有助于限制机器注册。如使用验证码;限制同一邮箱注册ID的数量,同时启用邮箱验证;使用更为复杂的验证机制;经常更换注册问答。

  • 除了在注册处设置门槛外,还可以控制新用户权限。如要求完成上传头像、完善用户信息等人工操作步骤后才开放发帖功能;在一定时间内限制新用户发帖;限制新用户发布带链接的帖子,待达到一定级别后再放开。

  3,严控机器发帖行为,如使用验证码、限制短时间内连续发帖等

  4,建立黑名单机制,将群发常用词、广告电话和网址等加入黑名单,对含有黑名单内容的帖子进行限制或清除。黑名单应该不断维护

  5,对站内异常内容进行监控,发现爆增数据后及时查找原因

  6,对站点内用户的行为进行监控

  • 部分异常用户的ID结构有别于普通用户,如使用无意义的字母数字、或几个单个汉字的无序组合

  如:gtu4gn6dy1、蝶淑琴;使用商业词作为ID,如:轴承天地7、hangkongfuwu123

  • 发布内容间隔过短

  • 发布的内容绝大部分非常类似

  • 发布的大部分内容里含有类似的特征,如某个网址、电话、QQ号码等联系方式

  7,不允许发布带有可执行代码的内容,避免弹窗、跳转等严重影响用户体验的情况发生。

  8,对部分UGC位置提及的链接,使用“nofollow”进行标记,如:bbs签名内的链接、BLOG回复ID自置的链接

  9,论坛中的广告、灌水版块,建议加上权限限制,或者禁止搜索引擎收录。

  10,关注建站程序的安全更新,及时安装补丁程序。保障用户账号安全,避免发生盗用正常用户账号或历史沉寂用户账号发布垃圾内容的情况发生。

  网站安全之防止被黑

  这里所说的被黑,指黑客通过网站漏洞篡改网页内容、为网站恶意添加许多垃圾页面,内容往往与博彩、游戏等热门关键词有关,然后利于网站在搜索引擎中的天然优势骗取更多流量。互联网上所有网站其实都存在被黑的可能,尤其是已在搜索引擎中获得较好表现的站点更要注意,千万不要让被黑令自己的心血付之东流。

  一,如何判断网站被黑

  先通过外界对网站进行观察,如果有如下现象,那您的网站可能被黑了

  1、通过百度站长平台的索引量工具,发现站点收录量大增;再通过搜索关键词工具发现,站点获得流量的关键词中有很多与本站点无关。

  2、通过Site语法查询站点,显示搜索引擎收录了大量非本站应有的页面。

  注:site查询结合一些常见的色情、游戏、境外博彩类关键字,可帮助站长更快的找到异常页面,例如“site:www.abcxyz.com 博彩”

  3、从百度搜索结果中点击站点页面,跳转到了其他站点。

  4、站点内容在搜索结果中被提示存在风险。

  5、从搜索引擎带来的流量短时间内异常暴增。

  二,进一步难证网站是否被黑

  通过上述方法站长怀疑自己的网站被黑了,那么该如何对黑出来的内容进行排查呢?

  1、分析系统和服务器日志,检查自己站点的页面数量、用户访问流量等是否有异常波动,是否存在异常访问或操作日志;

  2、检查网站文件是否有不正常的修改,尤其是首页等重点页面;

  3、网站页面是否引用了未知站点的资源(图片、JS等),是否被放置了异常链接;

  4、检查网站是否有不正常增加的文件或目录;

  5、检查网站目录中是否有非管理员打包的网站源码、未知txt文件等;

  6、使用百度站长平台抓取诊断工具,诊断网页是否被加了黒链、隐藏文本

  *每个站点每月可使用300次,抓取结果只展现百度蜘蛛可见的前200KB内容

  【重要提示】若直接访问网站时一切正常,但在百度的搜索结果展现了异常的快照内容,这可能是黑客做了特殊处理,只让百度蜘蛛抓取到异常的页面,以此来增加隐蔽性,让站长难以发现;同理,若直接访问网站正常,但从百度搜索结果页进行访问时,出现了异常页面,这是黑客针对百度来源(refer)做了特殊处理

  三,网站被黑怎么办

  1、立即停止网站服务,避免用户继续受影响,防止继续影响其他站点(建议使用503返回码)。

  2、如果同一主机提供商同期内有多个站点被黑,您可以联系主机提供商,敦促对方做出应对。

  3、清理已发现的异常,排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;检查服务器中的用户管理设置,确认是否存在异常的变化;更改服务器的用户访问密码。

  注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志。

  4、做好安全工作,排查网站存在的漏洞,防止再次被黑。

  网站安全之域名被劫持

  2014年5月14日,前瞻网官方微博发布公告,宣布域名被盗损失过亿。在黑客遍行的今天,域名被盗被劫持几乎每天都在发生。百度搜索引擎希望站长在关注收录、流量、变现的同时,多多关注域名安全,毕竟域名安全是生存之本。在之前与站长接触中,发现站长都有如下心理:域名控制权完全在服务商,我们处于被动的一方。那么站长就真的什么都不用做、什么都无法做了么?

  一,域名被劫持的严重后果

  1,域名被解析到其它地址,用户无法正常访问,网站流量受损

  2,通过泛解析生成大量子域名,共同指向其它地址(往往是恶意垃圾网站)

  3,域名被解析到恶意钓鱼网站,导致用户财产损失

  4,当域名被劫持后的内容干扰搜索结果时,为保障用户的使用体验和安全,百度搜索引擎会暂时关闭对域名的收录和展示,待严格审核确认后才会再度放开

  二,如何降低域名被劫持风险,减少损失

  1, 为域名注册商和注册用邮箱设置复杂密码,且经常更换。使用单独的DNS服务,也需要对密码进行上述设置。同时注意不要在多个重要注册地使用相同的用户名和密码。

  2, 将域名更新设置为锁定状态,不允许通过DNS服务商网站修改记录

  *使用此方法后,需要做域名解析都要通过服务商来完成,时效性较差

  3, 定期检查域名帐户信息、域名whois信息,每天site网站检查是否有预期外网页,或使用百度云观测进行监控——当域名被解析到恶意站点时可以第一时间收到报警(百度云观测关于域名安全的介绍)

  4, 网站运营和优化人员经常详细检查网站索引和外链信息,有异常一定要检查清楚

  三,域名被劫持后该怎么做

  1,立即修改域名服务商和邮箱密码,使用复杂度高的密码且经常更换

  2,删除不属于你的DNS解析,恢复DNS设置

  3,如果使用的是第三方DNS服务,应立即修改第三方DNS服务端帐户密码,锁定帐户信息,开启帐户短信邮箱类提醒

  4, 收集全部被非法添加的页面并设置404,使用百度站长平台工具提交死链

  5,如果该服务商下域名经常出现被劫持事件,可考虑更换更安全稳定的服务商。有能力的网站可自建DNS服务,自主运维自负风险

  第四节:网站变更

  网站改版该如何通知百度

  为了改变站点运营效果,部分站长会选择对网站进行改版。百度站长平台站在搜索引擎的角度给站长朋友一些建议:首先站长们应该明确,网站只要发生大大的变化(如换域名、子目录改版为二级域名等),流量就会受到损失;其次,百度站长平台会帮助站长尽量将损失降到最低。请站长依次走完以下步骤以减少损失。

  第一步:设置301跳转

  使用301跳转进行重定向,跳转最好有规律可循,百度搜索引擎会自动进行处理

  提醒:301跳转要保持一段时间,直至新网页的抓取、收录、排序达到预期。

  第二步:使用改版工具

  使用百度站长平台工具,可加速百度搜索引擎对301跳转的处理,尽快完成新旧内容的衔接。目前改版工具除了支持换域名外,还可以支持站点级改版和目录级改版,都是通过工具的“目录改版”功能实现的。

  工具地址:http://zhanzhang.baidu.com/rewrite/index

  1,当站点级改版时,需要在“目录改版 改版范围”处提交站点级首页URL

  如www.example.com/,百度将会对该站点下的所有页面进行改版处理。

  2,当站点要进行目录级改版时,依然在“目录改版 改版范围”处进行提交,但提交的应该是需要改版的目录,而非站点级首页URL。

  如提交“www.example.com/a/”,百度会对www.example.com/a/,包括www.example.com/a/b/进行改版处理。

  具体使用方法可参考百度站长平台已有的文章《网站改版工具帮助》

  网站换域名该如何通知百度

  部分站长会选择通过换域名来提高站点运营效果,但站长们应该明确一点:网站只要发生大大的变化(如换域名、子目录改版为二级域名等),流量就会受到损失;其次,百度站长平台会帮助站长尽量将损失降到最低。请站长依次走完以下步骤以减少损失。

  第一步:通过301完成新旧内容跳转

  使用301跳转对页面进行重定向,不仅首页需要设置,旧域名所有页面都应该301指向新域名的相应页面。百度搜索引擎会自动进行处理

  提醒:原网页301跳转要保持一段时间,直至新网页的抓取、收录、排序达到预期。

3  /  4
阅读442
分享
写评论...