单页应用（Single Page Application）的搜索引擎优化

敖游

2016-03-09

来源：遨游建站

　　【方案一：尽人皆知的Google抓取AJAX方案】

　　如何让搜索引擎抓取AJAX内容？

　　A proposal for making AJAX crawlable

　　Google给了官方指导，并在Twitter上做了个最大的case，但后来T家放弃了，我想更多是T战略上的放弃。腾讯的ISUX博客上也曾经推广过这种方式，居然是在2014年，如下文：单页应用的SEO浅谈

　　总的来说，这种方案可以兼容Google，如果资源实在有限，有着能抓多少是多少的心态，可以试试。主要不幸的是，5年前Google已和我们再见了

　　【方案二：再做一个服务端生成内容的镜像网站】

　　说实话，量级不大的网站并且极度依赖搜索引擎这个渠道的情况下，这不失为一种方案，第一，蜘蛛绝对可抓取；第二，URL规则的完全可控（要知道现在流行的路由方式，在配置URL规则上相对于URLrewrite是有天生缺陷的）；第三，SPA模式URL衍生的所有问题不再是问题。

　　但是面临的问题也令我望而却步：我要说服team再维护一个一模一样的网站，不是做完了事，是维护，这意味着修Bug要有资源修，改版要有资源改（能说服自己搜索进来然后点两下看到的网站不一样吗？）、所有相关功能的测试、发布、常规测试，都要耦合在一起，当站点大到一定程度，流程前所未有地臃肿，推进无休止的争吵，所有烦恼包围着我，让我想静静。我预计自己会累垮，即使搞定了所有的资源，网站优化人员自身也将面临着非常繁重的工作，两个网站怎么融合，适配跳转怎么设定，是否需要主动判断蜘蛛展现不同的内容，内链入口怎么放，都是耦合，且是硬耦合，网站大了页面多了，越做耦合越多，以后一碰就是坑。

　　【方案三：HTML5 history 中的PushState】

　　还好，开发大大们总是不少奇巧淫技，这是个很”经典”的用法，配合<noscript>这个擦边球标签，既能实现URL的自定义，又能实现还算有效果的内容抓取。蜘蛛、浏览器，两方应对，给蜘蛛不带井号能抓取的URL，给浏览器访问非井号URL时中间做转换，这样的话每张页面都有了可抓取的URL，且依然使用着高逼格的SPA架构。内链可以做了，Sitemap可以做了，适配也轻松了。

　　但实际上，蜘蛛在这种页面上还是盲的，所有内容要仰仗于noscript这个标签里塞的数据，以及搜索引擎对这个标签的支持程度。

　　做到这一步，单就需求而言，搜索引擎的抓取从HTML规范讲完成了，但这种方式没有任何搜索承认过支持，包括最核心的那个对于noscript标签的支持。

　　【方案四：用更高效的方式完成两套页面】

　　再回到那个简单的架构图，SPA这种架构，渲染是在客户端（浏览器）完成的，大致流程如下：

　　蜘蛛无法执行JS，相应的页面内容无从抓取，弊端还是那个弊端。但我们知道，传统的服务端生成页面，response里已经是服务器渲染组装好的HTML代码，浏览器只负责正确地展现，蜘蛛负责正确的解析，所以，我们需要给蜘蛛渲染完成的HTML，那么你的框架需要兼容如下流程的功能。

2 / 3

百度官方SEO优化软文

阅读原文

阅读137

下一篇：【移动搜索】百度LEE漫谈移动化

写评论...