URL标准化是什么意思?如何标准化URL

敖游
2021-01-17
来源:遨游建站

URL标准化,英文全称为URL Canonicalize。现在互联网越来越讲究规范化,网站的URL标准化(URL canonicalization)是近两年来在各大搜索引擎的搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选最好的URL网址作为真正网址的过程。

通俗的说,就是将你的页面URL唯一化。导致页面URL多样化的原因有很多,主要包括包含www及不含www,动态页面及伪静态技术,302的临时重定向,一些JS或者Meta跳转等等。这些因素最基础的影响就是让搜索引擎无所适从,到底哪个URL才是你要使用的?所以,就产生了URL标准化的概念。


URL标准化是什么意思?如何标准化URL


URL标准化是什么意思


URL标准化是什么意思?URL标准化,英文:url canonicalization,来自“matt cutts”的博客文章:SEO advice: url canonicalization,中文翻译:SEO的建议:URL标准化 “URL标准化”是一个动名词,不好直接解释,我把它反过来一下:

什么是一个标准化的URL?

很多情况下,我们认为以下这几个链接都指向同一个页面(首页):

www.aoyouwl.com

aoyouwl.com/

www.aoyouwl.com/index.html

/index.php/index.php

aoyouwl.com/home.asp(ASP即“活动服务器网页”,是Active Server Page的缩写,ASP的网页文件的格式是.asp。ASP主要特性是HTML 、 脚本和 ActiveX ( 网络化多媒体对象技术) 组件等整合在一起,创建和运行动态的 、交互的和高性能的 Web 服务器应用程序。ASP 属于 ActiveX 技术中服务器端的技术,这与通常在客户端实现动态网页的技术如 Java apple t、JavaScript 等有所不同,ASP 的命令和脚本语句是在服务器中解释执行,执行后的结果产生 HTML。)

但是,从URL发送请求并返回网页内容的过程来看,这些URL都是互不相同的。对于上述URLs,Web服务器完全可以返回完全不同的内容。当这些URL所对应的内容都一样时(一般情况下都一样的),谷歌需要从上述URLs中选一个具有代表性的,而忽略其余的。那么这个被谷歌选择了的URL,就是一个标准化的URL。谷歌选择的这个过程称为“标准化”。


URL标准化的目的在于集中网站权重,通过技术手段可以实现。


什么是URL静态化?


现在搜索引擎越来越智能化,搜索引擎已经能够识别大部分的动态化的URL,站在整体角度,动态化的URL还是在一定程度上还是不如静态化的URL收录好。所以说我们在做好URL标准化的时候,把URL静态化也是必须要做好的工作。大家请根据自己的网站空间具体的情况去做好这一项重要的操作吧,这里如果不懂的请及时咨询下你的空间商是否支持静态化的URL。

在谈什么是URL静态化之前,了解两个概念:静态网页和动态网页。

(1)静态网页:静态网页一般是以”.html”、”.html”、”.shtml”、”.xml”等后缀的格式结尾的页面。

例如:https://www.aoyouwl.com/wmjcsydwxljynx.html 就是一个静态页面的url。

(2)动态网页:以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态页网址中含有一个或者多个标志性的符号”?”。

例如:https://www.aoyouwl.com/wzjs.html 就是一个动态页面的url。


URL静态化就是通过技术手段或者伪静态规则将动态的网址变为静态网页或者是伪静态网页。网页伪静态恰好解决了静态网页难维护,动态网页不友好的问题,一方面对于搜索引擎和用户来说比较友好。但是同样也存在缺点,就是占用cpu资源相对较大。


怎么实现URL静态化?


我们可以看出上边就是一个动态地址,就是数据基本都是在数据库里面调用出来的,影响搜索引擎抓取,我们要通过上传静态化文件,将动态网址伪静态。

url在网站优化中起到很重要的作用,网站内部优化不需要做到极致,但需要将能做的进了能做到最大化。

如果网站是使用的模板,最好到程序模板提供商处获取rewrite规则。如果是独立研发的网站程序,最好找专业程序员编写代码。现在主流的网站建设系统(遨游建站)都支持伪静态。只需要根据提示操作就可以了。

Apache环境下的伪静态规则就是:

方法一:在本地创建.htaccess文件后写入以下代码,上传到网站根目录下,就完成URL伪静态设置了。

RewriteEngine On

RewriteBase /

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^topic-(.+)\.html$ portal.php?mod=topic&topic=$1&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^article-([0-9]+)-([0-9]+)\.html$ portal.php?     mod=view&aid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^forum-(\w+)-([0-9]+)\.html$ forum.php?mod=forumdisplay&fid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ forum.php?mod=viewthread&tid=$1&extra=page\%3D$3&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^group-([0-9]+)-([0-9]+)\.html$ forum.php?mod=group&fid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^space-(username|uid)-(.+)\.html$ home.php?mod=space&$1=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^blog-([0-9]+)-([0-9]+)\.html$ home.php?mod=space&uid=$1&do=blog&id=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^archiver/(fid|tid)-([0-9]+)\.html$ archiver/index.php?action=$1&value=$2&%1

方法二

(1)打开httpd.conf文件,找到#LoadModule rewrite_module modules/mod_rewrite.so 注释前面#

(2)打开httpd-vhosts.conf文件,在VirtualHost添加重写规则,RewriteEngine _disibledevent=>

基本上就上面这两个步骤,,这种Apache中URL地址重写比较简单。

方法三

在httpd.conf或.htaccess中使用RewriteRule:

RewriteRule “^/dir/ ([^./]*) \.html” “/dir/script.cgi?doc=$1″   [PT][PT]标记告诉Apache执行后续的所有操作。

一般第三种方法用的最多,针对asp.net、asp等还有他们自己的伪静态规则,可以去研究一下。         

URL中包含关键词

通过我们的大量的研究证明,当你在优化一个指数很高关键词的时候,URL中包含该关键词的拼音或者直接利用该关键词作为域名在一定程度上,对我们的关键词排名会有一定的优势。所以说,当我们的在选择域名或者给我们的网站建立一级或者二级目录的时候,我们一定要在我们自定义的URL上去增加该关键词的拼音或者直接利用该关键词作为该目录的网址。

标准URL大小写

不管是我们在做内链还是在做外链的时候,我们在书写网站URL的时候,一定要统一该URL的具体写法,假设我们一直使用的是“小写”的写法,那么在以后我们不管是做内链还是外链的时候,我们全部统一成小写,假如是利用“大写”那么我们就统一成大写。这样做到的目的是为了更好让搜索引擎识别,避免搜索引擎误认为我们网站的URL重叠,从而对我们的网站降权。

尽量简短

上面说过我们的URL中要尽量包含网站的关键词或者拼音,但是我们的URL一定不能过长,我们的URL一定要尽量简短,便于用户记忆为佳,下次用户访问的时候,可能就会直接输入你的URL地址进行访问了。


为什么URL要静态化?


Google官方对SEO的建议是不进行URL静态化,原因有三点:

1、Google完全有能力抓取动态网址,多少个问号也不是问题。

2、动态网址更有助于Google蜘蛛读懂URL含义,URL里的参数都有助于Google理解URL及网页内容,并进行鉴别。而将网址静态化后,这些参数的意义通常就变得不明显了。

3、网址静态化很容易弄错,比如通常动态网址的参数调换顺序,所得到的页面其实是相同。尤其是对已经收录了动态网址静态化,收录静态页面后的两个网址Google就不容易判断是不是同一个页面,从而可能引起复制内容。

虽然说Google建议在SEO过程中不要URL静态化,但是在实际过程中,我们归根据实际情况对动态网址URL静态化。我们完全相信Google的技术能够对带几个参数的URL收录,但是并不意味着雅虎,百度,微软等搜索引擎能够做到,尤其是针对于中文搜索引擎。并且在SEO实践过程中发静态的URL明显排名靠前。动态网址一般比较长,不利于记忆,也不利于传播。


URL标准化


Google如何挑选标准化的URL


在没有做特殊设置的情况下,Google会根据外链的数量来确定标准化的URL,也就是哪个地址被外链引用的次数最多,哪个地址就是标准化的URL。所以我们在平时做外链的时候,就要确保地址的唯一性,不要有的地方用 “aoyouwl.com”,而有的地方又用 “www.aoyouwl.com”。统一你的外链地址,让Googel能够快速的确认你的标准化URL,以便给予合适的排名。

同样,我们在走内链的时候,也要考虑到标准化URL的问题!


谷歌是如何进行URL标准化的


首先我们要确定URL标准化设计的方面,主要是带www与不带www的地址,以及伪静态造成的重复收录等问题,我们可以采用不同的方式来解决这个问题。

常见的设置url是将不带www的网址转跳到带www,一定做的是301(记住只能做301 !302不可做)。在我们做外链的时候一定要将网址写成301跳转之后的网址。例如:www.aoyouwl.com 转跳到 aoyouwl.com 以后在做外链或者锚文本时候,就不要带www了,还有一些程序生成首页会出现后边带index.html或index.php,我们可以利用技术手段将其去掉。



1、301重定向


301重定向的意思是告诉搜索引擎我们的网址已经永久性的变更了,当我们的网站在进行改版或者更换域名的时候,我们则可以使用这样的一个301重定向的方式来告诉搜索引擎我们的网址已经永久性的变更了,这样做可以把以前域名的权重全部集中到新的URL上,当然在这个传递权重的过程中可能会需要一定的时间,这个时候我们则需要慢慢的等待即可。

经常会碰到这样的情况,其他网站链接你的站点时,会用下面的链接:

www.aoyouwl.com

aoyouwl.com/

www.aoyouwl.com/index.html

aoyouwl.com/index.php

而这样导致:你站点主域名的pr值分散到其他几个URLs了。

如果你用301重定向把其他三个URL转到

www.aoyouwl.com

PR也就集中在主域名:www.aoyouwl.com 了。

如果,我们决定采用带www的地址为唯一的地址,那么,我们可以使用301永久重定向代码,301重定向具体办法:

设置.htaccess文件(只适用于linux系统,并需要虚拟主机支持。)

使访问aoyouwl.com/的时候就会自动转到www.aoyouwl.com

在.htaccess文件里写上以下代码即可。

RewriteEngine on

RewriteCond %{http_host} ^aoyouwl.com [NC]

RewriteRule ^(.*)$ http://www.aoyouwl.com/ $1 [L,R=301]

将所有不带www的地址进行重定向!


2、采用Canonical标签


Canonical标签经常会被用在伪静态地址上。您可以查看本站所有页面的源代码,在Head部分都有一个“link rel=’canonical’”的标签,来标明这个页面的标准化地址,以便让Google进行确认,防止重复页面的收录。百度目前不支持该标签!


3、采用Robot.txt文件


由于百度不支持Canonical标签,我们可以结合使用robot文件来禁止搜索引擎收录部分格式的页面,以防止伪静态情况下的重复收录!比如我们用wordpress搭建博客时,采用了伪静态技术,另外也不希望一些管理文件被收录,则常见的wordpress博客Robots.txt文件写法为:

User-agent: * –所有搜索引擎蜘蛛

Disallow: /wp-*/ –不收录以WP-开头的文件夹

Disallow: */feed –不收录feed(包括单页,整站,评论的feed)

Disallow: */trackback –不收录引用

Disallow: /*?* –不收录动态页


4、如何将无效的URL重定向到其他页面?


很多时候,我们考虑把无效的URL比如:用户拼错的URL、不存在的URL重定向到别的网页,例如网站的首页、404页面等。

在httpd.conf或.htaccess文件中使用ErrorDocument来捕获404 (找不到文件)错误:

ErrorDocument 404/index.html

DirectoryIndex index.html/path/to/notfound.html

本功能会让所有的404错误——每次当某人请求无效的URL 时,都返回 URL/index.html 提供的网站首页。

这里需要注意两点:

4.1、直接指向首页是否是合适的?或者让它指向到一个404页面会更好些?如果在404页面用javasctrip做一个跳转到首页,也是SEO允许的做法。

4.2、即使返回有效的文件,仍然会将404 状态码返回给客户端和搜索引擎。这表示搜索引擎机器人来确认网站上的链接时,仍然会得到正确的结果(404状态码)。


5、改版时,如何保留原链接,创建新的URL?


具体操作办法(仅适用于apache网络服务器):

文件位置:apache->conf->httpd.conf

请在httpd.conf中使用Alias指令:

Alias /newurl/www/htdocs/oldurl

如:用户访问新的地址 example.com/newurl/id34.html 服务器将提供的内容原地址是 example.com/www/htdocs/oldurl/id34.html。

注意:Alias只会改变本地URL,如 fjseoer.com/newurl/id34.html 的/newurl/id34.html 部分,而无法改变URL的主机名称部分(如:http://www.fjseoer.com/ 部分)。若要更改URL的主机名称部分,请使用Redirect或RewriteRule指令。

遨游指南:本功能的Alias指令在 httpd.conf中是这一句: #Alias/webpath/full/filesystem/path 去掉前面的#,并做下相应的修改即可。

SEO过程中一般在这些情况下需要用到该功能:

5.1、当文件移动或文件目录名称发现改变,出于SEO需要,你需要保持旧的URL;

5.2、网站改版了,网站导航和链接发生变化,为了继续持有原链接带来的流量,你需要保持旧的URL;

5.3、你希望不同的人用不同URL来链接同一个的内容。(SEO一般不建议这样做)


6、如何替换请求URL中的文字


以下解决方案,仅适用于Apache服务器。

在.htaccess文件中添加以下语句:

RewriteCond %{REQUEST_URL} “string1”

RewriteRule “(.*)”string1(.*)” “$1string2$2” [N,PT]

例如当客户端发出请求URL:example.com/string1/abcstring1.html,则转换为目标URL:example.com/string2/abcstring2.html。

其中[N]标记告诉Apache重新执行重写规则,直到RewriteCond失效为止。只要请求URL中包含需要替换的字符串,它就会一直重复地执行。当所有的string1都被替换完毕,则RewriteCond失效。本例子中,RewriteCond执行了2次。[PT]告诉mod_rewrite把重写的URL传送到Apache来进行接下来的处理工作。

我们都知道,关键字是否在URL中对于网站SEO至关重要。对于建站初期不注重SEO的站点,特别是大型站点,本功能真是雪中送炭。

注意:使用本功能时,有时会把非目标字符也做了修改,假如例子中的“abcstring1”不是目标字符,但这个功能也会替换了它。


另外,敖游提醒各位:

1、网站所有URL尽量全bai部使用绝du对地址,可以有效的zhi防止网站被人dao家把恶意镜像。还有一重zhuan要的作用就是,网络中如shu果有人引用了你的网站内容,你会获得来自外界的导入链接。

2、尽量把带www与不带www的域名区别开来,尽量使用一个为常用的URL,然后另外一个做好301重定向。

3、动态URL和静态URL都差不多,正常来说影响不大,扩展名其实无关紧要。如:.html,.htm,.asp,.php等等,对搜索来说,并没有什么区别,关键一点,我们在做锚文本时,尽量选择一个常用的。

4、外链与内部链接尽量做到一致,意思其实同上,也就是做外链时尽量也做与锚文本一样的URL。

5、URL 尽量用简单的英文,最好能包括关键字的,一定要记住的我们URL不要大小写混写,建议全部用小写字母。

6、做内部锚文本时,一定要注意哪一个关键词指定的哪一个URL。千万不要出现同样的锚文本,而每次指向的URL不一样。(建议做一个长尾关键词记录单,这样可以一目了然,哪一个关键词对应哪一个URL)


好了,今天的分享就到这里。很多朋友喜欢找本地的建站优化公司,不知道是出于何种考虑?敖游还是要老话重提一下,无论你是找企业网站优化商城系统搭建,还是企业小程序设计、百度竞价托管代运营服务公司,最主要的还是要看靠不靠谱,如果不靠谱,就算是在你隔壁,一样让你不胜其烦!遨游建站是做品牌,不会因为地域差别而影响服务质量,价格方面处于中等水平,售后服务,我们始终秉承“一次建站、终身维护”的宗旨,彻底解决你的后顾之忧!所以,与我们合作,无需担心身处何地——我们始终以质量为服务基础!


阅读1376
分享
写评论...