你可能会吃惊,因为我们的物理学实际上也是不可能100%准确的,原因是我们都听说过的“不确定性原理(文后有注释)”。同样,网站分析也因为一个最基本的事实而无法准确,即:网站分析的监测媒介是浏览器和服务器,而不是真实的人,这注定了我们不可能寻求到准确的结果。
具体而言,就目前我们通常使用的两种监测方法——Server Log和Page Tag都不可能准确对网站分析的一些最基本度量进行计数。
Server Log的误差(Bias):image
Unique Visitor的误差:
如果用Server Log的方法监测数据,那么很显然,获取真实的访问者数量是不可能的任务。本身Server Log对于访问者的估算只能依据误差巨大IP,而网络爬虫/机器人的访问又使这种误差进一步扩大。
Page View的误差:
本来Server Log是可以很准确的记录Page View的,但是可惜Cache的出现让这成为历史。Cache极有可能会屏蔽服务器端的响应,这样Server Log可能不会留下任何关于某次Page View记录。
时间记录的误差:
在没有Cache干扰的情况下,服务器能准确探知访问开始的时间,但是访问结束的时间无法了解。因为访问结束往往是随关闭浏览器而一同结束的。关闭浏览器本身不能激发一条新的Server Log记录。
Flash站点误差:
如果一个网站主要构成部分是包含多个页面的一个Flash文件,或多个此类Flash文件的组合,那么Server Log不会记录Flash内部的操作,监测会几乎失效。
Page Tag的误差:
Page Tag失效:
Page Tag失效是会发生的。首先,一部分浏览器(例如手机上的一些浏览器)不支持JavaScript或者被设置为JavaScript禁止。其次,Page Tag可能会因为它之前的JavaScript出错而无法运行。再次,我们也看到过因为变量名冲突而发生Page Tag和页面上其他JavaScript冲突而无法运行的案例。最后,受网络速度的影响,页面上的Page Tag没有完全下载,浏览器就可能被人为关闭或者直接链向一个新的页面。
显然,如果Page Tag失效,那么网站分析工具就会失去部分或者全部数据。
Page Tag的位置:
Page Tag在页面中的位置会影响网站分析工具的计数。如果Page Tag在页面的上端,那么它会更快的被执行,受到其他因素(例如Page Tag之前其他JavaScript失效或者网速问题)干扰的情况就越小,计数也就会因此增大。Stone Temple Consulting的统计表明,代码在上的情况下,Visitor计数比在页面下的多4.3%。
Unique Visitor的误差:
一个计算机可能被多人使用;一个计算机可能有多个浏览器(造成访问同一个网站有多个Cookie);人们会删除Cookie(2007年comScore的统计表明,一个月内有30%的美国用户会删除浏览器的Cookie);Cookie被禁用(尽管WA工具一般都使用第一方Cookie,但仍有约10%不到的第一方Cookie会被用户设为禁止)。
Page View的误差:主要由Page Tag失效引起。
时间记录的误差:同Server Log一样,Page Tag能够准确记录访问开始的时间,但是结束时间无法了解,因为一般情况下访问的结束并不会触发Page Tag的执行。
由于诸如Page View,访问者和访问时间之类的基本的度量实际上是无法准确记录的,因此其他一些更高级的度量,例如我们常用的复合度量(Bounce Rate,Avg. Time on Site)就更不可能准确了。不过,知道了这些误差产生的原因,有助于我们进一步修正误差。有些监测工具(例如DoubleClick,一个广告监测工具)具有自修正功能,就是利用了这个原理。
其他监测方法的误差:
网站分析的其他获取数据的方式——比如通过客户端的软件搜集数据(Alexa,iResearch等),以及Sniffer(包嗅探)——则因其本身的监测方式所限,会有更大的误差。例如,通过客户端来搜集数据,很显然存在样本量的偏差;而Sniffer本质上是Server Log方式的翻版,但却增加了包丢失以及数据记录有限的问题。它们不可能比我们前面的两种方法更准确。
附:不确定性原理
不确定性原理(Uncertainty principle,又称测不准原理)由海森堡于1927年提出,这个理论是说,你不可能同时知道一个粒子的位置和它的速度,粒子位置的不确定性,必然大于或等于普朗克斯常数除于4π(ΔxΔp≥h/4π),这表明微观世界的粒子行为与宏观物质很不一样。此外,不确定原理涉及很多深刻的哲学问题,用海森堡自己的话说:“在因果律的陈述中,即‘若确切地知道现在,就能预见未来’,所错误的并不是结论,而是前提。我们不能知道现在的所有细节,是一种原则性的事情。”
测不准原理
德国物理学家海森堡1927年提出的不确定性原理是量子力学的产物。这项原则陈述了精确确定一个粒子,例如原子周围的电子的位置和动量是有限制。这个不确定性来自两个因素,首先测量某东西的行为将会不可避免地扰乱那个事物,从而改变它的状态;其次,因为量子世界不是具体的,但基于概率,精确确定一个粒子状态存在更深刻更根本的限制。
海森堡测不准原理是通过一些实验来论证的。设想用一个γ射线显微镜来观察一个电子的坐标,因为γ射线显微镜的分辨本领受到波长λ的限制,所用光的波长λ越短,显微镜的分辨率越高,从而测定电子坐标不确定的程度△q就越小,所以△q∝λ。但另一方面,光照射到电子,可以看成是光量子和电子的碰撞,波长λ越短,光量子的动量就越大,所以有△p∝1/λ。
再比如,用将光照到一个粒子上的方式来测量一个粒子的位置和速度,一部分光波被此粒子散射开来,由此指明其位置。但人们不可能将粒子的位置确定到比光的两个波峰之间的距离更小的程度,所以为了精确测定粒子的位置,必须用短波长的光。
但普朗克的量子假设,人们不能用任意小量的光:人们至少要用一个光量子。这量子会扰动粒子,并以一种不能预见的方式改变粒子的速度。
所以,简单来说,就是如果要想测定一个量子的精确位置的话,那么就需要用波长尽量短的波,这样的话,对这个量子的扰动也会越大,对它的速度测量也会越不精确;如果想要精确测量一个量子的速度,那就要用波长较长的波,那就不能精确测定它的位置。
于是,经过一番推理计算,海森堡得出:△q△p≥ħ/4π。海森堡写道:“在位置被测定的一瞬,即当光子正被电子偏转时,电子的动量发生一个不连续的变化,因此,在确知电子位置的瞬间,关于它的动量我们就只能知道相应于其不连续变化的大小的程度。于是,位置测定得越准确,动量的测定就越不准确,反之亦然。”
海森堡还通过对确定原子磁矩的斯特恩-盖拉赫实验的分析证明,原子穿过偏转所费的时间△T越长,能量测量中的不确定性△E就越小。再加上德布罗意关系λ=h/p,海森伯得到△E△T≥h/4π,并且作出结论:“能量的准确测定如何,只有靠相应的对时间的测不准量才能得到。”
简介
在量子力学里,不确定性原理(Uncertainty principle)表明,粒子的位置与动量不可同时被确定,位置的不确定性与动量的不确定性遵守不等式ΔxΔp≥h/4π
其中,是约化普朗克常数。
维尔纳·海森堡于1927年发表论文给出这原理的原本启发式论述,因此这原理又称为“海森堡不确定性原理”。根据海森堡的表述,测量这动作不可避免的搅扰了被测量粒子的运动状态,因此产生不确定性。同年稍后,厄尔·肯纳德(Earl Kennard)给出另一种表述。隔年,赫尔曼·外尔也独立获得这结果。按照肯纳德的表述,位置的不确定性与动量的不确定性是粒子的秉性,无法同时压抑至低于某极限关系式,与测量的动作无关。这样,对于不确定性原理,有两种完全不同的表述。追根究柢,这两种表述等价,可以从其中任意一种表述推导出另一种表述。
长久以来,不确定性原理与另一种类似的物理效应(称为观察者效应)时常会被混淆在一起。观察者效应指出,对于系统的测量不可避免地会影响到这系统。为了解释量子不确定性,海森堡的表述所援用的是量子层级的观察者效应。之后,物理学者渐渐发觉,肯纳德的表述所涉及的不确定性原理是所有类波系统的内秉性质,它之所以会出现于量子力学完全是因为量子物体的波粒二象性,它实际表现出量子系统的基础性质,而不是对于当今科技实验观测能力的定量评估。在这里特别强调,测量不是只有实验观察者参与的过程,而是经典物体与量子物体之间的相互作用,不论是否有任何观察者参与这过程。
类似的不确定性关系式也存在于能量和时间、角动量和角度等物理量之间。由于不确定性原理是量子力学的重要结果,很多一般实验都时常会涉及到关于它的一些问题。有些实验会特别检验这原理或类似的原理。例如,检验发生于超导系统或量子光学系统的“数字-相位不确定性原理”。对于不确定性原理的相关研究可以用来发展引力波干涉仪所需要的低噪声科技。
该原理表明:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。测量一对共轭量的误差(标准差)的乘积必然大于常数h/4π(h是普朗克常数)是海森堡在1927年首先提出的,它反映了微观粒子运动的基本规律——以共轭量为自变量的概率幅函数(波函数)构成傅立叶变换对;以及量子力学的基本关系(E=h/2π*ω,p=h/2π*k),是物理学中又一条重要原理。