网站分析基础系列(2)——UV

日期:2014-06-11点击:2314
        UV,在网络分析里面是非常重要的一个Metric(Metric的意思是度量衡,例如一米两米的米就是一个Metric),也是一个重要的KPI。(什么是KPI?KPI是Key Performance Indicator的缩写,意思就是最重要的参数)。UV是Unique Visitor的简称,意思是唯一的访问者。想要搞清楚这个KPI的意义。首先可以了解一下什么是Visitor。Visitor的汉语意思是访问者,就是访问网站的人。为什么不用“用户”(User)这个名词呢?User对应的是某个Application(应用),或者是某种Service(服务),但是访问网页的人,还是用Visitor更准确,而且也是约定熟成的咯。
  访问网站的人很容易理解,但是前面加了一个Unique就有点儿费解了。——难道每个访问的人不是独一无二的吗?难道还有其他跟我一模一样的冒名顶替者?
  不,不!不是这个意思,我们(人类)分辨一个一个的个体当然很容易,每个人都是独一无二的,没有两个Sidney Song,也没有两个你。可是,我们在进行网络分析的时候,都是要通过某种软件工具完成的,这些工具怎么能知道一段时间内访问网站的人,到底有多少呢?
  举个例子:网络软件工具记录了访问互联网分析沙龙的来访纪录一天有10次,那么,它可以简单的告诉你,有10个人访问了你的网站。
 
  显然,这是不符合真实情况的,因为,很可能,你,我亲爱的读者,登上了网页,然后看了半个小时,又关闭了浏览器,干别的去了,过了1个小时再回来,又重新打开收藏夹,点出我的页面,又看了一会儿。
  对于记录访问网站的软件工具而言,你相隔1个小时的两次访问被毫无疑义的记录为两次访问,但是如果同时也记录下了有两个访问者分别访问就不正确了。因为你虽然访问了两次,但两次都是你,而不是换了一个人访问了我的网站。换句话说,你是这些不同访问记录的唯一的访问者。
  也就是说,软件工具应该记录:Visit = 2; Visitor =1,而不是Visit = 2; Visitor = 2。由于你是这些访问记录的唯一访问者,因此我们可以让软件工具这样记录:Visit = 2; Unique Visitor = 1,或者更简单:Visit = 2; UV = 1。
  因此,我们前面假设的10次访问,很有可能不是来自于10个不同的访问者,而是来自于少于10个访问者,因为很有可能,某些访问者同您一样,一段时间内多次访问了我的网站。如果这10次访问是来自于9个访问者,那么我们可以确定一定有一个人访问了2次,而对这2次访问而言,这个人就是它们(2个Visits)的独一无二的访问者(UV)。当然,完全有可能出现1个人在一段时间内包办这所有10次访问的情况,那么这个人就是这10个Visits的UV。
  绕口的说了这么多,我想你一定明白了,Unique Visitor,或称UV,是相对于访问(Visit)而言的,一个访问者可以产生多个Visits,这些Visits对应的只是这个独一无二的人,而没有其他人,因此就有了UV的概念。
  同Visit有另外一个说法叫“Session”一样,Unique Visitor也有另外一个说法,叫“Reach”,不过后者因为意思不是很清晰,所以也用的很少。
  现在的问题是,软件工具怎么知道哪些Visits是来自于某一个Visitor的呢?
有两种方法。但在讲这两种方法之前,必须要清楚一个概念,那就是服务器和浏览器(B/S)的概念,如果你已经清楚的了解这个概念。没关系,直接跳过下面字号较小的内容吧!
 
我们都知道我们在浏览网页的时候,网页是要通过浏览器(Browser,简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话,如果这样还要网线干什么,每月也不用给电信局交钱了),而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里,而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑,里面存放了很多的网页内容,这个电脑叫做服务器(Server,简写为S),或者更确切说叫网站服务器(Web Server),而你自己的电脑叫做客户端。当打开一个网页的时候,需要首先打开客户端的浏览器,然后在浏览器的地址栏输入你想上的网站的地址,此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest),然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code,主要是HTML Code)发到你的浏览器上。而浏览器有一个神奇的功能,那就是把这些Code变成可以供你阅读的文字(Text),链接(Link),图片(Graphic),音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网,也能够看到我的这个博客的原因。当然,其中的过程比我这一段文字要复杂的多,而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。
  那么,网络分析软件有哪两种方法分辨出Unique Vistor呢?
有两种方法。但在讲这两种方法之前,必须要清楚一个概念,那就是服务器和浏览器(B/S)的概念:
  我们都知道我们在浏览网页的时候,网页是要通过浏览器(Browser,简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话,如果这样还要网线干什么,每月也不用给电信局交钱了),而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里,而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑,里面存放了很多的网页内容,这个电脑叫做服务器(Server,简写为S),或者更确切说叫网站服务器(Web Server),而你自己的电脑叫做客户端。当打开一个网页的时候,需要首先打开客户端的浏览器,然后在浏览器的地址栏输入你想上的网站的地址,此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest),然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code,主要是HTML Code)发到你的浏览器上。而浏览器有一个神奇的功能,那就是把这些Code变成可以供你阅读的文字(Text),链接(Link),图片(Graphic),音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网,也能够看到我的这个博客的原因。当然,其中的过程比我这一段文字要复杂的多,而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。
  那么,网络分析软件有哪两种方法分辨出Unique Vistor呢?
  方法一:让网站服务器分辨
  道理很简单,网站服务器每时每刻都会接到很多的页面请求,每一个请求信息内都包含了你的(实际上是你的电脑的)一些信息。这些信息包括很多内容,比如你的IP地址(呵呵,IP地址就不用我解释了吧,不知道就当它是你的计算机在互联网上的一个门牌号码吧!)、你发出请求的时间、你的浏览器的版本、你的操作系统的版本,以及其他一些古古怪怪的信息(实际上都是有作用的哦,只是我们现在没必要弄清楚它们)。
  网站服务器可以分析这些Request,如果这些Request满足一些共同的特征,比如来自同一个IP地址,且浏览器版本相同,或者再加上发出请求的时间接近等,它就认为这一串的Request对应的一系列Visits是来自于同一个Visitor的,这个Visitor就成为这些Visits的UV了。
  当然,如何定义这些共同的特征是由网站服务器的设置决定的。一般而言,用IP地址+其他特征共同限定来定义的情况比较多,但是IP地址实际上并不准确,尤其在局域网内有共用IP地址的多台计算机的情况发生的时候。不过,聊胜于无了!
 
  方法二:用Cookie分辨
  另外一个方法使用Cookie的方法分辨。什么?什么是Cookie?不了解Cookie就查一下Google或者Baidu吧!我就不解释了,说起来话挺长的。
  怎么分辨呢?当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,放到这个电脑的某个区域,一般是C盘里。这个Cookie会分配给你一个独一无二的编号,还会记录一些你访问服务器的信息,例如访问时间,访问了什么网页,以及与你这次访问有关的其他一些信息。当你下一次再访问这个服务器的时候,服务器就可以直接从你的电脑上找到上一次它放进去的这个Cookie,并且会对它进行一定的更新,但那个独一无二的编号不会改变。如果一段时间内,服务器发现两个Visits的对应的Cookie实际上是一个编号,那么,服务器就知道,尽管在这段时间内有不少次Visits,但都来自于一个客户端,那么一定就是一个Visitor了!
  这个方法比上一个要更精确些。但是存在的问题是,有些客户端为了保证更高级别的安全,关闭了Cookie的功能,或者你经常删除Cookie,这个方法就不能奏效了。
  因此,这样看来,两个方法都只能得到UV的近似值,但是不能得到精确值。什么?想要百分之百精确?那……除非进行一次100%准确的普查(这实际上也是不可能的),或者只有神知道了。
网站分析基础系列(1)——Visit
网站分析基础系列(2)——UV
网站分析基础系列(3)——PV(PageView)
网站分析基础系列(4)——跳出率(Bounce Rate)
网站分析基础系列(5)——Home Page和Landing Page
网站分析基础系列(6)——Impression,Click和CTR
网站分析基础系列(7)——Engagement
张生:13751841126
梁生:13826047785
.com