[译] 网站分析 “三大” 度量(指标) | Web Analytics “Big Three” Definitions

阅读级别:中级
原文官网地址如下:
http://www.webanalyticsassociation.org/resource/resmgr/PDF_standards/WebAnalyticsDefinitionsBig3.pdf
关于翻译中需要注意的地方:
metrics:业界常见的中文翻译是”度量“,读者也可以将其理解成”指标“的意思。本文中对该词的翻译是参照业界常见的中文翻译进行翻译的。
网站分析 “三大” 度量
唯一访问者数(Unique Visitors)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/706003
访问数/会话数(Visits/Sessions)
页面浏览数(Page Views)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/705921
引言:
  从2006年下半年开始,网站分析协会标准委员会(以下简称:委员会)就致力于定义出公认的三个最重要的度量 - 唯一访问者数(Unique Visitors),访问数/会话数(Visits/Sessions),页面浏览数(Page Views)。
  标准委员会认为,以上三个度量是构成大多数网站分析概念的基础。此外,由于要理解网站分析的其它度量的前提,是要理解以上这三个度量,所以我们首先要先将关注点,放到这三个度量上。
  委员会向整个 WAA 的成员发送了调查请求,最后经过多轮调查,对反馈的信息和评论进行审阅,最终评选出这些度量。
  对于收集反馈信息而言是非常重要的,因此我们非常欢迎您提出宝贵的意见和想法。如果您想反馈您的信息,请发送邮件至 standards@webanalyticsassociation.org,与 Jason Burby 或 Angie Brown 联系。
基础概念体系概述
网站分析度量有三种类型 - count, ratio, 和 KPI:
  ·Count - 是最基本的统计单位。一般是一个数值,而不是一个比率。通常它是一个整数(例如,Visits = 12,398),但也可以是含有小数位(例如,Total Sales = $52,126.37)。
  ·Ratio - 典型的是由一个 count 除以另一个 count 得到的,但其分子或分母既可以是 count 也可以是 ratio。(使用 ratio 作为分子或分母的例子是”Stickiness“。)通常,此种类型的度量的值不是一个整数。由于它是一个比率,所以在这种类型的度量中,通常有“每”字出现。例如(每次访问的页面浏览数)。比率的概念定义了 ratio 本身,同时也定义了以此为基础的度量。(原文如下:A ratio’s definition defines the ratio itself, as well as any
underlying metrics.)
  ·KPI(Key Performance Indicator)(主要绩效指标) - 虽然 KPI 既可以是 count 也可以是 ratio,但它通常是 ratio。尽管基本的 count 和 ratio 可以用于所有类型的网站,但 KPI 中的 “Key” 却被注入到了商业战略中。因此,一套适宜的 KPI 就是网站和过程典型的不同之处。
(原文如下:)
  While basic counts and ratios can be used by all Web site types, a KPI is infused with business strategy — hence the term, “Key” — and therefore the set of appropriate KPIs typically differs between site and process types.
度量可以应用于以下三种范围中:
  ·Aggregate - 指定期间内,网站的总浏览量。
  ·Segmented - 指定期间内,网站流量的一个子集。通过按某种方式过滤出的网站流量,可以获得更有分析价值的数据。例如,按 campaign 进行过滤(例如,邮件(e-mail), 广告(banner), 按点击付费的广告(PPC), affiliate 等),或者是按访问者类型进行过滤(例如,新访问者与再访问者,再次购买者,high value 等),或者是按推荐网站(referrer)进行过滤。
  ·Individual - 在指定期间内,一个单一网站访问者的活动。
术语:唯一访问者数(Unique Visitors)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/706003
类型:Count
范围:Aggregate, Segmented
定义/计算:
  在指定期间内,推断出的独立用户数(过滤掉搜索引擎等爬虫(spider 或 robot)的访问)。独立用户在网站上的活动是由一次或多次访问组成的。在指定期间内,每个独立用户将被作为唯一访问者,在统计时,只被统计一次。
说明:
  身份认证,无论是积极的还是消极的,都是跟踪唯一访问者最准确的方法。然而,由于大多数网站并不要求用户必须登陆才能访问,因此,识别唯一访问者最常用的方法就是在 cookie 中保存一个唯一的 id。由于可能使用不同的方法来跟踪唯一访问者,所以,您应该询问您的工具提供商,了解它们是如何计算此度量的。
  统计唯一访问者数,通过是和一个期间相关的(最常见的期间是天,周,或月)。这是一个“不可相加”的度量。这意味着,不能将不同期间,访问不同页面或不同内容组上的唯一访问者数进行相加,因为,在一个期间内,一个访问者可能访问多个页面或产生多个访问(visits),所以访问者数和页面浏览数之前没有什么必然的联系,除非,一个访问者只访问一个页面。
  (关于对 cookie 的一些认识和误解,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/708377
  若 cookie 被删除,无论是删除了第一方 cookie 还是第三方 cookie,都会导致统计出的唯一访问者数比实际的要多。若用户禁用了 cookie,那么当用户访问网站时,就无法对该用户进行唯一访问者统计。由于处理该度量的方法不同,所以还要依赖于所使用的分析工具。询问您的工作提供商,了解当用户禁用了 cookie 时,您的工具是如何进行统计的。需要您特别留意这一点,因为这会影响那些和访问者相关的其它度量。
术语:访问数/会话数(Visits/Sessions)
类型:Count
范围:Aggregate, Segmented
定义/计算:
  访问是指与用户与网站之间的交互。而一个网站又是由一次或多次(例如:“页面浏览”(“page view”))请求组成的。这些请求就是分析师定义的内容单位。如果用户在指定的期间(即超时时间,该超时时间是指分析工具设置的超时时间,和网站的超时时间没有关系)内没有执行任何动作(典型的动作就是访问其它的页面),那么该会话就会被切断。
说明:
  不同的工具提供商会使用不同的策略来跟踪会话。询问您的工具提供商来了解该度量是如何被计算的。通常将访问超时时间设为 30 分钟,不过该值在大多数网站应用应用里是可配置的。
  一次典型的访问是由一次或多次页面浏览(请参照“页面浏览”的定义)组成的。但是,如果和网站之间的交互仅仅是文件下载,流媒体,Flash,或是其它非 HTML 内容的话,那么对这种请求而言,某些网站分析工具可能不将这种请求当成“页面”,但是这种请求依然会被当成是一次访问中的有效请求。理解该度量的关键就是用户与网站所展示出的内容进行的交互。
  不同时间内的访问数是可以进行累加的,但是不同页面浏览和不同内容组上的访问是不能进行累加的,因为一次访问可以包含多个页面浏览。
术语:页面浏览数(Page Views)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/705921
类型:Count
范围:Aggregate, Segmented
定义/计算:
  一个页面(分析师定义的内容单位)被浏览的次数。
说明:
  大多数网站分析工具允许客户指定哪些类型的文件或请求可以被当作是一个“页面”。特定的一些技术包括(并不局限于这些)Flash,AJAX,媒体文件,下载,文档和 PDF,虽然不是典型的“页面”,但是在某些工具中,也可以将它们当成“页面”。
  像 XML Feed (RSS 或 Atom)和邮件这种既可以通过浏览器发送,又可以通过非浏览器发送的内容,通常不计为“页面浏览数”,因为请求的内容或收到的内容与最终显示的内容并不一致。因此有一种解决方案是,在上述内容中插入一个基于图片的 Page Tag,从而来跟踪这些内容的浏览情况。
  Web 服务器返回的结果中包含状态码,代表请求的内容是否存在(状态码 400 - 499),或者是否出现了服务器错误(状态码 500 - 599)。遇到上述情况的请求,一般不应该被计为“页面浏览”,除非 Web 服务器为上述特定的出错状态指定了一个真实的页面。当遇到访问的内容不存在或出错的情况下,广泛的作法是在 Web 服务器(Apache 和 IIS)应用中进行设置,可以返回一个网站地图,搜索页面,或是帮助支持页面,从而替代默认的出错提示。
  若 Web 服务器返回的状态码(300 - 399)表示重定向到其它的页面时,通常也不将其计为“页面浏览数”,但是可以用于跟踪事件(例如,点击事件)用在特定设计的使用重定义作为一种统计机制的系统上。
  若 Web 服务器返回的状态码(200 - 299)表示成功返回响应结果时,其中一少部分状态码所表示的结果可能不会被计为“页面浏览”:状态码 202(Accepted)表示请求已经被服务器接受,并且服务器有可能或者也可能不会在之后返回请求结果。由于无法根据这种状态码来判断是否返回了请求结果,因此,页面浏览数中通常不包含这种情况。状态码 204(No Response)表示没有内容被返回,但也没有出错,所以浏览器会停留在请求之前的页面。它本质上是一个非事件。状态码 206(Partial Download)通常出现在大文件下载中(例如,下载 PDF)。该状态码表示只传输了一部分内容,因此,也不应该被计为页面浏览。
  通过过滤状态码排除一部分请求的方法,一般用在处理原始 Web 服务器 Log 文件的情况下,对于基于 Page Tag 实现的统计方法,并不需要这种过滤操作。工具提供商会根据不同的情况来决定哪些请求应该被统计。请咨询您的工具提供商来了解更多关于统计算法实现的信息。

坚持原创及高品质技术分享,您的支持将鼓励我继续创作!