相关指标定义:
①中国互联网用户(Internet User of China):DCCI执行相对严格的定义,即每周至少登陆、使用、访问互联网至少一次者方被定义为中国互联网受众/用户。
②统计样本(Sample):DCCI根据CNNIC及中国国家统计局等机构颁布的中国互联网用户分布结构及中国人口分布结构,在注册、安装中国互联网客户端固定样本组(Panel)软件的用户范围内,依据样本结构进行随机抽取、反向剔除、身份确认。用户需要实名注册、在统计周期内持续安装、正常运行中国互联网客户端固定样本组(Panel)软件,且用户本人必须符合中国互联网用户特征参数的受众/用户。月度到达率统计样本要求该样本一个月之内的四个平均分布的时间段至少登陆、使用、访问过互联网四次或者四次以上。
③搜索引擎用户(Search engine user):月度时间区间内,在统计样本中,至少发出一次关键字搜索请求的中国互联网用户。
④访问(Visit):用户与网站产生交互行为,发出一个访问请求并且在用户端完成页面下载过程,计为一次访问。
⑤月度到达率(Monthly reach rate):指中国互联网客户端固定样本组(Panel)Netmonitor网络监测系统月度符合样本结构等要求的有效统计样本中当月至少主动成功访问过一次某特定网站的样本量占当月有效样本总量的百分比。
⑥月度人均不重复搜索关键字数(Average unduplicated key words per search engine user per month):某搜索网站平均每个进行过关键字搜索的用户对该搜索网站在一个月内发出的不重复的关键字搜索请求的总数量。
⑦月度人均搜索次数(Search times per search engine user per month):某搜索网站平均每个进行过关键字搜索的用户对该搜索网站在一个月内发出的任何一个十分钟间隔内不重复的关键字搜索请求的总数量。
⑧月度人均搜索翻页数(Search result pages per search engine user per month):某搜索网站平均每个进行过关键字搜索的用户对该搜索网站在一个月内的使用搜索引擎的翻页数量(包括搜索结果的第一页)。
⑨月度人均单次搜索翻页数(Average search result pages per search):该指标为月度人均搜索翻页数除以月度人均搜索次数的值。
相关数据调研方法:
DCCI采用基于客户端固定样本组(Panel)监测方法的Netmonitor网络监测系统。相关技术、样本、方法、规范、指标均为国际范围内进行网站/媒介监测和受众/用户测量最前沿、最主流的标准。Netratings、Comscore等在北美、欧洲等国家和地区进行广泛、连续的互联网监测时也采用类似的panel方法。通过用户许可协议,按照严格的样本招募方法招募固定样本群(panel),通过样本授权许可的客户端软件实时持续统计固定样本组的上网行为,统计分析互联网受众的应用行为、习惯、需求、消费,科学、进行深入系统的网站/媒介的连续性监测。
Netmonitor系统经过2005、2006两年时间的开发,2007年开始大规模募集样本。截止到2007年底,符合结构等指标要求的有效样本量已经超过5万个,2008年样本规模将有成倍增加。样本募集严格执行客户端固定样本组(Panel)监测方法的样本结构要求,对中国互联网受众/用户的总体统计误差要求在1%(置信度95%)范围内,对网站/媒介要求统计误差在5%(置信度95%)范围内。
基于客户端固定样本组(Panel)监测方法的Netmonitor系统,能够实现传统调研方法、网站/媒介自身所不能实现的动态、立体监测。基于客户端固定样本组(Panel)的监测方法,与以下几种方法在样本、技术、规范、指标、定义等方面完全不同:基于浏览器插件的信息收集与统计、应用软件附带进行的用户信息采集与统计、Alexa基于插件的网站排名、基于网页套嵌码的流量统计、基于网站日志的数据统计、基于线下或者线上问卷进行的调研统计等。所以,相关统计数据以及能够产生的结果也存在较多差异。
相关数据统计差异:
1.样本募集结构、流程、定义和数据统计结果的差异。
基于客户端固定样本组(Panel)的监测方法,有效受众/用户的样本的募集和确认,基于CNNIC和国家统计局关于互联网用户结构和中国人口分布结构,严格执行随机抽取、反向剔除、身份确认的原则。用户在自愿、许可原则下实名注册、安装并持续正常运行调查软件。样本随时间推移进行更新、补充和校正。相关样本募集的流程、结构和原则避免了其它方法,尤其是基于插件的排名数据结构和结果失衡问题(插件即样本,或者无法基于用户信息进行深入的样本控制),也避免了作弊者通过程序提交虚假数据、制造流量、冲高排名等问题;样本募集采取非付费原则,避免了有偿样本的数据结构失真问题;更为严格的受众/用户定义(其他机构定义为半年访问一次或者只要访问一次即计为一个用户),使得系统所能产生的统计结果更加符合使用相关数据的产业投资者、网站决策者、广告投放者等专业人群的标准和需要。
2.方法本身的技术、局限和数据统计结果的差异。
以客户端固定样本组(Panel)监测方法与服务器端基于页面代码或者网站日志的监测方法相比较为例,前者相对于某一特定网站而言为抽样统计因而数据可能存在一定偏差,后者相对于某一特定网站为站内抽样或站内全流量统计数据因而相对完整。但是由于技术、费用等原因后者实际也经常采用站内抽样方法,另外由于数据来自站内,在外部的可信度偏低。
前者能够同时实现对受众/用户访问的几乎所有网站和互联网使用行为的监测、统计,能够对流量、用户进行各种横向统计分析,采用统一的样本、方法、指标、时间区间,而后者往往只能够在局部、在不同网站的不同时间段实现一个或者数个网站的流量数据统计,样本、指标、时间区间等不尽一致。
在数据结果上的差异是最主要的,以访问网站的独立用户数(UV)、页面浏览数(PV)、访问时长(duration)等3个指标的统计为例:
独立用户数(UV)的统计差异:如果受众/用户端电脑中Cookie被删除或者曾经被删除状态,则网站服务器端依据Cookie,对于访问该网站的用户数量统计结果会偏高。Comscore出具的一份研究报告曾经向美国业界表明,服务器端对用户数量的统计可能因此偏高30%以上。
页面访问量(page views)的统计差异——在服务器端的监测统计方式之下,机器人、搜索爬虫、作弊程序等带来的非有效用户页面访问请求都有可能被记录为有效页面访问。受众/用户向服务器发出访问请求后即使页面下载不完整、不成功,只要服务器记录到了访问请求都可能会被计为有效页面访问。每次访问30分钟之内连续点击同一个地址向同一个页面发出多次访问,可能会被记录为多个PV;页面打开后很快被关闭没有形成有效浏览的页面访问也会被计为有效PV。客户端固定样本组(Panel)监测方法中,这些都不会被记录为有效PV。
访问时长的统计差异:客户端固定样本组只统计用户电脑当中的当前活动窗口的活动时间且该时间有最大时长限制,同时可以测量离线时长。服务器端监测方法目前尚不能区分当前活动窗口和非活动窗口,无法按照与用户在客户端发生的应用行为完全相符的方式进行统计。
实现对于互联网网站/媒介与受众/用户的精确测量意义重大,但是目前中国国内各个方面尚处于初级阶段。据悉,DCCI将在客户端固定样本组(Panel)监测方法的Netmonitor网络监测系统的基础上,进一步联合业界各方不断探索、不断深入、不断完善,促进客观、有效的互联网数据的产生和使用,以此促进网站与用户能见度、网络广告与营销精准度的提高。
导读:相关指标定义: ①中国互联网用户(Internet User of China):DCCI执行相对严格的定义,即每周至少登陆、使用、访问互联网至少一次者方被定义为中国互联网受众/用户。 ②统计样本(Sample):DCCI根据CNNIC及中国国家统计局等机构颁布