国家广播电视总局官方微信于12月26日对外宣布,国家广播电视总局广播电视节目收视综合评价大数据系统基本建成并开通试运行,欲从源头上解决近年来收视调查等方面出现的问题。
公开资料显示,此次开通试运行的广播电视节目收视综合评价大数据系统主要通过建立与网络传输机构之间的安全通道,汇聚大样本用户收视行为数据,经清洗、转换、分析与挖掘,输出开机用户数、观看用户数、收视率、市场占有率等30项核心指标。
相较此前的电视节目收视评价系统,此次上线的新系统样本较多且覆盖较广,初期汇集4000万有线电视和IPTV样本用户的收视数据,且全面涵盖直播、回看、点播等多种收视方式,并将逐步扩展至数亿级样本规模,实现样本全覆盖。与此同时,新系统既可以反映热门节目、黄金时段的收视情况,又可以精准捕捉小众节目、边缘时段的收视特征。
近年来,我国收视造假情况时常发生,甚至已经形成一条黑色产业链且明码标价,收费达到100万元/集,此前也曾有消息称,现阶段做收视率的利益集团每年非法收入能达到数十亿元,而主要造假方式之一就是污染收视数据。
针对这一问题,新系统也在该方面进行优化。据介绍,新系统的数据采集、清洗、分析、呈现等各环节无缝衔接,全流程自动化、封闭化处理,可有效防范人为操纵。基于海量大数据统计,个体样本数据污染对统计结果的影响可忽略。举例来看,同样对于500万用户的某城市,如果针对某节目污染500个抽样中的5个样本用户数据,该节目的收视率可提升或降低1%。如果该节目的真实收视率为2%,统计偏差可达50%。但对本系统而言,这种情况仅会对该节目的收视率影响百万分之一,统计误差基本可忽略不计。