央视网|中国网络电视台|网站地图
客服设为首页
登录

中国网络电视台 > 经济台 > 财经资讯 >

为什么权威部门统计数据与百姓生活体验不一致?

发布时间:2011年09月15日 17:47 | 进入复兴论坛 | 来源:中国日报网


评分
意见反馈 意见反馈 顶 踩 收藏 收藏
channelId 1 1 1

数字漫天飞,虚实真难辨 朱慧卿绘(人民日报发)

  我该相信谁的调查(民生视线)

  曾两度出任英国首相的本杰明?迪斯雷利有句名言,“世界上有三种谎言:谎言、该死的谎言,还有统计数据。”事实上,统计数据本身并无罪,可人们往往喜欢滥用统计工具来支撑自己的立场,而不是反映真实情况。

  如今,来自于方方面面的统计数据、调查数据越来越多,并日益影响到普通人的生活和心态。面对海量的数据,该如何分析辨别?记者采访了有关专家。

  正点率、物价涨幅怎么和我感受不同?

  统计数据常是“一篮子”项目的全国综合水平,往往与个人感受不一致;某些指标或算法有特定的含义

  去年下半年以来,看着菜价、肉价一路飙升,退休职工田英开始关心起CPI。不过每个月和自己的家庭账本“对账”时,田英总会很疑惑:“我账本里的肉价、菜价都翻一两倍了,房租也涨了两成,可当月CPI还是个位数,这统计局的数据是不是造假了?”

  和田英一样对官方数据抱有怀疑的还有常在京沪之间出差的薛先生。根据中国民用航空局的统计,2010年民航航班正点率为75.5%,可这个数据与薛先生的感受大相径庭。“怎么可能这么高?我去年跑上海,就没一次准点过!尤其是世博会期间,航班延误一般都要两三个小时!”

  为什么这些权威部门的统计数据,与百姓的生活体验不一致呢?

  一是人们往往喜欢用少数商品的价格水平或服务水平,与相关部门统计的“一篮子”商品或服务项目的综合平均水平相比较。比如田英的账本仅记录了自己家附近农贸市场的菜价和自家的房租变化。而统计局公布的CPI构成分八大类262个基本分类,价格往往有升有降,而且各分类的权重也不同。

  二是人们往往喜欢用某一地域的价格水平或服务水平,与全省、全国的平均水平相比较。比如,薛先生就是用自己经历的某一条航线某几个航班的准点率,与全国范围所有航线所有班次的正点率相比较。

  三是人们对某一调查的样本及统计口径不了解。统计口径是指统计数据所采用的标准,包括统计方式、统计范围等指标。统计方法又包括抽样调查、全面统计等。不同的统计口径会导致完全不同的统计结果。例如,今年5月国家统计局公布的“2010年城镇居民人均居住月支出111元”就是个狭义口径,购建房款支出不包含在内,只统计实际发生的房租、供暖费、维修费等现金支出。而且该调查样本有80%以上是自有住房户,20%是租房户,因此样本中的“零房租”大大拉低了最终的平均支出水平。

  清华大学新闻与传播学院教授金兼斌长期研究媒介调查与统计方法。他认为,“有些指标的定义或者算法,民众可能不太清楚。例如物价指数是一个有多个子指标计算合成的综合指标。但如果人们只关注或比较关注其中个别指标,则两者的涨跌状况有时会有出入。因此,在有关部门不断完善统计方法的同时,也需要提高民众的统计素养和科学素养。”

  目前,统计部门对外公布的各种报告中,都会附有该项调查的统计口径、统计样本、统计方法以及具体名词的解释,以便研究机构或大众媒体更科学地解读和运用数据。比如目前的“城镇登记失业率”,这项统计针对的是非农业户口、在一定的劳动年龄内、有劳动能力、无业而要求就业并在当地就业服务机构进行求职登记的人员,不包括农村劳动力、国有及集体企业下岗职工,以及未主动登记的其他城镇失业人员;“城镇职工平均工资”,包括了工资、津贴、奖金,以及个人应交纳的养老、医疗、住房等个人账户的基金和税金。

  不过也有人建议,这些民生调查的统计口径与样本应继续完善,使之更合乎现实国情。例如,城镇居民人均居住月支出调查中80%的样本为自有房住户,这一比例是否偏高?如果以该统计数据为参考,那么各地是否会丧失巩固房地产调控政策、大力发展保障房的动力?如果“失业率”的统计口径与方法能随着时代发展而不断完善,是不是就会使感觉自己“被就业”的人群相应减少呢?

  仅凭平均数可能会被误导?

  平均数不能代表一组数据,更不能反映一组数据间有多大差异,还会受到极端值的巨大影响

  大学生小仇还没毕业,就掉进了“平均数的陷阱”。她曾到一家展会公司求职,被老板告知企业平均工资为3000元,她的实习起薪是800元。后来她托熟人一打听,发现公司业务员的薪水都是1000元,便去找老板理论。

  老板给她算了一笔账:公司业务员10名,薪水1000元;业务经理5名,薪水2000元;部门主管6名,薪水2500元;副总经理拿10000元,总经理拿24000元。由于收入差距悬殊,全体人员一平均,平均工资确实是3000元。而对于小仇这样的求职者而言,一组数据中出现最多的数值——众数,即大多数员工的工资1000元,以及一组数据从小到大排列位于中间的数值——中位数,即员工中等工资2000元,可能比平均数更具有参考价值。

  实际上,小仇的经历也反映了目前统计数据无法反映社会收入分配差距的问题。2010年我国城镇非私营单位在岗职工年平均工资为37147元。其中,最高工资行业与最低工资行业年平均工资之比为4.7∶1;最高工资行业金融业中,非私营单位与私营单位在岗职工年平均工资之比为2.6∶1。由于行业差距、地域差距,以及同行业中不同企业、同企业中不同级别的收入差距,导致低收入群体在看到37147元时,往往产生“被增收”的感觉,而高收入人群看到37147元时,又觉得该数值被严重低估。

  由于可以简洁地反映样本总体的情况,统计中的“平均数”无处不在。然而平均数也具有误导性,常会掩盖原始数据的信息,还会受到极端值的巨大影响。比如在中小学里,班级平均分往往会因为一两名不及格的学生而大幅下滑,因此总有老师会愤懑地说:“真是一颗坏小豆,毁了一锅粥”。再比如,在各种体育、文艺比赛中,往往会“减去一个最高分、再减去一个最低分”,这也是因为将少数异常值去掉后计算出的平均值具有更好的代表性与稳定性。

  “仅靠平均数不能反映一组数据间有多大差异。平均数通常需要与标准偏差结合起来报告或考察,才能得出相对全面的分布描述。”金兼斌认为,人们对统计数据产生误读或误解,往往是因为有关部门发布这些调查数据时,只报告了平均数,而没有解释相关指标的分布差异情况。“那些与平均数水平差别较大的民众,会觉得调查结果与他们实际感受有出入,进而认为数据有问题。”

  实际上,统计是无限接近现实,却不能代替现实,很多统计数据只能反映宏观趋势的变化,不适合作为个体选择的参考。比如,统计部门公布的商品住房销售均价、销售额与销售面积,在研究一个区域的经济、产业走势上的作用突出,对单一购房者,这种“均价”在判断房价走势、决定是否该买房等方面,没有太多参考价值。

  哪些调查的“百分比”不可信?

  样本容量小、抽样不科学,一些街边问卷与网上调查的结果不可偏听偏信

  “89.3%的人坦言物价上涨影响生活”、“一半人认为房屋单位售价在5000元以下最能接受”……每天电视、报纸、网络都在刊登着各种调查机构的调查结果,这些耸动视听的“百分比”调查结果真的反映了现实情况吗?

  张小姐曾经供职于北京一家小型的信息咨询公司。她接到的第一份工作就是问卷调查都市人群的牙齿保健行为。但令她不解的是,公司并没有采取严格的抽样方法,而是让员工和临时志愿者去城市商圈、地铁站等处,临时找人填写问卷。而且问卷中的一些问题,受访人可能不会真实回答。“比如您现在存在哪些口腔问题,我想不会有人主动选择口臭一项。而且上班时间逛商场的人群是否就能代表这个都市的基本面,我也很怀疑。”

  金兼斌认为,统计数字误导最常见来自抽样问题。抽样调查首先要保证一定的样本容量。另一方面,样本能很好地代表总体,避免调查受到社会倾向的影响。“例如,恐怕很少有人愿意填写问卷承认自己歧视农民工,但实际言行显然是另一回事。”

  不仅是街头问卷调查,很多所谓的网上民意调查的结果也值得商榷。例如今年8月,中国青年报社会调查中心的一项网络调查显示,83.2%的受访者确认现在社会谣言很多,其中34.4%的人表示“非常多”。大量媒体据此撰文“八成民众认为现在社会谣言很多”。实际上,该调查是仅对1714人进行的在线调查,而且参与者最可能是上述网站的常客以及曾经历过该话题的人群。媒体的结论显然有以偏概全之嫌。

  网络调查是一种计算机辅助的信函访问方式。通过电子邮件和互联网页面,被调查者可以轻松而不受拘束地完成调查,提高了调查的便捷性。但网络调查不能实现人口全覆盖,且受到虚拟匿名等局限,真实性很难鉴别。(人民日报)