大数据与统计学有什么联系?
实际上,虽然在大数据时代背景下,统计学的知识体系产生了一定程度的调整,但是统计学本身的理念与大数据还是具有一定区别的,统计学注重的是方式方法,而大数据则更关注于整个数据价值化的过程,大数据不仅需要统计学知识,还需要具备数学知识和计算机知识。从另一个角度来说,统计学为大数据进行数据价值化奠定了一定的基础。
从技术体系结构来看,统计学知识主要应用在大数据分析领域,统计学方式是大数据分析的两种主要方式之一,另一种数据分析方式是机器学习。所以,对于主攻大数据分析方向的研发人员来说,掌握统计学知识还是很有必要的,统计学在数据分析方面已经形成了一个较为系统的知识体系,而且很多技术已经经过了实践的检验。其实对于很多职场人来说,平时大部分的数据分析任务都是基于统计学理论进行的,包括采用的数据分析工具也都属于统计学领域的范畴。
从未来的发展趋势来看,一方面统计学会进一步向大数据倾斜,包括目前不少统计学专业的研究生课题,都逐渐开始向大数据方向拓展,另一方面大数据会在发展的初期大量采用统计学相关理论和技术,这也能够提升大数据相关技术的落地应用能力。
大数据与统计学有什么关系?
实际上,虽然在大数据时代背景下,统计学的知识体系产生了一定程度的调整,但是统计学本身的理念与大数据还是具有一定区别的,统计学注重的是方式方法,而大数据则更关注于整个数据价值化的过程,大数据不仅需要统计学知识,还需要具备数学知识和计算机知识。从另一个角度来说,统计学为大数据进行数据价值化奠定了一定的基础。
从技术体系结构来看,统计学知识主要应用在大数据分析领域,统计学方式是大数据分析的两种主要方式之一,另一种数据分析方式是机器学习。所以,对于主攻大数据分析方向的研发人员来说,掌握统计学知识还是很有必要的,统计学在数据分析方面已经形成了一个较为系统的知识体系,而且很多技术已经经过了实践的检验。其实对于很多职场人来说,平时大部分的数据分析任务都是基于统计学理论进行的,包括采用的数据分析工具也都属于统计学领域的范畴。
从未来的发展趋势来看,一方面统计学会进一步向大数据倾斜,包括目前不少统计学专业的研究生课题,都逐渐开始向大数据方向拓展,另一方面大数据会在发展的初期大量采用统计学相关理论和技术,这也能够提升大数据相关技术的落地应用能力。
大数据,政府统计的机遇与挑战
大数据,政府统计的机遇与挑战
对于政府统计机构来说,没有什么比数据更重要的了。我们研究统计分类标准、统计调查方法、统计数据采集方式、统计数据加工处理方法、统计数据评估技术,都是为了获取真实准确、完整及时、代表性强、分类科学、经济适用的统计数据。
大数据时代的到来,既给政府统计带来重大发展机遇,也带来严峻挑战。
一、大数据在政府统计中的应用
国家统计局高度重视大数据在政府统计中的应用。到目前为止,已经与17家大数据企业签订了战略合作协议。当然,目前大数据在中国政府统计中的应用仍处于起步阶段,主要表现在两个方面:一是大数据成为政府统计数据的部分资料来源;二是大数据成为政府统计数据质量的部分评估依据。
(一)大数据成为政府统计数据的部分资料来源
目前,大数据已经成为中国政府统计数据的部分资料来源,以下是几个有代表性的方面:
1.利用重点网上零售交易平台数据测算网上零售额
为了掌握网上零售交易平台的交易规模和结构,综合测算网上零售数据,从今年1月份开始,国家统计局实施了月度网上零售交易平台调查,调查范围为42家重点网上零售交易平台,包括京东商城、亚马逊、当当网、淘宝网、天猫商城、酒仙网、美团网、中粮我买网、国美在线、大众点评网等。据对上述42家重点网上零售交易平台数据测算,今年1~8月份,全国网上零售额22400.9亿元,同比增长36.5%。其中,实物商品网上零售额18653.4亿元,增长35.6%,占全部网上零售额的83.3%;非实物商品网上零售额3747.5亿元,增长41.1%,占全部网上零售额的16.7%。这对于宏观管理部门和社会公众了解网上零售情况具有重要的参考作用。
2.利用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数
房屋交易网签数据是指买卖双方签订购房合同后,房地产开发企业在房管部门进行备案,并在房产信息网上公布的相关信息,包含地址、楼层、价格、面积和金额等详细信息,基本涵盖了当月新建住宅的全部交易情况。从2011年1月份开始,国家统计局开始采用房屋交易网签数据计算全国70个大中城市的新建住宅价格指数。这对于提高70个大中城市新建住宅价格指数的数据质量起到了重要作用。
3.利用卓创资讯公司提供的价格信息,开展流通领域重要生产资料市场价格监测
国家统计局与卓创资讯公司开展合作,利用该企业提供的价格信息,开展流通领域重要生产资料市场价格监测。从2014年1月开始,按旬共同向社会发布流通领域9大类50种重要生产资料市场价格的检测结果。行业涵盖黑色金属、有色金属、化工产品、煤炭、石油天然气、非金属建材、农产品、农业生产资料、林产品等领域。地区监测范围覆盖北京、天津、河北、山西、内蒙古、辽宁、吉林、上海等24个省区市。这对于宏观管理部门和社会公众了解流通领域重要生产资料市场价格信息起到了重要作用。
(二)大数据成为政府统计数据质量的部分评估依据
国家统计局除了把大数据作为政府统计数据的部分资料来源外,也高度重视利用大数据评估政府统计数据质量。以下是目前比较有代表性的两个方面:一是利用中国银联跨行银行卡消费数据评估社会消费品零售总额数据质量;二是利用大型机械装备企业物联网数据评估固定资产投资数据质量。
二、大数据给政府统计带来的机遇与挑战
对于政府统计来说,大数据既带来了重大发展机遇,也带来严峻挑战。
(一)大数据给政府统计带来重大发展机遇
首先,大数据将不断提高政府统计服务宏观管理和社会公众的能力。随着大数据的不断发展和完善,随着政府统计机构开发应用大数据能力的不断提升,政府统计产品的种类将会不断丰富,政府统计数据的质量和时效性将会不断提升,从而政府统计服务宏观管理和社会公众的能力会不断提高。
其次,大数据将会推动政府统计发生革命性的变化。随着大数据的发展和完善,随着政府统计机构开发应用大数据技术的逐步成熟,政府统计将会发生革命性变化。一是现有的以周期性普查为基础,以抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料的统计调查方法体系可能会发生重大变化。长期以来,抽样调查方法,即在总体中抽选样本、利用样本推算总体的方法;普查和全面调查方法,即对总体中所有单位逐一进行调查的方法,在我国政府统计中发挥了重要作用。今后,在较长的时期内这些方法仍然会被政府统计所广泛采用。但在大数据不断发展和完善的情况下,某些领域、某些方面的大数据可能会取代抽样调查、普查和全面调查方法,成为获取统计数据的重要方法,而且这种获取统计数据的方法将会变得越来越重要。二是政府统计中的数据采集方式可能会发生重大变化。长期以来,政府统计机构主要以企业填报、住户记账、调查员入户等方式采集原始数据。在大数据不断发展和完善的情况下,一部分原始数据将通过挖掘大数据的方式获取,而且这种新的数据采集方式将会变得越来越重要。三是政府统计的数据处理模式可能会发生重大变化。在大数据不断发展和完善的情况下,现行的对普查和全面调查数据进行直接审核、汇总、加工处理和对抽样调查数据进行推算放大的数据处理模式可能会发生重大变化。
(二)大数据给政府统计带来严峻挑战
首先,大数据对政府统计能力带来挑战。从大数据本身的产生到发展完善,从政府统计对大数据的初步运用到成熟运用,需要一个较长的时期。在这个过程中,一方面,政府统计中传统的统计调查方法、数据采集方式和数据处理模式将继续运行,否则满足不了宏观管理和社会公众的需求。另一方面,政府统计系统必须投入大量的人力和物力对大数据进行挖掘、加工处理和运用,否则也适应不了大数据时代宏观管理和社会公众的需求。这种双轨运行的模式,对政府统计能力将是一个巨大的挑战。
其次,大数据对传统政府统计理念带来挑战。传统的政府统计有一个约定俗成的理念:抽样调查方法可降低调查成本,提高效率和数据质量。因为抽样调查只对总体中部分抽中的样本进行调查,并非对总体中的每一个单位都进行调查,所以调查单位明显减少,可降低成本,节约时间,提高效率。同时,由于调查单位较少,政府统计机构有能力对基层统计调查人员进行较为扎实的培训和指导,有精力对统计调查数据进行较为严格的检查和审核,从而能够提高统计调查数据质量。随着大数据不断发展完善,政府统计机构将会越来越多地通过大数据企业间接地获取统计数据,不需要对总体中的具体单位进行直接调查,不需要调查员,从而也不需要对调查员进行培训,抽样调查所具有的调查成本低、能够提高统计调查数据质量的优点就不复存在了。