- 相关推荐
关于统计学的数据来源与搜集数据的方法
导语:统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,大家一起来看看吧。
第一章 第三节 数据来源与搜集数据的方法
一、数据的来源
从使用者的角度看,统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。
(一) 数据的直接来源——原始数据
搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。
1. 统计调查
统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程。通过统计调查得到的数据,一般称为观测数据。
2. 实验法
实验法是直接获得统计数据的又一重要来源。通过实验法得到的数据就是实验数据。
实验法不仅是一种搜集数据的方式,也是一种重要的研究方式。它是通过有意识地改变或控制某些输入变量,观察其他输出变量的变化,从而达到对事物本质或相互联系的认识。未来观察对输入变量的控制是否导致了输出变量的改变,在实验中,往往需要将研究对象分为两个组,一个是实验组,一个是对照组,对实验组的输入变量加以控制或改变,而对照组则不加控制,根据两组的输出结果,可以看到输入变量对输出变量的影响。
运用实验法要注意的是:首先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识的挑选的。其次,实验组和对照组还应当匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。
不论是统计调查还是实验,所搜集的数据都是原始数据,这是统计数据最基本的来源。
(二)数据的间接来源——次级数据
虽然统计数据的搜集主要是指对原始数据的搜集,后面介绍的统计调查的方法也是围绕搜集原始资料展开的,但数据的收集实际上不仅包括对原始数据的收集也包括对次级数据(第二手收据)的收集,在很多情况下,统计研究都是在掌握次级数据的基础上进行的。
次级数据是指由其他人搜集和整理得到的统计数据。这种来自他人调查整理基础上的数据我们把它称为数据的间接来源。
数据的间接来源有:
(1)公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。
(2)尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构为公开发布的调查结果数据。需注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
恰当地运用间接数据在实际中往往能够节约时间和费用,取得较好的成果和效益,因此,成为许多统计研究人员在进行实证分析时的首选数据来源。但在应用时要注意:
(1)是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据。
(2)引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。
二、搜集数据的方法
统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织第搜集统计数据资料的过程。常用的统计调查种类有:
(一) 普查
普查:普查是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会经济现象的总量。它适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。如,人口普查、农业普查、经济普查、全国第三产业普查等。
普查的特点:它是一种全面调查,具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一般不宜经常举行。
普查要遵循以下几点:
a.确定普查的标准时间:普查的标准时间是指登记调查单位项目所依据的统计时点。所有的调查资料都必须是反映这一时点上的情况。例如,我国第四人口普查,1990年7月1日零时为普查登记的标准时点。凡是在这个时点以前死亡和这个时点以后出生的,都不能计入这次普查的人口数内。这样才可避免所登记重复或遗漏。
b.普查的登记工作应在整个普查范围内同时进行,以保证普查资料的实效性、准确性,避免资料的搜集工作拖的太久
c.同类普查的内容和时间在历次普查中应尽可能保持连贯性。普查的组织形式有两种:一种是组织专门的普查机构,派专门的调查人员对被调查单位直接进行登记;另一种是利用一定的组织系统,由被调查单位根据本单位的原始记录和实际情况,填写调查表,然后上报。
(二) 抽样调查
抽样调查:抽样调查是按随机原则,从总体中抽取一部分单位作为样本来进行观察,并根据其观察的结果来推断总体数量特征的一种非全面调查方法。
抽样调查具有的特点:
第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。
第二,能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。
第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。
随机抽样一般是指每个总体单位都有同等被抽中的机会,但是在实际调查中,并不完全是这种情况。通常采用的抽样组织形式主要有以下几种:
a.简单随机抽样:又称纯随机抽样,它是指对总体不作任何处理,不进行分类也不进行排除,而是完全按随机的原则,直接从总体中抽取样本单位加以观察。从理论上说,是最符合抽样调查的随机原则,是抽样调查的最基本形式。具体方法有:直接抽选法、抽签法和随机数表法。
b.分层抽样:又称类型抽样或分类抽样。是先将总体各单位按主要标志加以分层,而后在各层中按随机的原则抽取若干样本单位,由各层的样本单位组成一个样本。
c.等距抽样:又称机械抽样或系统抽样。它是将总体全部单位按某一标志排队,而后按固定的顺序和相等间隔在总体中抽取若干样本单位,构成一个容量为n的样本。
d.整群抽样:是将总体各单位划分为若干群,然后以群为单元,从总体中随机抽取一部分群,对被抽中的群内所有单位进行全面调查。整群抽样对总体划分群的基本要求是:
第一,群与群之间不重叠,即总体中的任一单位只能属于某个群;
第二,全部总体单位毫无遗漏,即总体中的任一单位必须属于某个群。
e.多阶段抽样:当总体很大时,可把抽样过程分成几个过渡阶段,到最后才具体抽到样本单位。
(三) 统计报表
统计报表制度:它是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上的提供统计资料的一种报表制度。在官方统计的经常调查中目前依然发挥着一定的作用。
按照报送范围,统计报表分为全面报表和非全面报表。
按报送周期,统计报表主要有月报、季报、年报组成,月报内容简单,时效性强,年报则内容比较全面。
统计报表的内容包括表式和填表说明。
对于大型、国有企业来说,利用统计报表搜集数据,具有时间快、成本低的优点,但对于大量的小型、非国有经济单位,则难以全面采用统计报表调查。
(四) 重点调查
重点调查:是一种非全面调查,它是在调查对象中选择一部分对全局具有决定性作用的重点单位进行调查。适用于调查任务只要求掌握调查总体的基本情况,调查标志比较单一,调查标志表现在数量上集中于少数单位,而这些少数单位的标志值之和在总体中又占绝对优势的情况。
重点调查组织方式有两种:一是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。其优点是花费较少人力、物力,在较少时间内及时取得有关的基本情况。
(五) 典型调查
典型调查:根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行调查,主要作用是:
第一,补充全面调查的不足;
第二,在一定条件下可以验证全面调查数据的真实性。
其优点是灵活机动、通过少数典型即可取得深入详实的统计资料,缺点是受“有意识地选出若干有代表性”的限制,易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。
拓展阅读:
什么是统计学?
统计学是关于认识客观现象总体数量特征和数量关系的科学。统计学是通过搜索、整理、分析、描述数据多种手段,以达到推断所测对象的本质,预测所测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围覆盖社会科学和自然科学的各个领域。统计学的英文statistics最早源于现代拉丁文Statisticum Collegium、意大利文Statista以及德文Statistik。
【统计学的数据来源与搜集数据的方法】相关文章:
excel2007数据透视操作方法09-18
php备份数据库类的方法09-04
几种找回Word文档损坏了的数据的方法08-31
统计学中关于数据类型的相关内容05-31
PHP数据库Oracle数据完整性09-05
运用WPS处理日期数据格式的方法09-10
PHP使用中数据库使用方法05-21