统计资料整理

出处:按学科分类—农业科学 中国农业出版社《植物保护统计手册》第87页(11180字)

一统计资料整理的意义

植物保护专业统计工作,通过以抽样调查为主的统计调查,取得大量的调查资料。把这些调查资料,按着统计工作的需要进行科学的分类、汇总,使之条理化,成为反映调查总体特征的综合资料,这个工作过程叫统计资料整理,也简称统计整理。统计资料整理也包括系统地积累资料和为研究特定问题对资料的再加工。

统计调查所取得的调查资料,只是总体单位的客观记载,只能代表每个总体单位各自的情况。对调查总体来说是分散、割列、零碎的资料,不能说明总体的基本特征和本质规律,这样的资料叫原始资料,也叫初级资料。把原始资料经过科学的分类、汇总,使之条理化、系统化,成为反映总体特征、规律的综合资料,也叫次级资料。从原始资料,经过整理变成综合资料,可从总体单位不同现象的感性认识,过渡到对总体现象的规律性认识。这样的综合资料,可供统计分析利用,发展到对总体现象的理性认识。可见,统计资料整理是统计调查的延续,是统计分析利用的前提,是统计工作和对总体认识过程承前启后的中间环节。这就是统计资料整理的意义所在。

二、统计资料整理的内容

统计资料整理包括两个方面:一是整理方案设计,二是整理工作。

(一)整理方案设计 整理方案是保证整理工作按质、按量、按时完成的指导性文件。方案要根据统计的目的,对整理的各个环节作出具体规定。如整理的组织领导,质量监控,责任制度及时间安排;设计统计分组,指标设置,汇总方法,统计表等。以使整理工作统一目的、认识、步骤及方法,在纵向时间上,横向空间上有可比性和系统性。现阶段植物保护专业统计资料整理方案中的一些具体内容,大部分已由农业部全国植物保护总站设计和制定了。

(二)整理工作程序

1.原始资料审核 主要是审核原始调查资料是否准确、齐全。在起始阶段把调查资料核准、补充。

2.统计分组 将原始资料进行统计分组。统计分组是统计资料整理的主要基础工作之一。

3.统计汇总 是在统计分组并算出各项指标后,将各项指标进行计算和汇总。并对汇总资料进行复核。

4.编制统计表 将汇总结果编制成统计表。

从这一过程可以看出,统计分组是资料整理的前提;统计汇总是资料整理的核心;统计表是资料整理的结果。

三、统计分组

(一)统计分组的概念和任务 统计分组是指根据统计研究的需要,按照一定的标志将总体区分为若干部分的一种统计方法。比如把农作物生物灾害分成病、虫、草、害。受害作物分成粮食、果树、蔬菜等。

统计分组的根本任务在于区分现象间质的差别。统计分组既是统计整理的基本内容,又是统计分析的基础,统计整理得到的统计数字能否准确的反映总体的特征,统计分组是关键。

(二)统计分组的作用 由于统计分组能够将一个较大范围的同质总体区分为各种小范围的同质组,因此,它具有下列三个方面的作用:

①统计分组在于将大量的调查资料分门别类划分开不同的组,使资料由散乱变得清晰,由复杂变得简单,便于观察、比较和研究,区分事物的性质。这样的分组在统计分组中叫类型分组。

②统计分组在于反映各组在总体中的比重,表明总体的内部结构及其性质和特征,这样的分组叫结构分组。

③统计分组在于研究、分析、反映现象之间的依存、因果关系,这样的分组叫分析分组。

可见,为了不同目的,采取不同的分组标志进行统计分组,是对总体内部的定性分类,表现出分组的作用。

(三)统计分组方法 统计分组要选择分组标志。分组标志是统计分组的依据和标准。分组标志分品质标志和数量标志。

①按品质标志分组是指以反映事物属性差异的品质标志分组。比如按品质把有害生物分成病害、虫害、草害、鼠害。

②按数量标志分组是指以反映事物数量特征的数量标志进行分组。按数量标志是用量值来界定,可用具体量值,也可用轻、中、重等模糊量。如按数量标志把病、虫、草、鼠害,分成发生程度轻重不同的1、2、3、4、5组,也称为轻发生、中等偏轻发生、中等发生、中等偏重发生、大发生。

③根据分组标志数目的不同,统计分组可分为简单分组和复合分组。将总体按一个标志分组叫简单分组。按两个或两个以上标志分组叫复合分组。比如植物保护系统人员情况,按业务分工分为测报、防治、药械和检疫,就是简单分组。业务分工后如将人员再分为专职和兼职,就是复合分组。

为深入细致的研究某一问题,可按几种不同的标志进行分组。这些分组结合起来,就构成一个分组体系。象把化学农药按应用对象分成杀菌剂、杀虫剂、除草剂;按化学结构分成有机氯制剂、有机磷制剂、有机硫制剂;按剂型分成粉剂、乳剂、颗粒剂。

(四)分配数列 表明总体单位在各组分配情况的分组资料叫分配数列。它是统计整理的结果。分配数列包括:总体按分组标志划分出来的各组;分配到各组的单位数及占单位总数的百分率,即频数和频率。

按品质标志分组的分配数列叫品质分配数列。按数量标志分组的分配数列叫变量分配数列。全国1990年农药销售情况,按品质标志分组的品质分配数列如表4-1。

表4-1 1990年全国农药销售表

四、统计资料汇总

(一)汇总的组织形式 统计资料汇总可采取逐级汇总和集中汇总的组织形式。植物保护专业统计是采取逐级汇总的形式。就是按着报表制度的要求,部、省(自治区、直辖市)、地(市)、县(区),自下而上逐级填报汇总统计报表。这种形式,可满足各级对统计资料的需要,充分发挥统计的信息、咨询、监督作用,便于各级进行统计资料积累和汇编。

(二)汇总前的资料审核 植物保护专业统计工作起步较晚,各方面工作还不甚完备。以统计数据准确性为主的统计资料检查、审核、评估、签发等规定和操作还在逐步完善之中。统计工作中,数字差错是难免的,把有差错的资料汇总起来,也就降低或失去了统计资料的“生命力”。实际工作中经常遇到汇总后发现原有资料上的差错,导致汇总有误,需重新核正汇总。这是一项令人烦恼和相当费工的事。所以,逐级汇总过程中,各级都要做好汇总前的资料审核工作。

审核要从资料的准确性、及时性、完整性三个方面进行。其中难度较大的是准确性的审核。准确性审核可通过逻辑检查和计算检查两个方面进行。逻辑检查是从理论上、常理上或从各项目之间有无矛盾等判断数字是否符合逻辑,有无矛盾。象1990年某省某市粮食作物病虫是中等发生年。防治工作做的比较好。但统计表明防治换回粮食损失50万吨,占当年该市粮食总产量150万吨的33.3%,显然是不可能的,经查是统计上的差错。

计算审查,是指调查表或报表中的各个数字在计算方法和计算结果上是否正确。如各行、各栏的数字是否正确,有否串行、错栏现象,以及各行栏之和应等于小计,小计之和应等于合计,计量单位不符合规定,前后不一致等。发现差错必须追根寻源,查找纠正。汇总后的资料,也要进行复核。

在审查过程中,如果发现了问题,应弄清问题产生的原因及其性质,分别情况作如下处理:对于能肯定的错误,能更正的及时更正,并将更正数字通知原填报单位或被调查单位进行更正;对于可疑之处或虽有错误,但无法更正的,应通知原填报单位或被调查单位复查,查清后再进行更正;对于已发现的错误,估计其它单位也有可能发生时,应及时发通报,防止今后继续发生类似错误。

(三)汇总技术 汇总技术有二种:手工汇总和计算机汇总。

1.手工汇总 手工汇总就是用计算器汇总。常用的是过录法。就是把要汇总的数字从调查表、统计表上过录到预先设计印制的汇总表上,然后对汇总表的数字进行累加合计。比如省一级汇总统计年度报表,其中每个数字都是总体单位即各地(市)年度报表上数字的总和。预先编制印出汇总表,如表4-2,填上各地的数字,再逐个进行纵栏合计,这个合计数就是汇总表上要填写的汇总数。汇总统计分组的各组数字也是一样,这种办法,虽然用工量比较大,但比较实用,便于复核查找差错。汇总表还可单项使用,这是较为常用的办法,这样的汇总表,可预先编印通用格式,铅印多份,供上下连年使用。

表4-2 辽宁省×××病(虫)发生、防治面积及挽回损失表

此外,还有划记法、折叠法、卡片法等。划记法,在汇总各组的总体单位数时使用。像标记选票数似的,用划“正”字计数,但是只能用来汇总数量不多的单位数,不能用来汇总标志值。折叠法,适合汇总单页的调查表、统计表。把要汇总的项目数值,折在一条线上,再如过录法一样进行汇总,这种方法表的份数过多时,不便使用,出了差错,也不便查找。卡片法,是利用特制的,作为分组计数的卡片,在资料较多、分组又细的情况下使用。这三种方法,在植物保护专业统计上,都有使用。

2.汇总数字差错查找 在用过录法汇总数字合计数时,查对合计数是否准确,通常的做法是再合计一次。如果两次合计数相等.就视为合计数是准确的。如果两次合计数不相等,就要核查哪次数是准确的。常用的核查方法有:(1)按数字的反方向顺序,从下而上再合计一次,合计数与前两次合计数中相等的数,就是准确数。(2)如果两次合计数之差,能被9除尽,则有可能是某个数字错位。如5400误为540或54000,也包括小数点错位,如86.24误为8.624或862.4。如果是5400误为54000,则两次合计数之差是48600(54000-5400=48600),是正整数,除9之商即为原正确数,是这个数记错了位数。如果是5400误为540,则两次合计数之差是-4860(540-5400),其差是负数,则其差数的绝对值乘以10/9之积就是原正确数,即4860×10/9等于5400。既4860×10/9=5400。(3)汇总时数字位置颠倒。如864误为846,则有几种情况:两数合计数之差,能被9除尽,则是十位数与个位数颠倒;如果合计数之差,能被9.90和900除尽,则是千位数和百位数颠倒。

五、统计表

统计表有广义、狭义之分,广义的统计表包括统计工作各阶段所用的一切表格;狭义的统计表是指表明统计整理结果的表格,此处介绍的为狭义的统计表。

(一)统计表的意义 统计表是指经过统计汇总得出许多说明总体特征的综合数字资料,把这些数字资料按一定指标顺序,在表格上表现出来的表格。用统计表展示统计资料,具有集中醒目,条理清晰,纵横对照,简洁明了,便于比较对照分析问题等作用。

(二)统计表的结构 统计表从形式上看,它由标题(表题),横行标目,纵栏标目,数字资料四个部分组成。

1.标题 是表的名称,是表的内容简明扼要的概括。细分可有总标题,即表的名称,它概括说明表的主要内容(包括时间、地点等)其位置在表的上端中央。

2.横行标目 是横行的名称,是总体分组的标志名称,展示统计表要说明的对象,也是横行的名称,位在表的左边每行的开始处。它又叫主词。统计表中自左至右平行的行次叫横行。

3.纵栏标目 是纵栏的名称,是说明栏的内容,它是说明横标题的。一般位于表的上方每栏的开始处。它又叫宾词。统计表中自上而下与横行垂直交叉的栏次叫纵栏。

4.数字资料 是填在横标目与纵栏目交点位置表格里的数字,为说明总体特征的数字资料。

从内容上看,统计表包括主词和宾词两部分。主词是统计表要说明的总体或总体的各个组成部分,通常列在表的左边。宾词是用来说明主词的各种统计指标,通常列在表的上方。如表4-3。

表4-3 病虫草鼠防治面积及挽回损失表

(三)统计表的种类 统计表按主词是否分组及分组程度,分简单表、简单分组表和复合分组表。

1.简单表 主词未作任何分组的统计表,其主词是由总体单位的名称或时间名称所构成。常有两种情况;一是在同一空间条件下,不同时间数列的统计表,这种表也叫时间数列表。象1950-1980年全国植物保护专业统计表,一本有45张表,全是简单表,时间数列表。二是在同一时间条件下,不同空间的数列表,这种表也叫空间数列表。如表4-2。

2.简单分组表 主词仅按一个标志进行分组,以所分各组的名称为主词统计表。也简称分组表。其中有按品质标志分组的简单分组表。有按数量标志分组的简单分组表。如表4-4是按品质标志分组的简单分组表。

表4-4 农作物病虫主要防治措施

3.复合分组表 主词按两个或两个以上标志进行层叠分组,以所分各组的名称为主词,并交叉排列所形成的统计表,也简称复合表,如表4-5。

表4-5 1991年全国农作物病虫草鼠发生、防治面积及挽回损失

(四)宾词指标设计 宾词指标设计可分简单和复合两种。宾词指标的简单设计,是将宾词的各个指标并列作平行排列,如表4-2。而复合设计是将宾词的各个指标结合起来做层叠设置,如表4-4。

上述两种宾词设计,简单设计简单明了,是总体的基本梗概特征。复合设计层次丰富,研究深入,有利深化分析利用。但复合设计每增加一个层次,则分组指标数就以分组标志纵栏目数的乘积数增加。因此,复合设计应在满足分析利用需要的前提下,减少设计层次,不要过于复杂。

(五)统计表编制规则 统计表的编制应遵循科学、实用、简要、美观的原则。在编制时应注意的事项如下。

1.统计表的形式 统计表长宽比例要适中,以长方形为宜;上下两端的端线应以粗线或双线绘制,表中其他线以细线绘制,左右两端为“开口式”;将复合分组列为横标题时,应在第一次分组的各组组别下后退一、二字写第二次分组的组别,这时第一次分组的组别就成为第二次分组的各组的小计,若需第三、四次分组,均依此类推;纵栏较多时,应编栏号,习惯上对主项各栏分别以甲、乙、丙等文字标明,对宾项各栏以(1)、(2)、(3)、……数字编号。

2.统计表的内容 力求简明实用,一目了然。设计编制统计表,要考虑需要和可能,只把有用的内容编进去。以起到集中醒目,便于比较,分析利用的功效。总标题要简明扼要,切中内容,用简炼而又准确的文字表明统计表的内容及资料所属空间和时间范围;统计表中主词与宾词的内容要相互对应,要有逻辑性,按时间先后,数量大小,空间位置等,从大到小,从过去到现在排列;列出合计,以发挥其综合表达作用,给人以整体概念,合计一般列在横行前面,纵栏上面;要注明数字的计量单位,全表使用的计量单位,写在表的右上方,需分别注明的纵栏计量单位写在纵栏标目下面,小字标明,加括号;表内有需说明的事项,可写在备注栏内或在表下加注,以便查考。

3.统计表数字填写要求 统计表数字填写要求书写工整,字迹清晰,横竖对齐;当数字为零时也要写出来,如不应有数字时,用符号“-”表示出来,当缺某项数字或因数字太小忽略不计时用“……”表示,当某项资料免填时用符号“××”表示,统计数字部分不应留下空白;当某数适与左、右、上、下数字相同时,应照写不误,不得以“同左”、“同右”、“同上”、“同下”字样代替;填表完毕并经审核后,填表人和主管负责人应签名,并加盖本单位公章。

六、统计图

利用几何图形或其他形式表现统计资料的各种图形叫统计图。是统计资料的一种特殊形式。它具有形象直观,简明生动,一目了然,通俗易懂等优点。

(一)统计图的种类 统计图的种类很多,可因需要自行设计,要有严格的科学性,一定的艺术性,越简明、直观、生动、说明问题越好。常用的统计图可分为曲线图、条形图、圆形图、方形图、象形图、统计地图和综合图等。

1.曲线图 曲线图是以曲线的升降来表示现象的动态。运用曲线图,可以表明事物的发展规律;表明总体单位的分配状况;揭露事物间的依存关系;指明计划执行的进度。具体又分:

(1)动态曲线图。它是表示现象在时间上发展变化的。表明一种现象动态的叫单式动态曲线图;表明两种以上现象动态的叫复式动态曲线图;

(2)对数曲线图。指纵坐标采用对数尺度的曲线图。实用于表现数别全距比较大的情况;

(3)次数分配曲线图。表示现象分配状况的线形图。

(4)依存关系曲线图。揭示现象之间依存关系的线形图。横轴表示发生影响的现象,纵轴表示被影响的现象。

2.条形图 条形图是依相同宽度的长条(矩形)的长短、高低来表明统计资料的不同数值的一种图形。它具绘制简单、形象鲜明的优点,因而被广泛地采用。它的作用很广,可以用来表现各种形式的动态数列;可以用来表现同一指标不同地区的差别;可以表明计划执行情况;可以表明总体结构的变化等。它表现的指标,可以是绝对的,也可以是相对或平均的。根据绘图的目的和资料的不同,条形图可以绘成以下几种图形:

(1)单式条形图。以若干条距离相等的单一条形的长短、高低来表明指标数值大小的一种图形;

(2)复式条形图。以两个以上的条形为一组来进行比较的图形。它既可以进行组与组之间的比较,又可在组内进行比较,常用于表现分组资料;

(3)分段条形图。以条形的全长表示总体,条形内的分段代表总体的各组成部分,用以表示总体内部结构的图形,也叫结构条形图。

3.圆形图 圆形图分为圆形结构图和圆面积图。圆形结构图是以圆内各扇形面积的大小来表示统计资料,常被用来表明总体的结构及其变化,是应用最广泛的图形之一;圆面积图是以圆面积来表现统计资料的一种统计图。

4.方形图 方形图分正方形图和长方形图两种,都是用图形面积大小来表现统计资料的。

5.象形图 象形图是以某种具体形象的个数、长短、大小来表示统计指标的图形。它给人们的印象更为生动具体,因而也更乐于被群众所接受。常用的有利用特种形象的个数多少来表示统计指数值大小的单位形象图;利用形象的长短来表示统计资料的长度象形图;以形象面积大小来表示统计资料的平面象形图。

6.统计地图 统计地图是以地图为底本,利用圆点、象形或其他符号来表明某一区域内一种或几种现象数量分布的图形。

7.综合图 综合图是统计实践中新出现的一种统计图,大致可分为两种类型,一种是把表明同一对象不同指标的各种统计图简单组合在一张地图上;另一种是除了将几种图形综合在一起之外,还注有较详细的文字、数字说明。

(二)统计图的构成 统计图主要由以下几部分构成。

1.图号 统计图按类别或次序编号。在书刊中,以章为编序,如第四章的第一个图为图4-1。

2.图题 统计图的标题名称,表明统计图的内容。一般位于图的下面居中。

3.图线 是构成统计图线条的总称。包括基线、轮廓线、指导线、破格线四部分。

(1)基线。是统计图的横轴线,在统计图的底部,也叫底线,是全图中最粗的一条线。

(2)轮廓线。是图的外图线,比基线细些。

(3)指导线,又叫引线。是由各比度点引出的线,比轮廓线还要细。

(4)破格线,又叫截线。是用水波纹线对统计图进行横截或纵截,表示省略的线。

4.尺度 测定数字大小的标尺。包括尺度线、比度、读数三个部分。

(1)尺度线。用来表明尺度的纵线或横线。在图形上利用纵轴和横轴作为尺度线。

(2)比度。是根据一定比例在尺度线上所做的刻度。

(3)读数。在尺度线上按比度标注的数值。

5.图式 又称图形。是按需要绘制的统计图的图形,如曲线图、条形图等。图形是统计图的主体。

6.标目 在纵轴侧面或横轴下面所标注的小标题。说明纵轴、横轴所代表的指标内容和计量单位。

7.图例 说明图形所代表的事物,是以线纹、颜色等对图式所加的注解。

8.附注和说明 是在统计图的适当位置所作的文字说明,包括范围、口径、资料来源等。

七、统计资料积累

(一)统计资料积累的意义 植物保护统计资料积累是植物保护工作的一项基本建设,准确、系统、完整的统计资料是统计分析、预测的主要一举。系统地积累统计资料是功在当前、义在长远的经常性统计工作,是统计工作者的历史责任。

(二)统计资料积累的方法 统计资料积累,贵在准确、系统、完整,是一项涉及面广、工作量大的工作。积累过程中有资料再积累的过程,业务性、技术性比较强,靠统计人员单枪匹的去做是困难的,要纳入各级植物保护部门的工作日程,成为各级植保站的站长行为,站长应重视、支持、参与统计资料积累工作,要争取上级统计部门的支持和指导,组织精干的统计资料积累队伍,制定工作方案,编印统一的统计表,搞统计资料积累试点,总结经验,以点带面,召开统计资料积累工作会,业务学习会,经验交流会。

特别是处在植物保护系统新老干部交替的时候,一些建国初期参加工作的老植保干部,老领导,陆续退下工作岗位。他(她)们是建国四十多年来,植物保护工作的活地图、活字典。发挥这些老同志的作用,把历史统计资料挖掘、补充、整理出来,是植物保护统计资料积累的重要一环。开老同志座谈会;请他们写回忆录、植物保护工作大事记;让他们主持、参加资料积累工作或当顾问,广泛采取“请”、“找”、“献”、“忆”等多种活动,搜集积累统计资料。

“请”,就是发动群众,清理各种文件、报告、会议记录、简报、纪要等,从中查找统计资料。

“找”,到有关部门去查找资料。

“献”,就是动员老同志,有关人员献资料。

“忆”,开老同志座谈会,回忆历史资料。

“推”,按已有的资料,商议、推算空缺的资料,以供参考使用。

对植物保护历史统计资料积累有贡献的老同志等,要给予表彰奖励,载入资料史册。对今后长期统计资料的积累,要建立起明确的责任制度和工作规范,坚持经常。统计资料积累中,常遇到两个问题,一是时间段落的划分。植物保护统计资料可分为1950年-1980年;1981年-1986年;1987年以来三个阶段。1987年是全国植物保护专业统计工作的转折点,从这年起,在全国植物保护总站的主持下,植物保护专业统计开始走向正轨,有了全国统一的年度统计报表和管理办法。进入90年代后,可用“八五”、“九五”的五年计划来分时间段落。二是由于行政区划变动,而带来的地理范围、耕地面积的变动。一般以现行行政区划为准,调整增减变动时期的数字。这样做确有困难,也必须做出尽可能详尽的说明,以保证统计资料的系统性和可比性。

资料积累可整理成统计年鉴、汇编、简编、卡片、提要等形式,编印成册,方便查找、应用和保存。最主要的是按档案管理的要求,整理成统计资料档案。登记编号,立卷归档。

分享到: