当前位置:首页 > 经典书库 > 工程师手册

因素试验的基本原则

书籍:工程师手册

出处:按学科分类—工业技术 企业管理出版社《工程师手册》第353页(4297字)

1.因素实验的基本概念

所谓因素,是指参加实验过程的一些自变量,即称为条件变量,是实验所需考察的对象。一个条件变量叫做一个因素。实验的目标是实验的结果,代表实验结果的观测变量称为实验指标。由此可知,条件变量是实验过程中的输入参数,实验指标则是输出参数。

因素实验又称为析因分析,是为了寻求影响实验效果的因素而设计的实验。当考察的因素仅为一个时,称为单因素实验;当考察的因素为两个或两个以上时,则分别称为双因素实验和多因素实验。因素实验多用于解决科研或生产中的尚未完全揭示的问题,如最优的工艺设计,最佳的成分配方等等,目的是为了获得理想的实施方案,乃至使当前的生产状况取得突破性的进展。

欲考察某一因素对实验指标是否有影响或影响的程度,必须在实验过程中变化该因素的输入量。因素的每一个不同的输入条件称为一个水平,对应着每一个水平的实验就产生一个实验结果。一个因素的水平可以为2或3,也可以很多。一般原则是多因素实验中各因素的水平宜少不宜多,单因素实验中除非需要进行曲线拟合,否则应按优化方法选择水平数。水平数多,实验结论的精度高,但实验次数多,成本高,时间长。一个优化的实验设计是合理的统筹兼顾的结果。因素的水平可以是某一个数值,也可以是一个模糊概念。比如温度作为实验因素,其水平值分别为-50℃,20℃和60℃;但是也可以采用一种含糊的说法表示,如温度的三个水平分别为低温、常温和高温。此时每一个水平的实际温度值允许存在一个变动范围,水平值的概念已经模糊了,所以水平之间的差异也称为级位。水平级位应该用什么表示,主要取决于实验的要求和条件。一般来说有高精度要求的实验应该尽可能用数值来表达水平值,如果只有定性要求的实验,当然可以采用形象的说法来表示水平的差异。又如野外测量仪器作可靠性温度试验时,室内模拟实验可取具体温度值作为不同的水平,而野外实地试验时,高、低温可以选择在相应的地区作为不同的实验水平。由此可见,水平只能表示某一因素参加实验的变化条件。连续变量可以用数值表示,离散的个体都用级位来区分。

各个因素不同水平组合数是很多的,每一种组合称为一个实验条件,简称一次处理。在每一次处理后都可以对实验结果进行一次或多次观测,观测得到的数据一般就是实验指标。所谓指标值就是指标数据的大小,有时也用指标值表示实验目标的得率,即表示该实验条件的效果。实验指标在一定场合可以使用仪器进行测量,获取数据,但在某些场合一时还无法使用仪器或传感器,只能凭借观测者感官运用专业知识和经验作出估计。这种估计就是给实验结果评分,比如食品工程中的色、香、味,往往根据专家们品尝后的评分作为指标值。每次测试值或每位专家的评分都是实验所需要的信息,这些数据信息量的多少和准确程度都将直接影响对实验设计的评价。

实验过程中,由于实验条件的差异,环境气氛的波动,测试仪器的不确定度和观测者读数的不准确性等原因,使得获取的信息不可避免地包含着误差成分。为了能够对实验数进行有效的处理,实验方案必须遵循一定的原则设计,以便分离或消除实验数据中随机误差以及可能出现的常值或变值系统误差。

2.实验设计的基本原则

实验的目的是为了认识一个由诸因素构成的系统的内部特性及其变化规律,从而寻求最优化的生产条件。为此,通过改变因素的水平,进行多次实验操作,以便获取系统的各种信息。实验设计的主要内容包括两大部分;一是实验因素的决定,水平的选取及其组合方式;二是实验信息的获取和信息处理方法。前者是实验方案的设计,后者是数学方法的运用。一个好的实验设计必须同时兼顾实验方案的经济效益和实验信息的质量,统一这两项要求,实现最优化方法,这是实验设计的一项主要任务。

为了使获取的实验数据可信和准确,英国科学家费歇尔在本世纪二十年代就提出了避免或减少实验误差的三原则,即重复实验、随机化处理和局部控制。至今,费歇尔三原则对工程实验设计仍然起着指导性的作用。

(1)重复实验原则

在相同的实验条件下,重复二次以上的实验操作称为重复实验。要求每重复一次实验都要测试一个或一组指标值。一般来说,重复实验获取的数据不尽相同,但是可以从这些观测值的差异中发现随机误差的干扰。所谓相同的实验条件是指宏观上参加实验的可控制的因素及其水平不变。从微观上来分析,实验所用的原材料的均匀性、环境条件的稳定性、实验操作者的一致性、测试仪器的重复性等等都不可能保证在各次重复实验中不出现波动。尽管是些细微的变异,却是产生实验误差的随机因素,由随机因素引起的实验误差称为随机误差。重复实验原则是针对随机误差不可避免这一规律进行控制和分离实验误差的=种措施,从而提高数据处理的质量,获得高精度的实验结论。

在重复实验的基础上采集数据,首先找出数据的差异,然后计算样本方差,由此可对该实验条件的真值与精度作出判断。

若重复次数为t,xi为第i次重复操作后观测到的指标值,在全部重复实验完毕后,可以算出指标均值也称样本均值。当t很大时,可以认为是该实验条件的指标真值,于是指标值的变差为,其值表示第i次重复实验时的随机误差。只有方差才能从整体上认识随机误差对实验过程的影响,用表示变差的平方和,一般认为当t≥50时,则样本差为。这样,真值和误差得以分离。实际上重复实验的次数不可能很多。当精度要求很高时,允许t=6~20;一般情况下,人力、物力和时间都受到限制时,应取小值t=2~5。必须注意,在有限次重复中,样本方差计算式的分母有所变化。

(2)随机化原则

各种实验条件不可能同时在完全相同的环境下进行操作,为了避免系统误差对实验过程的影响,采取随机抽样的方法安排实验顺序的措施,称为随机化实验原则。运用这一原则可以使具有方向性或时间性的变值系统误差当作随机误差来处理,保证每个实验条件的操作过程中除了随机因素的干扰外,不会增加其他固定因素的影响。随机化安排实验顺序的原则是针对消除已认识或尚未认识的变值系统误差影响的一种措施。即使是重复实验,也应和整个实验条件一样采取随机化原则依次操作。由于分割了变值系统误差,保证了数据的处理质量,使其实验结果能真实地反映该条件的得率。特别是在决定最佳生产条件时,由于排除了随空间变化或随时间变化的系统误差以及操作者偏向性的影响,使得结论的可靠性提高,投产时的财力和时间花费可以减少。

有一定规模的实验必然要经历较长的时间,即使是条件很好的实验室,早、中、晚的气温、气压、湿度、电压和水压,乃至操作者的情绪和精神状态都会带有时间因素的作用。如果早、中、晚各安排一种水平或水平组合的实验,三种实验结果的差异不仅与水平条件有关,而且受到与时间因素有关的其他环境条件的影响。可是,这种安排却无法区分这两个不同性质条件所引起的差异。相反,如果将同一水平条件的重复实验在早、中、晚时间内随机安排,则环境条件的影响显然可以大大减小。因为这种安排使环境条件的影响表现为随机误差。

实验顺序随机化方法,通常可借助于随机数表来安排。随机化方法虽然能瓦解变值系统误差的干扰,但是对于某些常值系统误差的影响却难以奏效,必须采用其他的措施来克服。

(3)局部控制原则

局部控制亦称区组管理,是为了消除实验过程中出现的常值系统误差对实验结果的影响而应当遵循的一条规律。这种系统误差通常是由实验过程中空间位置的变换、操作时间们分割或间断、原材料批号的变换、实验人员的改换等原因所引起的。例如用两台不同仪器去观测同一实验的指标数据,结果会得到两组分布中心截然不同的测试值,其差异就是一种系统误差。

为了免除这种系统误差的影响,可以把不变换的时间、空间、设备、人员以及原材料等作为同一实验单元,在这个实验单元内完成各个因素的各种水平比较,按此方法即称局部控制原则,此时每一个实验单元称作为一个区组。在每一个区组内,同一因素水平或水平组合的实验结果比较是均匀的,其差异反映随机误差的作用;在区组之间则可能有显着性差异,它反映系统误差的影响。由于实验的目的是为了求得不同因素水平对实验指标的影响,按局部控制原则显然可以满足对同一区组实验精度的一致性要求。当然在每一区组内,实验次序仍应按照随机化原则来安排。

一般认为,满足重复实验和随机化原则的实验设计称为完全随机化方法,整个实验现场都处在被管理的状态。如果在此基础上还满足局部控制原则时就称为随机完全区组法或乱块法,每一区组内部处于被管理状态。总之,实验设计三原则是为了分离随机误差,化变值系统误差为随机误差和消除常值系统误差对实验数据影响的有效措施。在以后讨论的实验设计中,除非特殊情况需要强调外,一般认为都是遵循这三条原则的。

3.单因素水平取值的优化方法

在因素实验中,选择什么因素作为考察的对象是由实验目的来决定的。但是参加实验因素的水平数和水平值是多少,应当由实验设计人员来确定。所谓水平取值的优化方法是一种以最少的水平数及其相应的水平值寻求最佳指标的试验过程。自然只能是针对具有连续变量的因素水平而言,如时间、温度、重量等,一般来说,可细分的变量都可采用优化方法找到最佳生产条件。

常用的单因素水平取值的优化方法有黄金分割法,分数法和抛物线法等等。

上一篇:编写试验报告 下一篇:工程师手册目录
分享到: