协方差分析_范文大全

协方差分析

【范文精选】协方差分析

【范文大全】协方差分析

【专家解析】协方差分析

【优秀范文】协方差分析

范文一:协方差分析 投稿:余闃闄

协方差 协方差分析:

(一)协方差分析基本思想

通过上述的分析可以看到,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。

协方差分析

例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进行方差分析,显然是不全面的。因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。不考虑这些因素进行分析可能会导致:即使不同的施肥量、不同品种农作物产量没有产生显著影响,但分析的结论却可能相反。

再例如,分析不同的饲料对生猪增重是否产生显著差异。如果单纯分析饲料的作用,而不考虑生猪各自不同的身体条件(如初始体重不同),那么得出的结论很可能是不准确的。因为体重增重的幅度在一定程度上是包含诸如初始体重等其他因素的影响的。

(二)协方差分析的原理

协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。

协方差分析仍然沿承方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,人为观测变量的变动受四个方面的影响:即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量的影响。

方差分析中的原假设是:协变量对观测变量的线性影响是不显著的;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方比。

(三)协方差分析的应用举例

为研究三种不同饲料对生猪体重增加的影响,将生猪随机分成三组各喂养不同的饲料,得到体重增加的数据。由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重的数据,作为自身身体条件的测量指标。

协方差的实现方法:

1、分析原理

协方差分析是回归分析与方差分析的结合。在作两组和多组均数之间的比较前,用直线回归的方法找出各组因变量Y与协变量X之间的数量关系,求得在假定X相等时的修正均数,然后用方差分析比较修正均数之间的差别。

要求X与Y的线性关系在各组均成立,且在各组间回归系数近似相等,即回归直线平行;X的取值范围不宜过大,否则修正均数的差值在回归直线的延长线上,不能确定是否仍然满足平行性和线性关系的条件,协方差分析的结论可能不正确。

对于协变量的概念,可以简单的理解为连续变量,多数情况下,连续变量都要作为协变量处理。

2、问题

欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量与年龄有关,资料见下表。

3、统计分析

(1) 建立数据文件

变量视图:建立3个变量

3、统计分析

(1) 建立数据文件

变量视图:建立3个变量

数据视图:

先要分析两组中年龄与胆固醇是否有线性关系,且比较回归洗漱是否相等,比较粗略的做法是画散点图,选择菜单:图形 -》旧对话框 -》散点图,如图:

进入图形对话框:

将胆固醇、年龄、组分别选入Y轴、X轴、设置标记

点击确定开始画图

可以看出,大致呈直线关系。

更为精确的作法是检验年龄与分组之间是否存在交互作用,即年龄的作用是否受分组的影响。

接下来开始协方差分析,首先进入菜单:

进入对话框

将胆固醇选入“因变量”,组选入“固定因子”,年龄选入“协变量”,见图

:

点击右边“模型”按钮,在“构建项”下拉菜单中选择“主效应”,将“组”和“年龄”选入右边框中,然后在“构建项”下拉菜单中选择“交互”,同时选中“组”和“年龄”,一并选入右边的框中,见图:

点击“继续”按钮回到“单变量”主界面:

单击“选项”按钮,进入如下对话框:

选中“描述性分析”:

点击“继续”按钮回到主界面,单击“确定”即可

这是主要的统计分析结果,一个典型的方差分析表,解释一下:

1、表格的第一行“校正模型”是对模型的检验,零假设是“模型中所有的因素对因变量均无影响”(这里包括分组、年龄及他们的交互作用),其P<0.001,拒绝零假设,说明存在对因变量有影响的因素。

2、表格的第二行是回归分析的常数项,通常无实际意义。

3、表格的第三行、第四行是对组和年龄的检验,P均<0.05,有统计学意义,说明分组和年龄对胆固醇的影响均有统计学意义。

4、表格的第五行是对分组和年龄的交互作用的检验,其P=0.935>0.05,说明分组和年龄无交互作用,也就是说,年龄对胆固醇的影响不随分组的不同而不同,这也是协方差分析的基本条件之一。这里是满足的。

范文二:协方差分析 投稿:廖蔉蔊

第一节

协方差分析的意义

协方差分析有二个意义 , 一是对试验进行 统计控制,二是对协方差组分进行估计,现分述 如下。 一、对试验进行统计控制

为了提高试验的精确性和准确性 ,对处 理以外的一切条件都需要采取有效措施严加控 制,使它们在各处理间尽量一致,这叫试验控制。 但在有些情况下,即使作出很大努力也难以使试 验控制达到预期目的。

1

例如:研究几种配合饲料对猪的增重效果,希望 试验仔猪的初始重相同,因为仔猪的初始重不 同,将影响到猪的增重。经研发现:增重与初始 重之间存在线性回归关系。但是,在实际试验中 很难满足试验仔猪初始重相同这一要求。 这时可 利用仔猪的初始重(记为x)与其增重(记为y)的回 归关系,将仔猪增重都矫正为初始重相同时的增 重,于是初始重不同对仔猪增重的影响就消除了。 由于矫正后的增重是应用统计方法将初始重控制 一致而得到的,故叫统计控制。统计控制是试验 控制的一种辅助手段。经过这种矫正,试验误差 2 将减小,对试验处理效应

估计更为准确。若 y 的变异主要由x的不同造成 (处理没有显著效应),则各矫正后的 间将没有 显著差异(但原y间的差异可能是显著的)。若 y的 变异除掉x不同的影响外, 尚存在不同处理的显 著效应,则可期望各 间将有显著差异 (但原y 间差异可能是不显著的)。此外,矫正后的 和 原y的大小次序也常不一致。所以, 处理平均数 的回归矫正和矫正平均数的显著性检验,能够提 高试验的准确性和精确性,从而更真实地反映试 验实际。这种将回归分析与方差分析结合在一 起,对试验数据进行分析的方法,叫做协方差分 3 析(analysis of covariance)。

二、估计协方差组分 在第二章曾介绍过表示两个相关变量线性 相关性质与程度的相关系数的计算公式:

若将公式右端的分子分母同除以自由度 (n-1),得 (3-1)

4

其中 是x的均方MSx,它是x的 方差 的无偏估计量; 是y的均方MSy,它是y的 方差 的无偏估计量;

5

称为x与y的平均的离均差的 乘积和,简称均积,记为MPxy,即

(3-2)

6

与 均 积 相 应 的 总 体参 数 叫 协 方 差(covariance),记为COV(x,y)或 偏估计量,即 EMPxy= COV(x,y)。 于是,样本相关系数r可用均方MSx、MSy, 均积MPxy表示为: (3-3)

7

。统计

学证明了,均积MPxy是总体协方差COV(x,y)的无

相应的总体相关系数ρ可用x与y的总体标 准差 、 ,总体协方差COV(x,y)或 表

示如下: (3-4)

8

均积与均方具有相似的形式 , 也有相似 的性质。在方差分析中,一个变量的总平方和与 自由度可按变异来源进行剖分,从而求得相应的 均方。统计

学已证明:两个变量的总乘积和与自

由度也可按变异来源进行剖分而获得相应的均积。 这种把两个变量的总乘积和与自由度按变异来源 进行剖分并获得获得相应均积的方法亦称为协方 差分析。

9

在随机模型的方差分析中,根据均方MS 和期望均方 EMS的关系, 可以得到不同变异来 源的方差组分的估计值。同样,在随机模型的协 方差分析中,根据均积 MP 和期望均积 EMP 的 关系,可 得 到 不同变异来源的协方差组分的 估计值。有了这些估计值,就可进行相应的总体 相关分析。这些分析在遗传、育种和生态、环保 的研究上是很有用处的。 由于篇幅限制 , 本章只介绍对试验进行 统控制的协方差分析。

10

第二节

单因素试验资料的协方差分析

设有k个处理、n次重复的双变量试验资料, 每处理组内皆有n对观测值x、y,则该资料为具

kn对x、y观测值的单向分组资料,其数据一般

模式如表3-1所示。

11

表3-1 kn对观测值x、y的单向分组资料的 一般形式

12

表3-1的x和y变量的自由度和平方和的剖分参见 单因素试验资料的方差分析方法一节。其乘积和的剖分 则为: 总变异的乘积和SPT是xji与 离均差乘积之和,即: 和yji与 的

(3-5)

=kn-1

13

其中,

14

处理间的乘积和SPt是

的离均差乘积之和乘以n,即: (3-6)

处理内的乘积和SPe是 的离均差乘积之和,即:

(3-7)

15

=k(n-1) 以上是各处理重复数n相等时的计算公 式,若各处理重复数n不相等,分别为n1、 n2、…、nk,其和为 ,则各项乘积和与 自由度的计算公式为:

(3-8)

16

=SPT-SPt = -k =dfT-dft (3-9)

17

有了上述SP和df,再加上x和y的相应SS, 就可进行协方差分析。 【例3.1】 为了寻找一种较好的哺乳仔猪 食欲增进剂,以增进食欲,提高断奶重,对哺乳 仔猪做了以下试验: 试验设对照、配方1、配方 2、配方3共四个处理,重复12 次,选择初始条 件尽量相近的长白种母猪的哺乳仔猪48头 ,完 全随机分为4组进行试验,结果见表3-2,试作分 析。

18

表3-2 不同食欲增进剂仔猪生长情况表

(单位:kg)

19

此例,

=18.25+15.40+15.65+13.85=63.15

=141.80+130.10+144.80+133.80 =550.50 k=4,n=12,kn=4×12=48

20

协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和与自由度

SST ( x )  

x

2

2 ij

x   kn

2

2

63.15 2  (1.50  1.85    1.10 )  48 63.15 2  84.8325  48

2

 1.75

dfT(x)=kn-1=4×12-1=47

21

2、处理间平方和与自由度

=k-1=4-1=3

22

3、处理内平方和与自由度

(二)求y变量各项平方和与自由度 1、总平方和与自由度

23

2、处理间平方和与自由度

3、处理内平方和与自由度

(三)

求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度

24

=kn-1=4×12-1=47 2、处理间乘积和与自由度

=1.64

25

=k-1=4-1=3 3、处理内乘积和与自由度

平方和、乘积和与自由度的计算结果列于表3—3。

表3—3 x与y的平方和与乘积和表

26

(四) 对x和y各作方差分析(表3—4) 表3—4 初生重与50日龄重的方差分析表

27

分析结果表明,4种处理的供试仔猪平均初 生重间存在着极显著的差异,其50 日龄平均重 差异不显著。须进行协方差分析,以消除初生重 不同对试验结果的影响,减小试验误差,揭示出 可能被掩盖的处理间差异的显著性。

28

(五) 协方差分析

1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异 的影响的误差变异中找出50日龄重(y)与初生重(x)之间是 否存在线性回归关系。计算出误差项的回归系数并对线性 回归关系进行显著性检验,若显著则说明两者间存在回归 关系。这时就可应用线性回归关系来校正y值(50日龄重) 以消去仔猪初生重(x)不同对它的影响。然后根据校正后 的y值(校正50日龄重)来进行方差分析。如线性回归关系 不显著,则无需继续进行分析。

29

回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和, 离回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归 系数: (3-10) 误差项回归平方和与自由度 (3-11)

dfR(e)=1

30

误差项离回归平方和与自由度

=85.08-47.49=37.59 (3-12)

(2) 检验回归关系的显著性(表3—5) 表3—5 哺乳仔猪50日龄重与初生重的 回归关系显著性检验表

31

F 检验表明,误差项回归关系极显著,表明

哺乳仔猪50 日龄重与初生重间存在极显著的线 性回归关系。因此,可以利用线性回归关系来校 正y,并对校正后的y进行方差分析。 2、对校正后的50日龄重作方差分析 (1)求校正后的50日龄重的各项平方和及自由 度 利用线性回归关系对50日龄重作校正 ,并由 校正后的50日龄重计算各项平方和是相当 麻烦 的,统计学已证明,校正后的总平方和、误差平 方和及自由度等于其相应变异项的离回归平方和 及自由度,因此,其各项平方和及自由度可直接 由下述公式计算。

32

① 校正50日龄重的总平方和与自由度,即总离 回归平方和与自由度

(3-13)

= =47-1=46 ② 校正50日龄重的误差项平方和与自由度,即 误差离回归平方和与自由度

(3-14)

= =44-1=43 上述回归自由度均为1,因仅有一个自变量x。

33

③ 校正50日龄重的处理间平方和与自由度 =57.87-37.59=20.28 (3-15) =k-1=4-1=3 (2) 列出协方差分析表,对校正后的50日龄重进 行方差分析(表3—6)

查F值: =4.275(由线性内插法计 算),由于F=7.63> ,P<0.

01,表明对于校正 后的50日龄重不同食欲添加剂配方间存在极显著的差异。 故须进一步检验不同处理间的差异显著性,即进行多重 比较。

34

35

3、根据线性回归关系计算各处理的校正50日 龄平均重 误差项的回归系数 的影响,于是可用 均重计算公式如下: (3-16)

36

表示初生重对50 根据平均初生重的不同

日龄重影响的性质和程度,且不包含处理间差异 来校正每一处理的50日龄平均重。校正50日龄平

公式中: 为第i处理校正50日龄平均重; 为第i处理实际50日龄平均重(见表3—2); 为第i处理实际平均初生重(见表3—2); 为全试验的平均数,

为误差回归系数,

=7.1848

将所需要的各数值代入(3—16)式中,即可计算出 各处理的校正50日龄平均重(见表 3—7)。

37

38

4、各处理校正50日龄平均重间的多重比较 各处理校正50日龄平均重间的多重比较,即各种 食欲添加剂的效果比较。 (1) t检验 检验两个处理校正平均数间的差异 显著性,可应用t检验法: (3-17)

(3-18)

39

式中, 异;

为两个处理校正平均数间的差

为两个处理校正平均数差数标准误; 为误差离回归均方; n为各处理的重复数; 为处理i的x变量的平均数; 为处理j的x变量的平均数; SSe(x)为x变量的误差平方和 例如,检验食欲添加剂配方1与对照校正50日 龄平均重间的差异显著性:

40

=10.3514-12.0758=-1.7244 =37.59/43=0.8742 =1.52,

n=12

=1.28, SSe(x)=0.92

将上面各数值代入(3—18)式得:

于是

41

查t值表,当自由度为43时 (见表3—6误差 自由度),t0.01(43)=2.70 (利用线性内插法计算), |t| >t0.01(43),P<0.01 ,表明对照与食欲添加 剂1号配方校正50日龄平均重间存在着极显著的差 异,这里表现为1号配方的校正50日龄平均重极显 著高于对照。 其余的每两处理间的比较都须另行 算出 ,再进行t检验。

42

(2)最小显著差数法

利用t检验法进行 ,

多重比较,每一次比较都要算出各自的

比较麻烦。当误差项自由度在 20以上,x变量的 变异不甚大(即x变量各处理平均数间差异不显 著),为简便起见,可计算一个平均的 用最小显著差数法进行多重比较。 计算公式如下:

43

采 的

(3-19) 公式中SSt(x)为x变量的处理间平方和。 然后按误差自由度查临界t值,计算出最小显著 差数: (3-20)

44

本例x变量处理平均数间差异极显著,不满足 “x变量的变异不甚大”这一条件 ,不应采用此处 所介绍的最小显著差数法进行多重比较。为了便 于读者熟悉该方法,仍以本例的数据说明之。 此时 由 =43,查临界t值得:

于是

t0.05(43)=2.017,t0.01(43)=2.70 LSD0.05=2.017×0.4353=0.878 LSD0.01 =2.70×0.4353 =1.175

45

不同食欲添加剂配方与对照校正50日龄

平均 重比较结果:

多重比较结果表明: 食欲添加剂配方1、2、3号与对照比较, 其校正50 日龄平均重间均存在极 显 著的差异,这 里 表 现 为 配 方1、2、3号的校正50日龄平均重均极显著高于 对照。

46

(3) 最小显著极差法 当误差自由度在20以上,x变量的变异不甚 大,还可以计算出平均的平均数校正标准 误 ,利用LSR 法进行多重比较。 的计算公式如下:

(3-21)

47

然后由误差自由度

和秩次距k查SSR表

(或q表),计算最小显著极差: (3-22) 对于【例3.1】资料, 由于不满足“x变量 的变异不甚大”这一条件, 不应采用此处所介绍 的LSR法进行多重比较。为了便于熟悉该方法, 仍以【例3.1】的数据说明之。

48

此时

=0.8742,

n=12,

SSt(x)=0.83, SSe(x)=0.92,k=4,代入(10—21)式

可计算得:

SSR值与LSR值见表3—9。

49

50

各处理校正50日龄平均重多重比较

多重比较结果表明: 食欲添加剂配方3、2、1号的哺乳仔猪校正 5 0 日龄平均重极显著高于对照 ,不同食欲添加剂配 方间哺乳仔猪校正50日龄平均重差异不显著。

51

END

52

范文三:方差分析与协方差分析 投稿:许緡緢

案例介绍 ANOVA ANCOVA

Q.He

Stat Consulting

1

Q.He

Stat Consulting

2

数据来源及说明

方差分析

Q.He

Stat Consulting

3

Q.He

Stat Consulting

4

方差分析 方差分析

因素( factor)也称为因子,每一因素至少有两个水平 ) 因子 (level) . 一个因素— — 单向方差分析 两个因素— — 双向方差分析 ANOVA与回归分析相结合— — 协方差分析(analysis of

covariance)

日常生活中经常发现,影 响一个事物的因素很多, 希望找到影响最显著的因 素.

如某种农作物的收获量受农作物品种, 肥料种类及数量等的影响.

目的:用这类资料的样本信息来推断各组间多个总体均 数的差别有无统计学意义 .

Q.He Stat Consulting 5 Q.He Stat Consulting 6

1

看哪一个影响大?并需要知道 起显著作用的因素在什么时候 起最好的影响作用.

方差分析的基本思想:把全部数据关于总均值的离差平方和 分解成几部分,每一部分表示某因素诸水平 或交互作用所产 生的效应,将各部分均方与误差均方相比较 ,从而确认或否 认某些因素或交互作用的重要性. 用公式概括为:

各因素引起 由个体差异引 起(误差)

总变异=组间变异+组内变异

种类:常用方差分析法有以下4种

方差分析就是解决这 些问题的 一种有效方法.

Q.He Stat Consulting 7

1, 单因素方差分析 2, 双因素方差分析 3, 多因素方差分析 4, 有交互因素方差分析

Q.He Stat Consulting 8

单因素方差分析

单因素方差分析

假定:数据满足正态性,独立性,同方差性. 要检验因素A对指标是否显著影响,就是检验假设: H0: 2=… = 1= k 接受H0:即认为来自同一总体,差异由随机因素所造成. 若拒绝H0:表明它们之间差异显著,差异有因素水平的改变 所引起. 做法:为了检验假设H0,要从总的误差中将系统误差和随机 误差分开.

yij i ij u

Q.He

Stat Consulting

9

Q.He

Stat Consulting

10

方差分解

SST yij y yij y i yi y

k ni k 2 ni 2 i j 1 1 i j 1 1 2

y y y y ij y i i y 2ij y i i y

k ni 2 i j 1 1 k ni

y y ij y i ni i y i j 1 1 i 1

k 2 2 SSE SSA

Q.He Stat Consulting 11 Q.He Stat Consulting 12

2

F检验

双因素简单可加模型

ylkr l lkr k e

Q.He

Stat Consulting

13

Q.He

Stat Consulting

14

双因素交互作用模型

多因素方差分析

ylkr l k lk lkr e

Q.He

Stat Consulting

15

Q.He

Stat Consulting

16

描述统计分析

Q.He

Stat Consulting

17

Q.He

Stat Consulting

18

3

Q.He

Stat Consulting

19

Q.He

Stat Consulting

20

Q.He

Stat Consulting

21

Q.He

Stat Consulting

22

Hedonic Regression Method (HRM)

The word hedonic refers to pleasure, and reflects the desirability or quality of non-priced aspects of the environment. E.g. The effect on residential home values of quiet, stable neighborhoods with fine views, low crime, easy commutes, and little smog. Rev

eals willingness to pay for environmental, health, safety, and community qualities. Can estimate a type of demand curve for a particular level of environmental and other qualities.

Q.He Stat Consulting 24

Q.He

Stat Consulting

23

4

Assumption

An

asset's value derives from the value of its different characteristics. The price of a house will therefore depend on the value the buyer places on both qualitative (e.g. heating type) and quantitative attributes (e.g. number of bedrooms).

Q.He Stat Consulting 25

Since the prices of these characteristics cannot simply be observed, hedonic regression estimates the implicit market value of a unit of each attribute by comparing sample house prices with the associated characteristics

Q.He

Stat Consulting

26

It is assumed that a house can be decomposed into characteristics such as number of bedrooms, size of plot, or distance to the city center. A hedonic regression equation treats these attributes (or bundles of attributes) separately, and estimates prices (in the case of an additive model) or elasticity (in the case of a log model) for each of them.

Q.He Stat Consulting 27

5

范文四:方差分析与协方差分析 投稿:黄嗶嗷

方差分析

方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

方差分析的作用

一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。

经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。 方差分析的分类及举例

一、单因素方差分析

(一)单因素方差分析概念理解步骤

是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。

例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差 分析得到答案。

单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。

单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。

单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。

(二)单因素方差分析原理总结

容易理解:在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起

的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。

(三)单因素方差分析基本步骤

1、提出原假设:H0——无差异;H1——有显著差异

2、选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验。

3、计算检验统计量的观测值和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。

4、给定显著性水平 ,并作出决策

(四)单因素方差分析的进一步分析

在完成上述单因素方差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他几个重要分析,主要包括方差齐性检验、多重比较检验。

1、方差齐性检验

是对控制变量不同水平下各观测变量总体方差是否相等进行检验。

前面提到,控制变量不同各水平下观测变量总体方差无显著差异是方差分析的前提要求。如果没有满足这个前提要求,就不

能认为各总体分布相同。因此,有必要对方差是否齐性进行检验。

SPSS单因素方差分析中,方差齐性检验采用了方差同质性(homogeneity of variance)检验方法,其原假设是:各水平下观测变量总体的方差无显著差异。

2、多重比较检验

单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显区别于其他水平,哪个水平的作用是不显著的,等等。

例如,如果确定了不同施肥量对农作物的产量有显著影响,那么还需要了解10公斤、20公斤、30公斤肥料对农作物产量的影响幅度是否有差异,其中哪种施肥量水平对提高农作物产量的作用不明显,哪种施肥量水平最有利于提高产量等。掌握了这些重要的信息就能够帮助人们制定合理的施肥方案,实现低投入高产出。

多重比较检验利用了全部观测变量值,实现对各个水平下观测变量总体均值的逐对比较。由于多重比较检验问题也是假设检验问题,因此也遵循假设检验的基本步骤。

二、多因素方差分析

(一)多因素方差分析基本思想

多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。这里,由于研究多个因素对观测变量的影响,因此称为多因素方差分析。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。

例如:

分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。

(二)多因素方差分析的其他功能

1、均值检验

在SPSS中,利用多因素方差分析功能还能够对各控制变量不同水平下观测变量的均值是否存在显著差异进行比较,实现方式有两种,即多重比较检验和对比检验。多重比较检验的方法与单因素方差分析类似。对比检验采用的是单样本t检验的方法,它将控制变量不同水平下的观测变量值看做来自不同总体的样本,并依次检验这些总体的均值是否与某个指定的检验值存在显著差异。其中,检验值可以指定为以下几种:

观测变量的均值(Deviation);

第一水平或最后一个水平上观测变量的均值(Simple); 前一水平上观测变量的均值(Difference);

后一水平上观测变量的均值(Helmert)。

2、控制变量交互作用的图形分析

控制变量的交互作用可以通过图形直观分析。

三、协方差分析

(一)协方差分析基本思想

通过上述的分析可以看到,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。

例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进行方差分析,显然是不全面的。因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。不考虑这些因素进行分析可能会导致:即使不同的施肥量、不同品种农作物产量没有产生显著影响,但分析的结论却可能相反。

再例如,分析不同的饲料对生猪增重是否产生显著差异。如果单纯分析饲料的作用,而不考虑生猪各自不同的身体条件(如

初始体重不同),那么得出的结论很可能是不准确的。因为体重增重的幅度在一定程度上是包含诸如初始体重等其他因素的影响的。

(二)协方差分析的原理

协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。 协方差分析仍然沿承方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,人为观测变量的变动受四个方面的影响:即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量的影响。

方差分析中的原假设是:协变量对观测变量的线性影响是不显著的;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方比。

范文五:协方差分析应用 投稿:黄檪檫

协方差分析应用

主体间因子

1.00

饲料种类

2.00 3.00

N

表1 生猪体重协方差分析结果

表1中分别列出了各变差分解的情况、自由度、均方、F统计量的观察值及概率p值。为说明各数据,将单因素方差分析结果显示在表2中,以便比较。 表2 生猪体重单因素方差分析结果

在表2中:

.观察变量的总变量为2555.958,同单因素方差分析中的SST; 随机因素可解释的变差由原来的1238.375减少为227.615,这是由于排除了喂养前体重的影响造成的。其计算的基本思路是:由“方差分析中随机因素可解释变差的定义”可知,他们是各自观察值与各水平平均值的平方和。

为排除协变量对分析的影响,应首先在各水平内部将协变量的作用排除后,在计算随机因素可解释的变差。

计算步骤如下。

范文六:协方差分析及协变量 投稿:周郵郶

残差平方和

概念:

为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个残差的平方后加起来 称为残差平方和,它表示随机误差的效应。

意义:

每一点的y值的估计值和实际值的差的平方之和称为残差平方和,而y的实际值和平均值的差的平方之和称为总平方和。

定义:

协方差是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进行统计控制的一种综合方差分析和回归分析的方法。

意义

当研究者知道有些协变量会影响因变量,却不能够控制和不感兴趣时(当研究学习时间对学习绩效的影响,学生原来的学习基础、智力学习兴趣就是协变量),可以在实验处理前予以观测,然后在统计时运用协方差分析来处理。

将协变量对因变量的影响从自变量中分离出去,可以进一步提高实验精确度和统计检验灵敏度。

方差是用来度量单个变量 “自身变异”大小的总体参数,方差越大,该变量的变异越大;

协方差是用来度量两个变量之间 “协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。

对于仅涉及单个变量的试验资料,由于其总变异仅为“自身变异”(如单因素完全随机设计试验资料,“自身变异”是指由处理和随机误差所引起的变异),因而可以用方差分析法进行分析;

对于涉及两个变量的试验资料,由于每个变量的总变异既包含了“自身变异”又包含了“协同变异”(是指由另一个变量所引起的变异),须采用协方差分析法来进行分析,才能得到正确结论。

方法

(一)回归模型的协方差分析

如果那些不能很好地进行试验控制的因素是可量测的,且又和试验结果之间存在直线回归关系,就可利用这种直线回归关系将各处理的观测值都矫正到初始条件相同时的结果,使得处理间的比较能在相同基础上进行,而得出正确结论。这一做法在统计上称为统计控制。

这时所进行的协方差分析是将回归分析和方差分析结合起来的一种统计分析方法,这种协方差分析称为回归模型的协方差分析。

(二)相关模型的协方差分析

方差分析中根据均方MS与期望均方EMS间的关系,可获得不同变异来源的方差分量估计值;在协方差分析中,根据均积MP与期望均积EMP间的关系,可获得不同变异来源的协方差分量估计值。

这种协方差分析称为相关模型的协方差分析。

残差平方和:

为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异 称残差,把每个残差的平方后加起来 称为残差平方和,它表示随机误差的效应。

回归平方和

总偏差平方和=回归平方和 + 残差平方和。

残差平方和与总平方和的比值越小,判定系数 r2 的值就越大。

协变量:在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。

范文七:协方差分析的回归分析法 投稿:黄熲熳

f 3 |  。  6

第 1卷 第 2 5 期 

19 9 2年 6月 

报 

V O.5  N o.  11 . 2 l n. 9 2 u ,I 9  

J u na  fAu u t 1 tAg i o r l o   g s  s  r.Colg   l e e

协 方 差 分 析 的 回归分 析 法 

陈敬锋 樊 丽 淑 

(础 ) 基部  

摘 要

0a   l

本 文根据线性模 型参敷估 计和假设检验 的一般理论 ,给 出了以方差 

分析 为主要 目的和 回 归分析 为主要 目的 的协方 差分析 问题 的统一 的处理方 法一   回归分析 法.并以一个 实例说 明这种 方法的具体算 法.  

关 词 协 差 生 型 边 书 扫 运 、 』 键 方 分 撒 : 界 件: 描 算   拿 ‘   f  

— — — —

 

J  

考虑一般的协方差分析模型 

Y=   + : + e P~Ⅳ ( ‘   , 0 D    f) 1  

式中: ,为 n l的观 铡 向量 , 一 ( x     为 ×m 的已知矩阵 ,其 元索  i 皆为 0 1 为  或 ,   因子 效应 向量 .特 估 . z   构成 了模 型 的方 差 分析部分 .Z   ( 为 H  J ×P的 已知 实矩 

阵,口为 回归系数 ,z口为模 型的 回归分 析部 分.如果我 们把 Z的行 向盈 视为  随机向量 

的  个 独 立 的 观 铡 向量 的 话 , 只 要 月足 够 大 . 有 

一  

r ’  

L 』  

J ) () 0  ‘ n z ={ } (

, 

() 2 

以概率 1 立.这里  ( 成  )指以  的列 向量张成 的子空问 .   以方差分析为主要 目的 的协方差分析, 已有一套固定的算法,即通过对 瞄去 回归部分  }

所得到的纯方差分 析模型作方差分析时的各项平方和作适 当的修正 .以及 一些 跗加计算 而  完成 “ ,但 在不太多 的情况下 .协 方差 分析模 型 也以 回归分析为主要 日的,这 I ,上 述  ) 时

算法对参数估计和假设检验就不再凑效.   作 为线性 模型 , 方差分 析模型 中,我们 总假 设 z列满秩 而方差分 析部分 的 没汁矩    阵  是 列不满 秩 的.如果设置适 当的主 界 条件,加上条 件 () ! 上 2 .就 可 以用同归分析 帕方  法进 行计算 了.这 样,不管以方差分 析还是以回归分析 为主要 1的的协方差分 析,都可 以  3 巾回归分析 的程序 有效 地进 行计算 .边界 条件 的设置 .可参照巾 回归分析 的算 法处 理方差 

分 析 问题 的 方 法  .  

这 里以对新疆紫 泥泉牧场 牧草产 量与环境相关的研究为例 ’ .说 明  方差分析 的回归 

分析处理 的具体算法 。  

收藉 刚 鲫:I9 — 9 IO  l  9

・ 奉 例来 自

中 国科 学院 科学基金 舅 助项 日.    

报 

1 问题 及 模 型 

对 5 不刚坡 向的牧草 作 了 3 个 年观 测,分别得到 2 4或 2 个牧 草产盈数据 Y. f , 5 1 =1 '   2 ,… .   户 1 ,…, 。 里 玎 为 2 ,2   .这 . 4或 2 .并 取得每 个观 测样方的 5 环境l 标数  5 个 指 据 : 降 雨 皿 ( 内 累 汁数 ) 年   , 大 气 温 度  . 土 壤 含 水 扭  . 日Ji 数 ( 内 累 计  !埘 f 年 数)   及 土壤 温度 ( ~ l m 处 ) ” 5 Oc   ,假 没第 i 坡 向第 , 个 次观 测 数 据  有 如 下 结 构 :  

Y 1 =  +  J +  1   + … +  5   + £

j  f

() 3 

式 中: 为第 i 坡 向的效应 .口,… 。以 为 同归分析部分 的  ¨系数 , i   个 .   均位  为零 方差齐性,诸 i 柑互 独立 .写成 () 的矩阵形 式.有: 1  

Ⅸ   ( , C , … , C ) , 口一 ( ,   t - t , 口 ,… ,口 )   

12  1  4  

24  

0  

0   0  

I ”

0   0  

0  

0   0  

0  

1 ∞ ∞ X =  1 I ∞ 1.   2

0   1 ∞  0   0   0   0   0   0  

0   0  

I ”

0  

0   14    2

这 里 1 为 分 盈 全 是 I的 s 列 向量 。 其 秩 R ( 。 维 种

e ( I … 。 En) ‘ N( , zI )  :   , 55 ~ o  T2 . 3

=5 .z 为 1 3 2 ×5的 矩 阵 , 列 满 秩 .  

我 们 试 图通 过 对 数 据 的分 析 ,  

第一 。检验不同坡 rx 牧草产盘的影响是否显 著,即检验假 设   ̄. J ,L

:  

o I  

C t

z …   

,  

() 4 

c =0 式中: Ⅸ 。   c=I  

l r 1—  0 0I   1 0  0   一     l  

0 0     1   — 1   0   0  

I  

模型.  

0   1  

l  

0 0     0

—   J l  

这是 一 个 以方 差分 折 为主 要 I 的  方 差 分 折 问题 . 3的  

第二 ,产量与环境 因子的柳关性分析 .试 图从 5 个环境因子 中选 f与产量相关最好 的  “ 子集来 .如 果不同坡 向对牧草产量 的影响是不显著 的,则 模型 ()变 为单 纯的 回归分 折  1

Y=  1+ z  + e   () 5 

问题归结为一般 的同归 口变量的选择.如果坡向效应是显著的,则问题即以 回归分析为主  要 I帕 的协方差分析 问题 . t  

2 因子 效应 检验 的算 法 

由 于  r =5 可 设 边 界 条 件 如 Ⅸ =0 。即 划 去 X 的 第 二 列 得    。 t , .

模 型 () 为  I变

第 2期

胨敬 锋等 : 协 方差分 析纳 同归分 析法 

15 0 

r’ ; 这矩 ’ 满,回分・残平和   ZJ 时阵’) 秩作归析得差方  ‘)  l z 列

10 65 , 自由度 dc 2-1 = 13 这里 l 9 6 .6 f =1 3 0 1 , 0为矩 阵 (  。・ 的秩 , 以 下类 似 . z)  

当 , () 成立时 ,模 型变 为 ()   即 4 5 ,这是一个 纯 回归分 析模型 ,作 回归分 析,得  残 差 平 方 和  l= 24 02 , 自 由度 d m =13 =17 因而 有  I 36 . c 0 - r 2—6 1 , 。  

( s ̄ s

F- —

— — -

ss )     /(r d ., SS / df e   -

— —

i ) re f

~5  6.l  

而 概 率 P ( -1 <65 ) >09 ,   l .1 3  9 

被 拒 绝 .即 不 同 坡 向牧 草 产 量 有 显 著 差 异 . 这 

主要 是 因 为不 同坡 向 的植 物 种 的构 成 各 自不 同 .因 此坡 向效应 的差 异 是 收 显 著 的 .  

3 协 变 量 的选 择 

为作 牧草产量 与环境 指标 问的相关分 析,我们在保 留模 型的方差 分析部分 的条件下 ,   计算 5个环境 指标的所 有可能 子架的回归 .井从 中选 小最佳的协变量子集.   保 留模 型的方差分 析部分  ,设  表 l C 值表    ,

置边 界 条 件  =0 。变  为  ’ .以 协  变量 中 的 莱 一 子 架 构 成 模 型 中 的 回 归 

分 析部 分 .作 回归分 析,并 计算统 计  量 c 的位,得如下 的最 小  伍表. n  

这 里 与 纯 回 归 模 型 的 E变 量 选 择  I

所不 同的 即在于对 任一 协变量子集作  回归 ,总保 留方差 分析部分 的哑变 _ ,因而统 汁量  中的参数 ,总等于 X’ 盈 的秩加上协  变量 个数 。 由回归 自变量选择 的 c 准则 。 得最佳  变量子集  ‘ n     和  ) .这 时的残 差平  方和  =2 32 8 0 1. , 5  =1 3 7 1。进而作显 著性 检验,即在承认 不同坡 向对产量有  2- ;16 =13 5 】 ,得  2- =l8 显著 差异 的条件下 ,检验假 设  。 .  =0 : =   ,在这个假 设下,模型变成 了纯方差分 析模  型.作 回归分 析.得残 差平 方并  H=3 1 1 8 ”   63 . , 8 

( 6 3  8 2 3 2 8 /( 1 一 l6  …   3 1 18 — 0 1 . ) 1 8 5 1)

—— — —  丽  

7   —— 一 1

 

。  “

而概率 ,   . l 51) >09 .风 以极大 的概率被拒绝 . r 1 <4 . 6 7 ,9   这说 明牧草产 量除坡

向效应外 ,与  ” 和  有着较强 的相 关性 ,这个结论 与各 坡 向   的产量各 自与环境 因子所作相关分 析得 到的结论  基本一致 .进一步 考察 原始数据 ,发  现  ” 和  ” 的观 测位 是年 内的累加 伍 ,而 牧草产_ 的期望 , 在年 内也应 是 魈时 问递增  皿 的.因此 以上结粜是显然的 .可见这个结论并不能代特缚两次观测 问牧草产量增量与 环境  因子阔的相关性质 .   最后, 以   ” 和 

=2 3 25 . 0 1 .8  

为 协 变 量 , 作 如 同 第 二 日 中 的 因 子 效 应 检 验 , 得 

H = 2 0 51 ,   48 .   5 = 1 0 于 是 ,= 53 , 而 P ( 2, .9  

.  

= l6 】.  

I <53) >09 .说 明以 ” I - 6 9 , 9   和  为  变量,坡 向效应 仍是极显著 的.  

1   06

报 

l9 9 2年 

设脚 I 变量.与 

蜃一商棒成 

。  

设计矩阵.井计 算撵车  方肆 L  . 工  

缈变量所 对应 帕位置 为轴 心。  

对 L作扫捕 运算 .记 下 sm  s

l  

以方 差变量 所对应 帕 位霞 为轴 心,   对 L作扫 描运 算.记 Fs |  s  

工   作田 子教痈 帕显 著性 榆喻 

l 以方差变豆所时应的位    『 为轴心.对 L作扫捕运彝   

以二 进 制 敷的顺序 ,柞 所有 可能  变 

量 彳集 同归, 求  』 仕 蚺变 -  集 . 矗 甩  

上.  

以l 菇 壹 盛所 对应 的 位髓为 辅心 . 力  

对 L作 打捕运算 . 记下 殪差 下方 和 

' L   作 嘲于簸应 的显 著性 掩|  奄

I <建> 否 是 l  

铺    柬、 重考摸 及怯 新虑撮莽  l  

 

第 2栅 

陈敬 锋等 : 协方 差分 折的 回归分析 法 

17 0 

4 小

结 

在协变量数 目较多 或因子 的水平组合数较多 时.以上算法 的计算量是相 当大 的.但当  协 变量 的数 目和 因子 水平组合数都 不太多 时,可用如下 的流程进行计算 .这 里应 用了 回归  分 析中对样本协差 阵的扫描运算  的两个性质 ‘ :   

r “r  = r r “   T l u= I l T   

这 里 j 恒 等 变换 . 指  

、  

参 考 文 献 

1 王I桂 .   盐 线性 模型 的理论 及其 应用 . 徽 教育 出版 社.18 : 9 —4 5 安 97 30 0  2 陈敬锋 . 方差 分析 帕回归 分析 法. 八一 农学 院学报 .18,10】 7 -8  98   : 9 2 1 3 陈敬 锋.回归 白变盈 帕选择 : _ 则, 有 变显 子集 帕 回归 . c准 所 八一 农学 院学报 .19 .I( :1一 90 31 3   )

I  7

胡锋铎. 天山北坡低 山春秋牧场草地类型及其生产量动态与环境条件相关性曲韧步研究. 顼士论 

文 .18   98

5 胨 希i 王橙 如 近代 回归分 析 . 氘 安徽 教育 出版社 .18 : 7 2 1 9 71 - 0  9

Re r s i n Tr a me to   a y i  fCo a i n e g e so   e t n  fAn l sso   v ra c  

Ch nJn Fn   Fa   s   e  i g e g n Lihu

(De at n r a i Co re   p rme t B s   u ss) o c

Ab ta t A c o di g t  he g n r lt e r m  sr c  c r n  o t   e e a  h o e ln a   o e we gi e t c r g ̄ s i n i rm d 1 e   v  h  c so  

t c t n   o t c m o c  f a a y i o   o a l n ,  ̄ m m on t c t c t m e h d b t   0   r a me t t   h   d lo   n l s s r c v r a c a o     ra m n   t o   oh rr

a l sso   a t n c a d f rr g e s   n l ssa   rn i a  u p c A  o ke   x m p ci  nay i  fv ra c   n  o  e rs on a ay i  sp i cp lp r os i w r dc a l  s

g v n t   l ta et eUS   f h   c h d  ie  o i usr t h   eo t em t o . l Ke   o d   An l s   r o a a c ; o d r  on to s s c p o e a o   yW rs a y i o C v r n c b un a yc di n ; wc   p r t r s i i

范文八:双协变量的方差分析 投稿:邓鮒鮓

第23卷第2期2000年4月 河北农业大学学报

JournalofAgriculturalUniversityofHebei

  

Vol.23No.2 Apr.2000

文章编号:1000-1573(2000)02-0109-03

双协变量的方差分析

李春兰,李永慈

(河北农业大学,河北保定 071001)

Ξ

摘要:进行方差分析,需要消除一些不可控因素的影响,这些因素有时以变量的形式出现,称为协变量。利用二次型解决了双协变量的方差分析方法。

关键词:协变量;协方差分析;正规方程组;二次型中图分类号:O212.1   文献标识码:A

ThecovarianceanalysiswithtwocorrelatedLIChun2lan,LIYong2(AgriculturalUniversityofHebei,)

Abstract:Theinflunceofsomeuncontrolledvarianceanalysis.Inthispaper,theauthorsexpoundedcorrelatedvariablesandsolveditwithquadricform.

Keywordsanalysis;normalequations;quadricform

方差分析又称析因分析,是通过对目的变量的观测数据离散情况的分析,找出影响试验结果的主要因

素。但是,在有些试验中,除了对试验因素的控制外,还有些不能控制或难以控制的因素在起作用,这些因素有时以变量的形式出现,且对目的变量有线性影响。例如,使用不同配比的猪饲料对猪增重量的影响也是不同的,这就需要对不同配比的猪饲料比较其优劣。而猪增重量除了与饲料有关外,还与猪的初生重量和喂养开始时的重量有关,因此,要比较饲料的优劣就需要消除这两个变量的影响。

1 两个协变量样本资料的表示方法

设要考察的因素A有k个水平:A1,A2,…,Ak,目的变量Y与协变量X(1),X(2)有线性回归关系。设

Xij,Xij,Yij表示Ai水平下X

(1)

(2)

(1)

(2)

、X、Y的第j次观测值,i=1,2,…,k,j=1,2,…,n。观测资料列于表

1。

表1 双协变量样本资料的一般表示

Table1 Thecommonexpressionoftheobservationswithtwocorrelatedvariables

因素

Factor观测值

A1A2Ak

1stclass

11X11X12…X11n22X11X12…X12n()

()

()

()

()()

2ndclass

11

X21X22…X21n22X21X22…X22n()

()

()

()

()()

kthclass

Y11Y12…Y1nY21Y22…Y2n

……

…………

11

Xk11Xk2…Xkn2Xk21Xk2…Xkn()

(2)

()()()()

Yk1Yk2…Ykn

2 计算修正后的剩余平方和Le

()

由于目的变量Y除受因素A的影响外,还与X(1)、X2有线性相关关系,需要对样本资料进行修正,以

(2)

消除X(1)、X对Y的线性影响引起的变异。

Ξ收稿日期:1999-12-07

作者简介:李春兰(1965-)女,河北省定兴人,河北农业大学基础部,讲师,从事数学教学1

110     

河北农业大学学报

1210

L11iai+Lbi=Li

第23卷

在每个Ai水平下,(s)s

其中:Lsti=Xij-Xj=1n

Liai+L

2122

bi

=L20

i

()

()

()

()

Xij-Xi

(t)(t)

,s,t=0,1,2。Xij0=Yij,Xi0=Yi;Xi1,X12,Yi分别表示在Ai

k

k

n

水平下相应于X(1),X(2),Y的样本均值。

把每个Ai水平下样本资料的信息综合到一起。令Est=∑

i=1

st

L

iss

=∑Xij-Xi

i=1j=1

()()

Xij-Xi

t(t)

,建立

一个正规方程组

()

E11a+E12b=E10E21a+E22b=E20

()

k

n

,解出公共的回归系数a3,b3。在每个Ai水平下,有线性回归方程:

()

()()

Yi=a3Xi1+b3Xi2+ci,其中:ci=Yi-a3Xi1-b3Xi2

而Le=∑Yij-Yij

i=1j=1k

ni=1j=1

kn

2

3132

=∑Yij-aXij-bXij-ci

(

)

i=1j=1

2

=

2

∑E00+a

Yij-Yi

32

-a3

32

Xij-Xi

3

(1)(1)

-b3

3

Xij-Xi

3

(2)(2)

=

E+bE22-2aE10-2bE20+2a

33

b

3

E12=

 E00 -E10 -E20

1a3b3

3

1

a-E10  E11  E12-E20  E21  E22

3

=

()22E00-aE10

-E2

E11E22-(E12)

,Lk(n-1)-2

3 LT

把因素A每个水平下3个变量的观测值放在一起,得正规方程组(s)(s)

其中:Lst=∑Xij-X

i=1j=1k

n

L11a+L12b=L10L21a+L22b=L20

(1)

(2)

Xij-X

(t)t

,s,t=0,1,2。XL2

(0)

=Y;X

2

,X,Y分别表示相应于

X

(1)

,X

(2)

,Y的总平均值。同理:LT=L00-

L

L11L22-

2

L12

,LT的自由度为kn-3。

4 对目的变量Y进行方差分析

修正后的A组间平方和LA

=LT-Le,自由度是k-1,MSA=

(s)(s)(s)(s)

由于,Lst=∑Xij-Xi+Xi-X

i=1j=1k

nk

n

k-1

,MSe=

(t)

,F=。

k(n-1)-2MSe

Xij-Xi

Ki=1

(t)(

t)

+Xit-X

(s)

()

=-X

(t)

i=1j=1

∑(s)

Xij

-k

(s)Xi

n

(t)Xij

-(t)Xi

k

n

s

+nXi-X(sXij

()

k

k

n

()

Xi

(t)

=

Est+Tst=∑∑

i=1j=1

(

)Xijs(t)

Xtij

-(t)

kn

i=1j=1

k

∑∑

i=1

i=1j=1

∑∑X(ijt(s)

(s)(s)

而 Tst=∑Xi-X

i=1j=1

kn

Xi

(tXij

-X-kn

s

=nXi-X

Xi

(t)

-X

(t)

=

ni=1

j∑=1

kn

(sXij

j=1

n

i=1j=1

∑∑

nn

(sXij

i=1j=1

∑∑X(ijsn

5 实例分析

研究4种猪饲料对猪平均每天增重的影响。供试猪40头,随机分成4组,每组喂一种饲料。现记录每头猪初生重量X(1)(kg)与喂养开始时的重量X(2)(kg)及试验期中每天平均增重量Y(kg)如表2。

 第2期     李春兰等:双协变量的方差分析

表2 双协变量观测资料

Table2 Thesampledatawithtwocorrelatedvarriables

111

因素Factor

X

(1)(2)

观测值Obs

112350189111270163111280155112320152

019290181112260181112330169113270158

nj=1

∑x

019290168110220167019200155018280153

110190173018200163110220159110200154

110180168110170164111230172018240143

112190181018170158019180155019190151

017160158019200157018170148018170151

9192387158102246169101323051959172425∑x2

1010159885182569199514441529110177550431588991676046219573

∑xy

2381237160931831543617013361199335128133238153

333333

01925017411026017311026015810250163

110230180019240167111200158019230162

n

111250186112250176112230166110270154

j=1

饲料1

XX

Y

(1)(2)

225113

333

饲料2

XX

Y

(1)(2)

241113

333

饲料3

XX

Y

(1)(2)

饲料4

X

n

Y

j=1

  注:3—∑X(ij1)X(ij2),33—∑X(ij1)Yij,333—∑X(ij2)Yij1

(X(1)与喂养开始时的重量X(2)作为协变量)。

计算得:L11=0.64,L12L=.1,10=0.224,L20=6.53,L00=0.48,

T11,0.4T22=19.5,T10=0.004,T20=-0.43,T00=0.27,

E11E1211.64,E22=853.6,E10=0.22,E20=6.96,E00=0.21

22=01392

0164×87311-11124

22Le==01122

0162×85316-11164

LT=0148-LA=LT-Le=0127,F=

=25153

0112/34

3

从计算结果可以看出,不同饲料处理间猪平均每天增重的F值达到非常显著水平。利用二元回归、二次型以及离差平方和分解技巧推导的双协变量方差分析的计算公式能简洁、方便地消除协变量的影响。消除协变量影响后再进行方差分析,提高了方差分析的精度,更能准确地反映试验因素对目的变量的影响。

参考文献:[1] 北京林学院.数理统计[M].北京:中国林业出版社,1979.[2] 周概容.概率论与数理统计[M].北京:高等教育出版社,1986.

[3] R.G.D.斯蒂尔,J.H.托里著;杨纪珂,孙长鸣译.数理统计的原理和方法[M].北京:科学出版社,1979.[4] 范濂.农业试验统计方法[M].郑州:河南科学技术出版社,1983.

(编辑:李 宇)

范文九:协方差与偏相关分析 投稿:孔郫郬

土壤-植物营养研究法

王淑平

2012年4月18日

回顾:

多元线性回归方程:

检验:

= b1SP1y+ b2SP2y+…+ bmSPmy

剔除不显著自变量

多元回归方程变量标准化:

令:

y′ = y− y sy

y′ = 或令:

x′i = xi − xi si

y− y sy xi − xi si

x′i =

y′ =

则改为:

y− y sy

第九章:曲线回归

9.1 可直线化的曲线的类型与特点: 一、指数函数形式:

二、对数函数形式:

三、幂函数曲线:

四、双曲函数曲线:

五、S型曲线:

1 − ln   a b

9.2 方程的配置

一、曲线回归分析的一般程序: 1、根据变数之间的关系,选择适当的曲线 类型。散点图 2、对选定的曲线类型,线性化后按最小二 乘法原理配置直线回归方程,并做显著 性检验。 3、将直线回归方程转换成相应的曲线回归 方程,并对有关统计参数作出推断。

例:幂函数曲线方程的配置

10

解:首先配置幂函数曲线方程:

﹡﹡

是否可以选用该指数方程???

9.3 多项式回归

一、多项式回归方程配置: 1、多项式回归方程式:

最简单的多项式是二次多项式,其方程为:

 2 =b 0 + b1 x + b 2 x 2 y

三次多项式的方程为:

 3 =b 0 + b1 x + b 2 x 2 + b3 x 3 y

多项式方程的一般形式为:

 k = b 0 + b1 x + b 2 x 2 +  + bkx k y

2、多项式方程次数的初步确定:

两个变数的N对观察值配置多项式方程时, 最多可配到k=N-1次多项式。 可根据资料的散点图作初步选择。散点 所表现的曲线趋势的峰数+谷数+1即为 多项式回归方程的次数。若散点波动较 大或峰谷两侧不对称,可再加一次。

3、多项式回归方程的建立:

 k = b 0 + b1 x + b 2 x 2 +  + bkx k y

采用矩阵方法求解:

二、多项式回归的假设检验:

1、多项式回归关系的假设检验:

2、偏回归检验:

例:测定小麦田孕穗期的叶面积指数(x)和籽 粒产量(y),试建立多项式回归方程。

解:根据资料散点图及资料性质,拟建立

二次多项式回归方程:  b 即:y = 0 + b1 x + b 2 x 2

即得到回归方程:

检验:

9.4 正交多项式回归

一、正交多项式回归分析的原理:

用正交多项式代换多项式回归方程中的自变量 各项,从而使信息矩阵成为对角矩阵。 由于回归系数之间不具有相关性,所以回归平 方和等于各次正交多项式偏回归平方和之和。 正交多项式使用条件:自变量具有等间隔取值。

通用的正交多项式:可查表

正交多项式前 可以乘系数!

例:大麦氮肥施用量对产量影响试验,试 作分析。

回归关系及自变量作用检验:

剔除三次项再进行检验:

第十章 协方差分析

 

协方差分析: 是利用回归分析来消除自

变量对因变量 的影响,而后再对试验结果进行方差分 析。 是将回归分析和方差分析结合起来的一 种分析方法。并称Y为因变量,x为协变 量。

一、协方差的意义和功用

1、协方差的意义 对于一个具有N对(X,Y)的有限总体, 其定义为:

2、协方差分析的功用

其主要作用有: 数矫正y变数的处理平均数,提高试验精确度。

(1)、当x与y为因果关系时,可利用y依x的回归系 (2)、当x与y为相关关系时,可通过估计不同变异 来源的总体方差和协方差,作出相应的相关分析。

(3)、估计缺失数据,可以得到无偏的处理平方和。

二、单向分组资料的协方差分析

单向分组资料

总计

协方差分析步骤:

计算处理间、处理内的SSx、SSy 、 SP和 DF。 检验x和y是否存在直线回归关系。 检测矫正平均数间的差异显著性。 矫正平均数多重比较。

  

乘积和与自由度的分解:

乘积和:用SP表示

具体计算用下列公式:

例1:为研究A、B、C三种肥料对苹果的增产效果,选 取24株同龄苹果树,第一年记下各树产量(x,kg),第 二年施肥再记下产量(y,kg)。试分析三种肥料效果。 施用三种肥料的苹果产量

直接进行方差分析:???

s2

s2

解:1、计算SSx 、 SSy 、 SP和DF

x变量的平方和:

= SSTx x2 − ∑ (∑ x ) 2 nk

(∑ x ) 2 1 = SStx Tx2. − ∑ i nk n SSex SSTx − SStx =

y变量的平方和:

= SSTy y2 − ∑ (∑ y ) 2 nk (∑ y ) 2 nk

1 = SSty Ty2i . − ∑ n SSey SSTy − SSty =

x与y的乘积和:

= SPT

∑ x∑ y ∑ xy −

nk

1298 ×1455 = 47 × 54 + 58 × 66 +  53 × 66 − = 765.750 24 1 ∑ x∑ y = SPt ∑ Txi.Tyi. − nk n 407 × 467 + 476 × 494 + 415 × 494 1298 × 1455 = 86.625 − 8 24 SPe = SPT − SPt = 765.750 − 86.625 = 679.125

2、检验x和y是否存在直线回归关系:

计算误差项的回归系数,并对其回归关系进 行显著性检验。

(1)、计算误差项回归系数、回归平方和、离 回归平方和与相应的自由度:

误差项回归系数为:

SPe 679.125 = = b = 1.1515 SSe X 589.750

误差项回归平方和与自由度为:

2

( SPe) = = Ue SSe X dfe (U ) = 1

( 679.125)

2

= 782.045 589.750

误差项离回归平方和与自由度为:

( SPe) 2 Qe = e y − SS = 830.875 − 782.045 = 48.83 SSe X dfe ( Q ) = dfe − 1= k (n − 1) − 1= 20

(2)、检验误差项回归显著性(F检验法)

Ue / dfe (U ) 782.045 /1 = = F = 320.3 Qe / dfe ( Q ) 48.83 / 20

查F表,

F0.01=8.10, x和y存在极显著直线回归关系。

检验误差项回归显著性(t检验法)

= sy / x = sb Qe = dfe ( Q ) sy / x = SSe X 48.83 = 1.5625 20 1.5625 = 0.0643 589.750

b 1.1515 = = t = 17.91 sb 0.0643

查t表, t0.01=2.845,

x和y存在极显著直线回归关系。

3、检验

矫正平均数间的差异显著性:

矫正总平方和:

dfT(Q)

矫正y值处理间的平方和与自由度:

Qt = QT − Qe = 271.67 − 48.83 = 222.84 dft ( Q ) = dfT ( Q ) − dfe ( Q ) = 22 − 20 = 2 Qt / dft ( Q ) 111.42 = = = 45.63 F 2.442 Qe / dfe ( Q )

F0.01(2,20)=5.85, 差异极显著。

协方差分析表

矫正值(离回归部分)变异的分析

df df

s2

矫正组(肥料)间变异

4、处理平均数的矫正及其多重比较:

矫正平均数差数标准误:

则:

A与B比较:

查t表, t0.01=2.845, 差异极显著。

A与C比较:

查t表, t0.01=2.845, 差异显著。

B与C比较:

查t表, t0.01=2.845, 差异极显著。

三、两向分组资料的协方差分析

乘积和的分解:

例2:研究施肥对杂交水稻结实率的影响。试验 过程中发现颖花数(x, 万/m2)对结实率(y, %) 有明显回归关系,对其结果进行协方差分析。

原始资料的方差分析

s2

s2

解:1、乘积和与自由度的分解:

= SP T

∑ xijyij −

TxTy nk 105.6 × 1847 = −73.5986 28

= × 58 + 4.09 × 65 +  3.01× 71 − 4.59 = SPR

1 TxTy Tx. jTy . j − ∑ k nk 52.39 × 937 + 53.21× 910 105.6 × 1847 = − = −0.7907 14 28 1 TxTy SP Txi .Tyi . − = ∑ t n nk 8.91× 119 + 8.20 × 127 +  + 6.04 × 146 105.6 × 1847 = − = −66.3636 2 28 SPe =SP − SPR − SP =−73.5986 − ( −0.7907) − (−66.3636) =−6.4443 T t

平方和与乘积和的计算

2、检验x和y是否存在线性回归关系

( SPe) (−6.4443) Ue = = = 49.4046 0.8372 SSex

2 2

Qe = SSey − U e = 32.8597

3、检验矫正平均数间的差异显著性 资料的协方差分析

s2

说明施肥是通过影响颖花数而间接影响结实率的。

四、协方差分析的数学模型和基本假定 1、协方差分析的数学模型

yij = µ y + τ i + β ( xij − µ x ) + ε ij

yij = y + ti + b( xij − x) + eij

2、协方差分析的基本假定

 

X是固定的量,处理效应属于固定模型。 εij 是独立的(与处理效应无关),且 服从N(0 , δ2y/x) 。 各个处理的(x , y)总体都是线性的, 且具有共同的回归系数,因而各处理总 体的回归是一组平行的直线。

范文十:第9章协方差分析(修改) 投稿:卢驿骀

第九章 协方差分析

第一节 协方差分析的意义

协方差分析有二个意义 , 一是对试验进行统 计控制,二是对协方差组分进行估计,现分述 如下。 一、对试验进行统计控制 为了提高试验的精确性和准确性 ,对处理以 外的一切条件都需要采取有效措施严加控制, 使它们在各处理间尽量一致,这叫试验控制。 但在有些情况下,即使作出很大努力也难以使 试验控制达到预期目的。例如:研究几种激素 配合对番茄的增产效果,希望试验初始植株的 大小相同,因为番茄植株初始大小不同,将影 响到最终增产的效果。经研究

发现:增产与初始植株大小之间存在线性回归关 系。但是,在实际试验中很难满足试验植株初始 大小相同这一要求。 这时可利用植株的初始大小 (记为x)与其增产(记为y)的回归关系, 将番茄增产 都矫正为初始大小相同时的增产,于是植株初始 大小不同对增产的影响就消除了。由于矫正后的 增产是应用统计方法将初始大小控制一致而得到 的,故叫统计控制。统计控制是试验控制的一种 辅助手段。经过这种矫正,试验误差将减小,对 试验处理效估计更为准确。

若 y 的变异主要由x的不同造成(处理没有显著效 应),则各矫正后的 y  间将没有显著差异(但原y间 的差异可能是显著的)。若 y的变异除掉x不同的 影响外,尚存在不同处理的显著效应,则可期望 各 y  间将有显著差异 (但原y间差异可能是不显著 的)。此外,矫正后的 y 和原y的大小次序也常不 一致。所以,处理平均数的回归矫正和矫正平均 数的显著性检验,能够提高试验的准确性和精确 性,从而更真实地反映试验实际。这种将回归分 析与方差分析结合在一起,对试验数据进行分析 的方法,叫做协方差分析(analysis of covariance)。

二、估计协方差组分

 ( x  x )( y  y ) 称为x与y的平均的离均差的乘

n 1

积和,简称均积,记为MPxy,即

MPxy ( x  x )( y  y )   n 1

n 1

 xy 

(  x )(  y ) n

(9-1)

与 均 积 相 应 的 总 体参 数 叫 协 方 差 (covariance),记为COV(x,y),是两个变数的互 变异数。统计学证明了,均积MPxy是总体协方差 COV(x,y)的无偏估计量。

SP CO V   df

 ( x  x )( y  y )

n 1

均积与均方具有相似的形式,也有相似的性 质。在方差分析中,一个变量的总平方和与自 由度可按变异来源进行剖分,从而求得相应的 均方。 即:SST=SSt+SSe

统计学已证明:两个变量的总乘积和也可 按变异来源进行剖分而获得相应的均积,即: SPT=SPt+SPe 。这种把两个变量的总乘积和与 自由度按变异来源进行剖分并获得相应均积的 方法亦称为协方

差分析。得 到 不同变异来源的 协方差组分的估计值。有了这些估计值,就可 进行相应的总体相关分析。这些分析在遗传、 育种和生态、环保的研究上是很有用处的。

第二节 单因素试验资料的协方差分析

设有k个处理、n次重复的双变量试验资料, 每处理组内皆有n对观测值x、y,则该资料为

具kn对x、y观测值的单向分组资料,其数据一

般模式如表9-1所示。

表9-1 kn对观测值x、y的单向分组资料的 一般形式

表9-1的x和y变量的自由度和平方和的剖分参见单 因素试验资料的方差分析方法一节。其乘积和的剖分 则为:

总变异的乘积和SPT是xji与 x .. 和yji与 y.. 的离均差乘 积之和,即:

SPT    ( x ij  x ..)( y ij  y..)

i 1 j 1 k n

k

n

x.. y..    x ij y ij  kn i 1 j 1

df T =kn-1

(9-2)

其中,

x..   xi ., y..   y i .,

i 1 i 1

k

k

x ..  x..

kn y .. y..  kn

,

处理间的乘积和SPt是x i . 与x .. 和y i .与 y..的离均 差乘积之和乘以n,即:

1 SPt  n  ( x i .  x ..)( y i .  y ..)  n i 1

k

i 1

k

xi .yi . xi .yi .  kn

df t  k  1

(9-3)

处理内的乘积和SPe是 xij 与x i .和 yij与 y i . 的离均 差乘积之和,即:

k n

k n k n 1 k (9-4) x i .)( y ij  y i .)    x ij y ij   x iSP . ye SPT ( SP x ijt  x i .)( y i.  ij  y i .)    n i 1 i 1 j 1 i 1 j 1 i 1 j 

df e =k(n-1)

以上是各处理重复数n相等时的计算公式, 若各处理重复数n不相等,分别为n1、n2、…、 k nk,其和为  ni,则各项乘积和与自由度的计算 i 1 公式为: k ni xi . y i . SPT    x ij y ij  k i 1 j 1  ni

df T   n i  1

i 1 k

i 1

(9-5)

x k . y k . x.. y.. x1 . y1 . x 2 . y 2 . SPt    ...   k n1 n2 nk  ni

df t  k  1

SPe =SPT-SP x ij ty ij

i 1 j 1

i 1



k

ni

df e = ni -k =dfT-dft

i 1

k

(9-6)

有了上述SP和df,再加上x和y的相应SS,就 可进行协方差分析。 例:为了研究A、B、C 三种肥料对于苹果的增 产效果,选了24株同龄苹果树,第一年记下各 树的产量(x),第二年将每种肥料随机施于8株 苹果树上,再记下其产量(y),结果见下表

肥料 A B C x y X Y X y 47 54 52 54 44 52 58 66 53 53 48 58 53 63 64 67 46 54

观察值 46 51 58 62 50 61 49 56 59 62 59 70 56 66 61 63 57 64 54 61 63 64 58 69 44 50 66 69 53 66

对x和y分别进行方差分析,可得如下结果

变异 来源 肥料间 肥料内 DF SS 2 21 356.08 589.75 x 变数 MS 28.083 F SS y变数 MS F

178.04 6.34** 60.750 30.375 <1 830.87 39.565

总变异

23

945.83

891.62

推断可靠吗?

x和y是同一株苹果树上相邻两年的产量,第 一年是基础,第二年产量是在原基础上的发展,

两者具有

因果关系。分析结果表明,供试苹果

树的“基础生产力”(x)在未施肥料时是有极

显著差异的;而施用不同肥料后,表现出来的

却是肥料间差异不显著。须进行协方差分析,

以消除基础生产力不同对试验结果的影响,减

小试验误差,揭示出可能被掩盖的处理间差异

的显著性。

协方差分析

1、各变异来源的DF、SS、SP列于下表

变异来源 总变异 肥料间 DF 23 2 21 SSx 945.83 356.08 589.75 SSy 891.63 60.75 830.88 SP 765.75 86.63 679.13

肥料内

2、误差项回归关系的分析

分析的意义是要剔除处理间差异的影响,从 误差变异中找出苹果产量(y)与基础生产力(x)之 间是否存在线性回归关系。计算出误差项的回归 系数并对线性回归关系进行显著性检验,若显著 则说明两者间存在回归关系。这时就可应用线性 回归关系来校正y值以消去基础生产力(x)不同对 它的影响。然后根据校正后的y值来进行方差分 析。如线性回归关系不显著,则无需继续进行分 析。

回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和,离回 归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系 数:

SPe 679.125 be    1.1515 SS xe 589.750

be表示起始产量每增加1kg,则施肥后的产 量平均增加1.115 kg/株 。

(2)测验x与y之间是否有直线回归关系

--回归关系显著性检验

SPe ˆ )  sse ( y )  Q e (y  y SSe ( x )

2

2

(679.125)  830.875   48.83 589.750 df e  k (n  1)  1  21  1  20 sy / x Qe 48.83    1.5625 df e 20

2

回归关系显著性检验 SPe 679.125 be    1.1515 SS e ( x ) 589.750

sb  sy / x SS e ( x ) 1.5625   0.0643 589.750

t  b / sb  1.1515 / 0.0643=17.91

此t值对于v=20为极显著,表明苹果产量与 基础生产力间存在极显著的线性回归关系。 因此,可以利用线性回归关系来校正y,并 对校正后的y进行方差分析。

3、测验矫正y的 差异显著性 校正y的总平方和与自由度,即总离回归平

方和与自由度。

总离回归平方和

SPT2 (765.750) 2  891.625   271.67 QT  SS T ( y )  SS T ( x ) 945.833

总离回归自由度

df

' T=

df T ( y ) - df R ( y ) =23-1=22

3、测验矫正y的 差异显著性

校正y的误差项平方和与自由度,即误差离

回归平方和与自由度。

误差项离回归平方和

2 SP SP ' e e  44.83 SSQ  SS SSe (ey( )y )   85 .08  e eSS e ( y )  SS R ( e )  SS SS e( x) e ( x ) 误差项离回归自由度

2

6

df e' = df e ( y )-df e ( R )=21-1=20

上述回归自由度均为1,因仅有一个自变量x。

故矫正y的处理间的:

Q t ( x  x )  Q T ( x  x )  Q e ( x  x )  271.67  48.83  222.84

df t ( x  x )  df T ( x  x )

 df e ( x  x )  22  20  2

F Qt ( x  x ) df t ( x  x ) Qe ( x  x ) df e ( x  x ) 111.42 **   45.63 2.442

 ( df1  2, df 2  20)

表明对于校正后的苹果产量与不同肥料间存在 极显著的差异。故须进一步检验不同处理间的 差异显著性,即进行多重比较。

4、根据线性回归关系计算各处理校正的平均 产量

误差项的回归系数 b yx ( e )表示基础生产力对苹果

产量影响的性质和程度,且不包含处理间差异

的影响,于是可用 b yx ( e ) 根据平均基础生产力的

不同来校正每一处理的平均产量。校正平均产 量计算公式如下:

y i .  y i .  b yx ( e ) ( x i .  x ..)

公式中: y i . 为第i处理校正的苹果平均产量; y i . 为第i处理实际的苹果平均产量(见表9.8); x i . 为第i处理实际平均基础生产力(见表9.8); x .. 为全试验的平均数,

b yx ( e ) 为误差回归系数, b yx ( e ) =1.1515

将所需要的各数值代入上式中,即可计算出 各处理的校正平均产量。

肥料A:y A ( x  x )  58.375  1.515  (50.875  54.083)  62.06( kg )

肥料B:y B ( x  x )  61.750  1.1515  (59.500  54.083)  55.51( kg ) 肥料C:y C ( x  x )  61.750  1.1515  (51.875  54.083)  64.29( kg )

矫正后不但数值发生了变化,而且较之矫正前 数据的次序也发生了变化。

5、各处理校正y的多重比较 各处理校正y间的多重比较,即三种肥料效果 的比较。 检验两个处理校正平均数间的差异显著性, 可应用t检验法:

t

y i .  y j . S yi . y j .

   

S y .  y

i

j.

 2 ( x i .  x j .) 2    MS e n SS e ( x )  

y i .  y j . 为两个处理校正平均数间的差 式中, 异; S y .  y . 为两个处理校正平均数差数标准误;  为校正误差离回归均方; MS e n为各处理的重复数; x i .为处理i的x变量的平均数; x j .为处理j的x变量的平均数; SSe(x)为x变量的误差平方和

i j

例如,检验三种肥料与校正y平均产量间的

差异显著性:

三种肥料效应的差异显著性 肥料 C A B

y t( x x)

64.29 62.06

显著性

0.05 0.01

55.51

a b c

A A B

此肥料试验,如果没有第一年各树基础产量x的记录 和借助于协方差分析,等于报废。如今正是依赖于x 和相应的统计方法,才获得正确结论。因此正确的试 验设计、严格的试验控制和相应的统计方法,对于获 得正确的试验结论十分重要。

协方差分析步骤总结:

测验x和y是否存在直线回归关系

如不存在直线回归关系,直接作方差分析

测验矫正平均数间的差异显著性

如矫正平均数间差异显著,则算出各个矫正 平均数并进行多重比较,作出相应的统计推 断

第三

节 两向分组资料的协方差 分析

• 实际为单因素随机区组试验资料的协 方差分析。

• 总变异=处理变异+区组变异+误差 变异

• 资料格式

区组 处理 1 x11 2 x12 … … …… r x1r 处理总和 Txt Tx1. Tyt 处理均值

1

xt x1 x2

yt

y1 y2

y11

x21 y21

y12

x22 y22

……

…… ……

y1r

x2r y2r …… …… Tx2.

Ty1.

2

Ty2. …… …… ……

……

…… …… …… …… …… …… …… ……

……

k 区组 总和 Txr Tyr

xk1

yk1 Tx.1 Ty.1

xk2

yk2 Tx.2 Ty.2

……

…… …… ……

xkr

ykr Tx.r Ty.r

Txk.

Tyk. Tx Ty

xk

yk

x

• 第一步 整理资料:

• 计算 ①各区组总和Txr、Tyr

• ②各处理总和Txt、Tyt及其均值 xt 、 yt

③全试验总和Tx、Ty及其均值 x

• 第二步 计算各项SS、SP、df: • 划分式 SST=SSt+SSr+SSe • SPT=SPt+SPr+Spe • dfT=dft+dfr+dfe

变异来源 区 处 误 组 理 差

SSx SSxr SSxt SSxe

SSy SSyr SSyt SSye

SP SPr SPt SPe

df dfr dft dfe

总变异

处理+误差

SSxT

SSxt+SSxe

SSyT

SSyt+SSye

SPT

SPt+SPe

dfT

dft+dfe

例,P188 例9.17

nk 1

k = 14

n =2

SPT   xy  C xy  4.59  58 

m

 3.01  71  C xy   73.60

52.39  937  +  53.21  910     14

1 m SPR  k  ( xi  x )( yi  y )   (Ttx Tty )- C k 1 1 1 (105.6  1847)  0.79 28

处理

1 k 8.91  119   8.20  127 SPt   TtxTty  C xy   C xy   66.37 n 1 2

SPe=SPT-SPt -SPR = - 73.60 -(- 0.79) -(- 66.37)= - 6.44

dft=k-1=14-1=13 dfe=dfT-dft -dfR=13

字典词典创新意识作文创新意识作文【范文精选】创新意识作文【专家解析】借贷资本的利息借贷资本的利息【范文精选】借贷资本的利息【专家解析】红包祝福语格式红包祝福语格式【范文精选】红包祝福语格式【专家解析】