小学统计与概率知识点_范文大全

小学统计与概率知识点

【范文精选】小学统计与概率知识点

【范文大全】小学统计与概率知识点

【专家解析】小学统计与概率知识点

【优秀范文】小学统计与概率知识点

范文一:统计与概率知识点1 投稿:杜樆樇

统计与概率中考复习

考点一、统计学中的几个基本概念

1、总体:所有考察对象的______叫做总体。

2、个体:总体中___________________叫做个体。(考查方式 :________________________)

3、样本:从总体中所抽取的____________叫做总体的一个样本。

4、样本容量:样本中个体的_______叫做样本容量。

5、样本平均数:_______中所有个体的平均数叫做样本平均数。

6、总体平均数:________中所有个体的平均数叫做总体平均数,在统计中,通常用__________估计总体平均数。

例1. 为了了解某区九年级7000名学生的体重情况,从中抽查了500名学生的体重,就这个问题来说,下面说法正确的是( )

A. 7000名学生是总体 B. 每个学生是个体

D. 样本容量为500 C. 500名学生是所抽取的一个样本

例2.(2006年南安市)下列调查方式,你认为正确的是 ( )

A. 了解一批炮弹的杀伤半径,采用普查方式;

B. 了解南安市每天的流动人口数,采用抽查方式;

C. 要保证“神舟6号”载人飞船成功发射,对重要零部件采用抽查方式检查;

D. 了解南安市居民日平均用水量,采用普查方式.

例3:为了调查某年级学生的身高情况,对该年级指定100名学生进行身高测试,在这个问题中,总体是______________,个体是 ,样本是100名学生的身高,这种调查方式是__ ____

考点二、平均数 、众数、中位数

1、平均数:一般地,如果有n个数x1,x2,,xn,这n个数的平均数x=__________

2、加权平均数:如果n个数中,x1出现f1次,x2出现f2次,„,xk出现fk

次(这里f1f2fkn),那么,根据平均数的定义,这n个数的平均数x=_____________,其中________________叫做权。

3、众数:在一组数据中,_______________数据叫做这组数据的众数。

4、中位数:将一组数据按大小依次排列,把处在___________位置的一个数据(或_______________)叫做这组数据的中位数。

例3.(2006年海南省) 在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如下表:

这些运动员跳高成绩的中位数和众数分别是

A.1.65,1.70 B.1.70,1.65 C.1.70,1.70 D.3,5 例4.在学校组织的“喜迎奥运,知荣明耻,文明出行”的知识竞赛中,每班参加比赛的人数相同,成绩分为A,B,C,D四个等级,其中相应等级的得分依次记为100分,90分,80分,70分,学校将某年级的一班和二班的成绩整理并绘制成如下的统计图:

一班竞赛成绩统计图 二班竞赛成绩统计图

第23题图

请你根据以上提供的信息解答下列问题:(08年沈阳)

(1)此次竞赛中二班成绩在

C级以上(包括C级)的人数为 ;

(2)请你将表格补充完整:

(3)请从下列不同角度对这次竞赛成绩的结果进行分析:

①从平均数和中位数的角度来比较一班和二班的成绩;

②从平均数和众数的角度来比较一班和二班的成绩;

③从B级以上(包括B级)的人数的角度来比较一班和二班的成绩.

考点三、方差

1、方差的概念:在一组数据x1,x2,,xn,中,各数据与它们的平均数x的差的

2平方的平均数,叫做这组数据的方差。通常用“s”表示,即

s2=______________________________

2、标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即S=_________

考点四、频率分布的有关概念

①极差:____________的差

②频数:落在各个小组内的数据的个数

③频率:每一小组的_________________的比值叫做这一小组的频率。 考点五、确定事件和随机事件

1、确定事件

____________事件和_______________事件

2、不确定事件

例5.下列事件中是必然事件的是( )(2007年沈阳)

A.小婷上学一定坐公交车 B.买一张电影票,座位号正好是偶数

C.小红期末考试数学成绩一定得满D.将豆油滴入水中,豆油会浮在水面上 例6.下列说法错误的是( )(09年沈阳)

A.必然发生的事件发生的概率为1 B.不可能发生的事件发生的概率为0

C.不确定事件发生的概率为0 D.随机事件发生的概率介于0和1之间 考点七:会用扇形统计图、条形统计图、折线统计图表示数据.

例7.吸烟有害健康.你知道吗,被动吸烟夜大大危害着人类的健康.为此,联合国规定每年的5月31日为“世界无烟日”.为配合今年的“世界无烟日”宣传活动,小明和同学们在学校所在地区开展了以“我支持的戒烟方式”为主题的问卷调查活动,征求市民的意见,并将调查结果分析整理后,制成了统计图:(09年沈阳)

戒烟 戒烟 戒烟 戒烟

(1)求小明和同学们一共随机调查了多少人?

(2)根据以上信息,请你把统计图补充完整;

(3)如果该地区有2万人,那么请你根据以上调查结果,估计该地区大约

有多少人支持“强制戒烟”这种戒烟方式?

范文二:概率统计知识点 投稿:高蠂蠃

一. 随机事件和概率

考研数学知识点-概率统计

(4)全概公式 设事件1, B2,Λ , Bn 满足 1 °

B

1、概率的定义和性质

(1)概率的公理化定义

设 Ω 为样本空间, A 为事件,对每一个事件 A 都有P(Bi) > 0(i = 1,2,Λ , n) , 一

个实数 P(A),若满足下列三个条件:

1° 0≤P(A)≤1, 2° P(Ω) =1 2°

则有

B1, B2,Λ , Bn 两 两 互 不 相 容 ,

A ⊂ ΥBi

n

i=1

P(A) = P(B1)P(A | B1) + P(B2)P(A | B2) P(Bn)P(A | Bn)

3° 对于两两互不相容的事件 A1 , A2 ,…有

⎛ ∞ ⎞

P⎜⎜ Υ Ai ⎟⎟ P A

( i)

= ⎝ =

= i 1

i 1

常称为可列(完全)可加性。 则称 P(A)为事件 A 的概率。

(2)古典概型(等可能概型)

1° Ω = {ω1,ω2Λ ωn}, 2°

ω = P(ω ) = Λ P(ω ) = 1 。

P( )

1

2

n

n

设任一事件 A ,它是由ω1,ω2Λ ωm组成的,则有

P(A)= {(ω1) Υ (ω2) Υ ΛΥ (ωm)} = ω + Λ + ω

P (ω1) + P(2)

(

)

Pm

=m=A

所包含的基本事件数 n 基本事件总数

2、五大公式(加法、减法、乘法、全概、

贝叶斯)

(1)加法公式

P(A+B)=P(A)+P(B)-P(AB)

当 P(AB)=0 时,P(A+B)=P(A)+P(B)

+Λ +

此公式即为全概率公式。

(5)贝叶斯公式

设事件 B1 , B2 ,…, Bn 及 A 满足

1° B1 ,BP

(Bi) >0,i = 1,

2,…, n ,

A ⊂ Υn

Bi

2° i=1

P( A) > 0 ,

/ ) =n

/ )

P(B )P( A B

P(B A

i i ,i=1,2,…n。 i

/ ) P(B )P( A B

j=1 j j

此公式即为贝叶斯公式。

P(Bi

) , i = 1 ,2 ,…,n ),通常叫先验概率。

P(Bi

/ A) ,

( i = 1 , 2 ,…, n ),通常称为后验概率。如果

我们把

A 当作观察的“结果”,而 B1 ,B2 ,…, Bn 理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出 了“由果朔因”的推断。

3、事件的独立性和伯努利试验

(1)两个事件的独立性

P AB = P

B

(2)减法公式

P(A-B)=P(A)-P(AB)

当 B ⊂ A 时,P(A-B)=P(A)-P(B)

当 A=Ω时,P( B )=1- P(B)

(3)条件概率和乘法公式

定义 设 A、B 是两个事件,且 P(A)>0,

AB

为事件 则称

P( )

P A A 发生条件下,事件 B 发生的条件概率,记

( ) 为

P AB

P(B / A) = ( ) 。

P A ( )

条件概率是概率的一种,所有概率的性质都适合于条件 概 率。

1

设事件 A 、 B 满( ) 足

( A)P( ) ,则称事件 A 、 B 是相互独立的(这个性质不是想当然成立的)。

若事件 A 、 B 相互独立,且P

( A) > 0 ,则有

AB P B

P A = P( ) = ( A)P( ) = P B (B | ) A P A ( )

P( ) ( )

所以这与我们所理解的独立性是一致的。

若事件 A 、B 相互独立,则可得到 A 与 B 、A 与 B 、

A 与 B 也都相互独立。(证明)

由定义,我们可知必然事件 Ω 和不可能事件 Ø 与

何事件都相互独立。(证明)

同时,Ø 与任何事件都互斥。

(2)多个事件的独立性

设 ABC 是三个事件,如果满足两两独立的条件,

Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 称为随机变量 X 的分布函

数。 并且同时满足 P(ABC)=P(A)P(B)P(C)

a

P(a

那么 A、B、C 相互独立。 对于 n 个事件类似。 两两互斥→互相互斥。 两两独立→互相独立?

(b) − F ( ) 可以得到 X 落入区

间 (a,b] 的概率。也就是说,分布函数完整地描述了随机

变量 X 随机取值的统计规律性。

分布函数 F (x) 是一个普通的函数,它表示随机变量

(3)伯努利试验

定义 我们作了 n 次试验,且满足 落入区间(– ∞,x]内的概率。

每次试验只有两种可能结果, A 发生或 A 不发生;

F (x) 的图形是阶梯图形, x, x,Λ 是第一类间断 n 次试验是重复进行的,即 A 发生的概率每次均一

样;

每次试验是独立的,即每次试验 点,随机变量 X 在 xk处的概率就是 F (x) 在 xk处的跃 次试验 A 发生与否是互不影响的。 度。

这种试验称为伯努利概型,或称为 n 重伯努利试验。 分布函数具有如下性质:

1

2

用表 示 每 次 试 验 A 发 生 的 概 率 , 则 A 发 生 的 1° 0 ≤ F (x) ≤ 1, − ∞

p

1 − p = q , 用Pn(k ) 表 示 n 重 伯 努 利 试 验 中 A 出 现

2° F ( x) 是单调不减的函数,即 x1

k (0 ≤ k ≤ n) 次的概率,

F ( x1) ≤ F ( x2) ;

二. 随机变量及其分布

3° F (−∞) = lim F (x) = 0

x→−∞

1、随机变量的分布函数

(1)离散型随机变量的分布率

设离散型随机变量 X 的可能取值为 X(k=1,2,…)且取

k

k

k

k

F (+∞) = lim F ( x) = 1 ;

x→+∞

4° F (x + 0) = F x F (x) 是右连续的;

( ) ,即 5° P( X = x) = F

P(X=x)=p,k=1,2,…, (x) − F (x − 0) 。

则称上式为离散型随机变量 X 的概率分布或分布律。有 时也用分布列的形式给出: (3)连续型随机变量的密度函数

X x1, x2,Λ , xk,Λ

= | Λ p Λ P( X x

k) p1, p2, , k, 。

p

k

定义 设(x) 是随机变量 X 的分布函数,若存在非负函

F

显然分布律应满足下列条件: (1)

≥ 0 ,= 1,2,Λ ,

∞k

k

∑p=1

(2) k=1

(2)分布函数

P X = x = 。

对于非离散型随机变量,通常有

P(X = x) = 0 ,不可

数(x) ,对任意实数 x ,有

x

f

( ) = ∫−∞

)

F x f ( x dx ,

数或密度函数,简称概 (x) 是连续函 率密度。 f (x) 的图形是由上式可知,连续型随机变量的分布函数

数。

一条曲线, 所以, 称为密度(分布)曲线。

则称 X 为连续型随机变量。 f (x) 称为 X 的概率密度函

能用分布率表达。例如日光灯管的寿命 X , (

F

) 0

P(xX

1

x

=Px X =Px X =Px X

) ≤x) ( ≤x) (

2

2

2

1

2

1

2

1

所以我们考虑用 X 落在某个区间 (a,b] 内的概率表

1

密度函数具有下面 4 个性质: 示。

定义 设 X 为随机变量,F ( x) = ( ≤

P X x)

x 是任意实数,则函数 1° f ( x) ≥ 0 。

+∞

−∞

f

( x)dx = 1 。2

Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

F (+∞) =

f (x)dx = 1

的几何意义;在横轴上面、密度

X ~ B(n, p) 。

−+∞∞

曲线下面的全部面积等于 1。

如果一个函数(x) 满足 1°、2°,则它一定是某个随机变量

f

X

|

n

n

n 2

2

k

k

n k

n

C

−1

2 n

C

的密度函数。 3°

P( X = k ) q ,npq

x2

,

p q − Λ

, ,

n

p q − Λ

, , p

P(x

1

2

2

1

容易验证,满足离散型分布率的条件。 当 n = 1时,P( X 0.1 ,这就是(0-1)

x

1

= k ) = pq−k ,k =

k

1

4° 若 f (x) 在 x 处连续,F ′(x) = f (x) 。 则有

分布,所以(0-1)分布是二项分布的特例。 ③泊松分布

设随机变量 X 的分布律为

P(x

P( X = xk) = pk

它在连续型随机变量理论中所起的作用与 在离散型随机变量理论中所起的作用相类似。

E → ω , Ω →

A

( = k) = λke−λ , λ > 0 , k = 0,1,2Λ , P X k!

则 称 随 机 变 量 X 服 从 参 数 为 λ 的 泊 松 分 布 , 记 为

P( A), (古典概型,五大公式,独立性)

X (ω ) → ω ≤ →

=

X ( ) x

≤ x)

F (x) P ( X

X ~ π (λ ) 或者 P( λ )。

泊松分布为二项分布的极限分布(np=λ,n→∞)。 ④超几何分布

k

对于连续型随机变量 X ,虽然P( X = x) = 0 ,但事件 有

( X = x) 并非是不可能事件 Ø。

=

≤ (

+

x h

n

−k

=

=

P( X k)

N

P( X x) P x h) x )

随机变量 X 服从参数为 n,N,M 的超几何分布。

f ( x dx

P X = x ≥ , 故 得

) 0 ⑤几何分布 令 h → 0 , 则 右 端 为 零 , (

而 概 率

Ck

M − = C n N M

C

Λ

0,1,2 ,l , l = n

min(M , )

P( X = x) = 0 。

不可能事件(Ø)的概率为零,而概率为零的事件不一定是 P( X = k) = qk−1, k = p

不可能事件;同理,必然事件(Ω)的概率为 1,而概率为

1,2,3,Λ ,其中 p≥0,q=1-p。

1 的事件也不一定是必然事件。

随机变量 X 服从参数为 p 的几何分布。

2、常见分布

①0-1 分布 P(X=1)=p, P(X=0)=q

X 的值只落在[a,b]内,其密度函数(x) 在 [a,b]

f

=

②二项分布

在 n 重贝努里试验中,设事件 A 发生的概率为 p 。事件

⎧ ,

a≤x≤b

f ( x)

⎨⎩0, 其他,

k

A 发

生 的 次 数 是 随 机 变 量 , 设 为 X , 则 可 能 取 值 为

X

其中

0,1,2,Λ , n 。

k

k

n k

k=

则称随机变量 X 在[a,b]上服从均匀分布,记为 X~U(a, b)。

分布函数为

1 , b − a

P( X = k) = Pn(k) = C

n

p q −

, q = 1 − p,0

0,1,2,

, n ,则 称 随 机 变 量 X 服 从 参 数 为 n ,项 分 布 。 记 为

其 中

p 的 二 3

0, x

− , x a a≤x≤b −

b a

Edited by 杨凯钧 2005 年 10 月

( ) F x

∫−∞ ) = f (x dx =

x

1

2

考研数学知识点-概率统计

( ) =

1, x>b。

2πσ

−µ 2

x −

(t ) σ 2

−∞

F x

e

2

dt 。。

当 a≤x

µ = 0 、σ = 1时的正态分布称为标准正态分布,记

x

x

1

dx = 2

1

x1

X

x∫ 2 f (2

)

= ∫x

x1

2b−

− P(

x

1

a

b a 。

设随机变量 X 的密度函数为

λe −λx,

x ≥ 0 ,

f ( x0, x

其中 λ > 0 ,则称随机变量 X 服从参数为 λ 的指数分布。

X 的分布函数为

1 − e −λx,x ≥ 0 ,

F (x) =

0, x

记住几个积分:

+∞

+∞

∫ xe

−xdx

= 1,

∫ x2

e

−xdx

= 2,

0 0

+∞

∫ x

n

−1e−xdx

= (n − 1)!

α

+∞

−1 −

Γ(α +1) = α α

Γ(

) = ∫ xαex, 0

dx

Γ( )

⑧正态分布

设随机变量 X 的密度函数为

2

f x = 1 e −x

−µ , ( )

− ∞

其中µ

、 σ > 0 为常数,则称随机变量 X 服从参数为

参数 为 X ~ N

(0,其密度函数记为 ,1) x2

1 e − 2

ϕ( x) =, − ∞

分布函数为

1

xt

2

Φ

(x)

π ∫

。−

Φ(是不可求积函数,其函数值,

2

−∞e

2

dt

已编制成表可供查用。 φ(x)和 Φ(x)的性质如下:

1° φ(x)是偶函数,φ(x)=φ(-x); 2° 当 x=0 时,φ(x)=

1 为最大值;

1

3° Φ(-x)=1-Φ(x)且 Φ(0)=

2 。

如果 X ~ N (µ,σ X

2),则 µ~N (0,1) 。

所以我们可以通过变换将 F (x) 的计算转化为 Φ(x) 的计

算,而 Φ(x) 的值是可以通过查表得到的。

= Φ⎛ x2

− µ ⎞⎟ − Φ⎛ x1

µ ⎞

分位数的定义

⎝ σ ⎠ ⎝ σ ⎠

3

随机变量 Y 是随机变量 X 的函数 Y = g ( X ) ,若 X 的分

布 函 数 X(x) 或 密 度 函 数 fX

(x) 知 道 , 则

如 何 求

µ 、 σ 的 正 态 分 布 或 高 斯 ( Gauss ) 分 布 ,

记 为

X ~ N (µ ,σ 2)。

f ( x) 具有如下性质:

1° f

(x) 的图形是关于x

= µ 对称的; 2° 当x= µ 时,

1

µ

2π 为最大值;

f ( ) =

σ

3° f

(x) 以 ox 轴为渐近线。

特别当 σ 固定、改变µ

时,f

(x) 的图形形状不变,只是集

体沿 ox 轴平行移动,所以µ

又称为位置参数。当µ

固定、

改变σ 时,f( x) 的图形形状要发生变化,随 σ 变大,f(x) 图形的形状变得平坦,所以又称σ 为形状参数。

X ~ N (µ ,σ 2)

,则 X 的分布函数为

4

Y = g( X ) 的分布函数 FY ( y) 或密度函数 fY

( y) 。

(1) X 是离散型随机变量 已知 X 的分布列为

Λ x Λ

X )

x1,

x2, ,= Λ ,

n,

P( X x

Λ

p i

p1, p2, ,

n,

显 然 ,

Y = g (X ) 的 取 值 只 可 能 是

Λ Λ g (xi) 互不相等,则 Y 的g(x1), g (x2), , g(xn), ,若

分布列如下:

Y g Λ

x Λ = ) (x1), g (x2), , g( n), , P(Y y p1, p2, Λ , pn, Λ i

考研数学知识点-概率统计

若有某些 g (xi) 相等,则应将对应的 Pi 相加作为 g( xi) 的概

其中 fX(x) > 0, fY( y) > 0 分别为 X,Y 的边缘分布密度。

率。

(2) X 是连续型随机变量

先利用 X 的概率密度 f(x)写出 Y 的分布函数 F(y),再利用

变上下限积分的求导公式求出 f(y)。

X

Y

Y

三.二维随机变量及其分布 1、二维随机变量的基本概念

(3)常见的二维分布

①均匀分布

设随机向量(X,Y)的分布密度函数

(1)二维连续型随机向量联合分布密度及边缘分布

对 于 二 维 随 机 向 量 ξ = ( X ,Y ) , 如 果 存 在 非 负 函 数

f ( x, y)(−∞

⎧ 1 ⎪S

f y = ⎪ ( x, ) ⎨

⎪ 0, ⎪ ⎩

D

(x, y ) D

其他

2⎤

边 分 别 平 行 于 坐 标 轴 的 矩 形 区 域

D={(X,Y)|a

D , 即

其中 S为区域 D 的面积,则称(X,Y)服从 D 上的均匀

分布,记为(X,Y)~U(D)。

D

, ) ∈ D} = ∫∫ f (x, y)dxdy, P{( X Y

D

则称ξ 为连续型随机向量;并称 f(x,y)为ξ =(X,Y)的分

设随机向量(X,Y)的分布密度函数为

2

2

布密度或称为 X 和 Y 的联合分布密度。 分布密度 f(x,y)具有下面两个性质: (1) f(x,y)≥0;

+∞

1

f y = 2πσ σ 1− ρ 2 (x, ) 1 2

1

⎛ −µ1⎞ ⎢⎢

x

µ ⎛ −µ2⎞

−ρ(x−µ1)(2) ⎠⎟⎟

σ σ

1 2

⎥⎥ ⎦

−2(1−ρ2)⎣⎜⎜⎝

σ

1

y−+y

--32

6903⎜σ ⎜ ⎝

2

⎠⎟

,

(2)

∫ ∫

−∞

f

(x, y)dxdy = 1.

e

一般来说,当(X,Y)为连续型随机向量,并且其联合分布 其中 密度为 f(x,y),则 X 和 Y 的边缘分布密度为

+∞

+∞

µ σ > 0,σ 2 > µ2

1

, ,

1

0 |, ρ | 1,共 5 个参数,则称

(X,Y)服从二维正态分布,

µ µ σ 2

f

dx

记为(X,Y)~N( ,

1

2,

1

2

f x

= ∫ f y dy f y = ∫

X

( ) (x, ) , ( )

−∞

Y

−∞

, σ2,).

ρ

( x, y) .

注意:联合概率分布→边缘分布 (2)条件分布

当(X,Y)为离散型,并且其联合分布律为

由边缘密度的计算公式,可以推出二维正态分布的两个

边缘分布仍为正态分布,反推则错。

N µ σ 2

即 X~N1 , σ2),Y ~ ( 2, 2 ).

1

µ

在已知 X=xi 的条件下,Y 取值的条件分布为

y= pP{(X ,Y ) = ( x, )}

j

ij

iΛ 1,2, ),

p

ij

(5)二维随机向量联合分布函数及其性质

设(X,Y)为二维随机变量,对于任意实数 x,y,二元函 数

=

P(Y y | X x )

j

i

, p•

i

F = ≤ (x, y) P{ X ≤ x Y y

, }

称为二维随机向量(X,Y)的分布函数,或称为随机变

量 X 和 Y 的联合分布函数。

分 布 函 数 是 一 个 以 全 平 面 为 其 定 义 域 , 其中 pi•, p•j 分别为 X,Y 的边缘分布。

当(X,Y)为连续型随机向量,并且其联合分布密度为 f(x,y),

则在已知 Y=y 的条件下,X 的条件分布密度为

f y ( x | ) = f y (x, )

f y Y

( )

在已知 X=x 的条件下,Y 的条件分布密度为

f y

(x, )

f x ( y | )

= f x X

( )

以 事 件

{(ω1

, ω2

) | −∞

(ω1

) , (ω2

) } 的概率为

函数值的一个实值函数。分布函数 F(x,y)具有以下的基 本性质:

0 ≤ F (x, y) ≤ 1;

(1)

5 Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

(2)F(x,y)分别对 x 和 y 是非减的,即

当 x>x时,有 F(x,y)≥F(x,y);当 y>y时,有 F(x,y) ≥ F(x,y);

(3)F(x,y)分别对 x 和 y 是右连续的,即

2

1

2

1

2

1

2

1

(4) E(XY)=E(X) E(Y),充分条件:X 和 Y 独立; 充要条件:X 和 Y 不相关。

(5) Y=g(X)

n

F ( x, y) = F (x + 0, y), F( x, y) = F (x, y + 0);

4

( ) = ∑

离散: E Y i=1 g( x) p

k

k

+∞

F −∞ = F )

=

) ( ) = ∫

xf (x dx 连续: E X

−∞ +∞

(−∞, (−∞, y ) F (x,−∞) = 0, F (+∞,+∞) = 1.

2、随机变量的独立性

(1)连续型随机变量

f(x,y)=f(x)f(y)

联合分布→边缘分布→f(x,y)=f(x)f(y)

X

Y

X

Y

) ( ) = ∫

g( x) f ( x dx E Y

−∞

(2

D(X)=E[X-E(X)]2,方差

σ ( X ) = D X

直接判断,充要条件: ①可分离变量

②正概率密度区间为矩形

①离散型随机变量

k

( ) ,标准差

2

)] ( ) = ∑[x−

E( X p D X

k

k

(2

⎡ 1 −

②连续型随机变量

2

⎛ −µ ⎞ µ

2ρ( x− )( ) ⎢ x

1 ⎟⎟

⎛ −µ ⎞ ⎥

2

2 ⎤

+∞

µ12

y−+y

f

(x, )

y = 2πσ σ 1 1− ρ 2 e

−ρ2 ⎢⎜⎜⎝

σ

1

σ σ

--116001 2

2

)

= ∫ − ( ) [ −∞

x E (X )]f (x dx ⎠, D X

2

⎟⎟ ⎥⎦

2(1 ) ⎣ ⎠

⎜6

⎜σ ⎝

③方差的性质

(1) D(C)=0;E(C)=C

ρ=0 (3)随机变量函数的独立性 若 X 与 Y 独立,h,g 为连续函数,则:h(X)和 g(Y独立。

四. 随机变量的数字特征

(1)一维随机变量及其函数的期望

1

2

①设 X 是离散型随机变量,其分布律为 k=1,2,…,n,

P( X = xk)=pk

期望就是平均值。

k=1

2E[(X-E(X))(Y-E(Y))],无条件成立。

E(X+Y)=E(X)+E(Y),无条件成立。

(3)常见分布的数学期望和方差

分布 名称 0-1 分布 符号 均值 p

方差

②设 X 是连续型随机变量,其概率密度为 f(x),

B(1, p)

p(1 − p)

+∞

( ) = ∫ ) E X xf ( x dx

③数学期望的性质−∞

(1) E(C)=C

(2) E(CX)=CE(X)

(3) E(X+Y)=E(X)+E(Y),∑

n

n

E (

∑ C( ) i

Xi

) =

C E X

i=1

i=1

i

i

6 二项

分布 B(n, p)

泊松 分布

P(λ)

几何

G( p)

分布

np

np(1 − p)

λ

λ

1 1 − p

2

p

p

Edited by 杨凯钧 2005 年 10 月

对于随机变量 X 与 Y,称它们的二阶混合中心矩 µ11为 2 σ 2

①0-1 分布

X

1 q

p

E(X)=p,D(X)=pq

k

n k

②二项分布 X~B(n,p),P (k ) = C p q − ,(k=0,1,2…n) E(X)=np,D(X)=npq

n

n

③泊松分布 P(λ)

P(X=k)=

λke−x ,k=0,1,2…

k!

E(X)= λ, D(X)= λ

k

Cn

k

④超几何分布

C = ) =

M

− Pk

N M

Cn

E(X)=

nM N

N

⑤几何分布 P ( X = k ) = pqk1 ,k=0,1,2…

1 q

E(X)= , D(X)=2

⑥均匀分布 X~U[a,b],f(x)=

X

与 Y 的协方差或相关矩,记为σXY或 cov(X , Y ) ,即

σ

= µ = E X − E X Y − E Y

XY

11[(

( ))( ( ))]. 与记号 σXY相对应,X 与 Y 的方差 D(X)与 D(Y)也

可分别记为σXX与σYY。

协方差有下面几个性质:

(i) (ii) cov(aX,bY)=ab cov(X,Y);

(iii) cov(X1

+X2

, Y)=cov(X1

,Y)+cov(X2

,Y); (iv) cov(X,Y)=E(XY)-(E(X))(E(Y)).

对于随机变量 X 与 Y,如果 D(X)>0, D(Y)>0,则称σXY

D( X ) D(Y )

为 X 与 Y 的相关系数,记作 ρXY(有时可简记为

ρ )。

| ρ |≤1,当| ρ |=1 时,称 X 与 Y 安全相关:

⎧正相关,当

ρ = 1时,

完全相关 ⎨负相关,当ρ = −1时, ⎩

而当 ρ = 0 时,称 X 与 Y 不相关。

与相关系数有关的几个重要结论

1

b − a

(i) ,[a, b ]

E(X)=

a + b − a)2

2

, (bD(X)=

12

⑦指数分布 f(x)=

λe−λx ,(x>0)

1

1

, D(X)= λ2

E(X)= λ

若随机变量 X 与 Y 相互独立,则

ρXY

= 0 ;

反之不真。

(ii)

若(X,Y)~N( µ1, µ2,σ12,σ22,ρ ),则 X

与 Y 相互独立的充要条件是 ρ = 0 ,即 X 和 Y

不相关。

(iii)

以下五个命题是等价的:

① ρXY= 0 ; ②cov(X,Y)=0;

7

Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y);

⑤D(X-Y)=D(X)+D(Y).

P( X − µ ≥ ε )

的一种估计,它在理论上有重要意义。

(2)二维随机变量函数的期望

∑∑G

i

j +∞

Y = ⎪⎪

E[G( X , )] ⎨ +∞

X Y

(x, y) p ( , )

ij , 为离散型;

i

j

2、大数定律

(1)切比雪夫大数定律 y dxdy X Y

(要求方差有界) ( , )

⎪⎪ ∫ ∫ G(x, y) f , 为连续型。

(x,

- -∞

)

设随机变量 X,X,…被

同一常数 C 所界:D(Xi)

2

(3)原点矩和中心矩

⎛1 lim P

n→∞

n

1

i

n

()

i

X− ∑ X ⎜⎜

⎝ n i 1

1

①对于正整数 k,称随机变量 X 的 k 次幂的数学期望为 X 的 k 阶原点矩,记为 v,即

u=E(X), k=1,2, ….

k

k

k

=

n i 2

特殊情形:若 XX,具有相同的数学期望 E(X)

=μ,则上式成为

I

于是,我们有

k

⎛1

x p

i

i

n

∑ X−

i

X lim P n

⎜⎜

µ ε ⎟⎟ = 1.

=

1

⎪⎪ i

k

当 为离散型时,

n→∞

⎝ ⎠

u= ⎨

⎪ +∞ x

k

⎪ −∞

数学

dx p( x) ,

.

当X为连 续型时

或者简写成:

lim

n→∞

( )= 1.

P X −

②对于正整数 k,称随机变量 X 与 E(X)差的 k 次幂的

期望为 X 的 k 阶中心矩,记为 µk,即

k

切比雪夫大数定律指出,n 个相互独立,且具有有限

的相同的数学期望与方差的随机变量,当 n 很大时,它 们的算术平均以很大的概率接近它们的数学期望。 (2)伯努利大数定律

设μ是 n 次独立试验中事件 A 发生的次数,p 是事件

A ε,有

于是,我们有

µ =

k

⎧∑ ( x

⎪⎪i

i

− ( X )) , k = E( X E

k

Λ 1,2,

.

⎛ µp⎞

E( )) p

i

X

当 为离散型时,

lim P

ε

⎪ +∞

k

⎟⎟ = 1.

n→∞

⎝ n

⎪ −∞

dx −

( x E ( X ))p(x) ,

k

k

l

当X为连 续型时

.

伯努利大数定律说明,当试验次数 n 很大时,事件 A

发生的频率与概率有较大判别的可能性很小,即

③对于随机变量 X 与 Y,如E( XY) 存在,则称之为 X 果有

⎛ µp lim P

n →∞

ε ⎞

⎟⎟ = 0.

⎜⎜

n

与 Y 的 k+l 阶混合原点矩,记为 ukl,即

这就以严格的数学形式描述了频率的稳定性。

k

u = E X E Y − E Y

kl

[( ( X )) ( ( ))].

(3)辛钦大数定律

(不要求存在方差)

设 X,X,…,X,…是相互独立同分布的随机变量

序列,且 E(X)=μ,则对于任意的正数ε有

1

2

n

n

2

五. 大数定律和中心极限定理

1、切比雪夫不等式

设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ,

⎛ 1 lim P

n→∞

n

∑ X −

i

则对于任意正数ε,有下列切比雪夫不等式

µ ε ⎟⎟ = 1.

Edited by 杨凯钧 2005 年 10 月

P( X − µ ≥ ε ) ≤ σ 2

⎝⎜⎜

n i = 1

ε 2

切比雪夫不等式给出了在未知 X 对概

的分布的情况下,

8

考研数学知识点-概率统计

3、中心极限定理

1

2

1、总体、个体和样本

(1)列维-林德伯格定理 (1)总体与样本

设随机变量 X,X,…相互独立,服从同一分布,且具 总体 在数理统计中,常把被考察对象的某 有 相 同 的 数 学 期 望 和 方 差 : 一个(或多个)指标的全体称为总体(或母体);而把总

Xk= σ 2 ≠ 0(k = Λ

E( Xk) = µ , D( ) 1,2, ) ,则随机变量

n

kY = k=1

n

的分布函数 F

n(x), 有

⎧ n

− µ X n

2

=

⎪k =1 k

≤ ⎪= 1

lim F (x) lim ⎪ ⎪

xt

.

n→∞ n n→∞

P ⎨⎪ x ⎬⎪ σ

n ⎪

π

e 2 dt

−∞

2

或者简写X⎯

n→

⎯∞

N 成:

σ n

此定理也称为独立同分布的中心极限定理。

(2

设随机变量 X1

,…Xn

均为具有参数 n, p(0

t2

− ⎪ 1

X np

= lim ⎨ n

≤ x = x

e 2 dt.

P

n→∞

⎪− ⎪⎭

π

⎩ np(1 p)

2

4、二项定理和泊松定理

(1)二项定理 M

体中的每一个单元称为样品(或个体)。在以后的讨论

中,

我们总是把总体看成一个具有分布的随机变量(或随机 向量)。

(2)样本函数与统计量

1,2

,

Λ , 为总体的一个样本,称

设 x x

xn

ϕ = ϕ

1,2

,

Λ , xn

) (

x x

为样本函数,其中 ϕ 为一个连续函数。如果ϕ 中不包含

任何未知参数,则称ϕ 1,2,Λ , xn)为一个统计量。 ( x x

2、统计量

(1)常用统计量

n

样本均值

x = i

样本方差 ni

=1

1

n

S 2

2

− xi

x )

.

n 1 i=1

(与概率论中的方差定义不同)

1i

=

n

1

1 S =n−

xi

(

2

x) .

= 1

n

k

N → ∞ , → p n k

若当 时 N ( , 不变) ,则

− 样本 k 阶原点矩

M

, = Λ 1,2,

.

x k K n k −

C C

M

− → k k − n k

N → ∞ N M C P (1 ) ( ).

N

n

p

CN

可见,超几何分布的极限分布为二项分布。

(2)泊松定理

若当 n → ∞

np λ 0 ,则

时 ,

→ > λk

−λ

− p)n

−k →

e

k k

(1

(n → ∞).C P

n

k!

其中 k=0,1,2,…,n,…。

六. 数理统计的基本概念

k

n

i

= i 1

样本 k 阶中心矩

n

′ =

k

) , = Λ M

1(

x x

k

2,3,

.

ni

i

=1

( 二

n

2=

2

S *1

(

)

Xi

X 与概率论中的方差定义相同)

n i=1

(2)统计量的期望和方差

2

E( X ) =

µ ,

( ) = σ

, D X

9

n

Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

E(S2

) = σ 2 ,

2

E (S * )

=

σ 2 ,

1 n

n

2

=

− 2

其中

1

Xi

X )

,为二阶中心矩。

S

*(

ni

=1

3、三个抽样分布(χ2

、t、F 分布)

(1)χ2

分布

1,2

,

Λ , Xn

相互独立,且服从标准正态

设 n 个随机变量 X

n

W = ∑ Xi

2

i=1

的分布密度为

n

u n

1

− −

21

u 2

≥ 0,

u e

f u ( ) = ⎨2

Γ⎜⎛ n ⎞⎟

2 ⎪ ⎝ 2 ⎠

⎪0,

u

我们称随机变量 W 服从自由度为 n 的 κ 2 分布,记为W~

κ 2 (n),其中

n Γ⎜⎛ n

+∞

−1

⎝ =

−x

2 ⎟⎠ dx.

的概率密度为

−+

n 1

⎝ 2

⎠ ⎛+t2

f t = π ⎛2

( ) 1 n

(−∞

n Γ⎜

n⎝⎠

⎜⎜

⎟⎟⎟⎞

⎝ 2 ⎠

我们称随机变量 T 服从自由度为 n 的 t 分布,记为 T~ t(n)n (n>2)

注意两个结果:E(T)=0,D(T)=

n − 2

(3)F 分布

设 X ~ κ 2(1 ~ (2) ,且 X 与 Y 独立,可以证明:

X / n

F = Y / n 1 的概率密度函数为

2

⎧ Γ⎜⎛ n⎞ 1

+

n

⎪ ⎝ 2 2

⎟ ⎛ n ⎞n 1

n

⎞+

2

1 −1

⎛+n − nn 1

2

2

f ( y) = ⎪

⎜⎜ 1

⎟⎟ y 2

1

1

y ⎟⎟

,

⎜⎜

⎨ Γ⎛⎜

n

1

⎞⎟Γ⎛⎜

n

2

⎝ n2

⎞⎟ ⎝ n2

⎠ ⎝ 2 ⎠ ⎝ 2 ⎠

⎪⎪0,

我们称随机变量 F 服从第一个自由度为 n1

,第二个自由度为 n2

的 F 分布,记为 F~f(n1

, n2

).

正态分布 µ

µ

1−

=

− ,

所谓自由度是指独立正态随机变量的个数,它是随机变量分

α α

布中的一个重要参数。

κ 2 分布满足可加性:设

Yi− κ 2(ni),

k

Z

= ∑

Y κ 2

Λ + + + i=1

i

~

( nn 2

nk

). 1

注意两个结果:E(χ2

)=n,D(χ2

)=2n

(2)t 分布

设 X,Y 是两个相互独立的随机变量,且

X ~ N

n

(0,1), Y ~ κ 2(),

可以证明:函数

T =

X / Y n

t

n −t n 1−α()

( )

F

= α , 1 n = 1−α (n1

, )

2

F n α (n2

, )

1

4、正态总体下统计量的分布和性质

注意一个定理: X 与 S2独立。

1,2

,

Λ , xn

为来自正 态

(1)正态分布 设 x x

总体 N (µ,σ 2)的一个样本,则样本函数

udef

x − µ σ / n

~ N (0,1). (2)t-分布

1,2

,

Λ , xn

为来自正态总体 10

设 x x

Edited by 杨凯钧 2005 年 10 月

考研数学知识点-概率统计

N (µ ,σ 2)的一个样本,则样本函数

tdef

~ t (n − 1),

S / n

其中 t(n-1)表示自由度为 n-1 的 t 分布。

(3)κ 2 分布

1,2

,

Λ , xn

为 来 自 正 态 总 设 x x

体 N (µ ,σ 2)

n − S2

(

1)~κ 2(n − 1),

wdef

σ

2

其中κ 2(n − 1) 表示自由度为 n-1 的κ 2 分布。

1,2

,

Λ , xn

为 来 自 正 态 总 体

(4)F 分布 设 x x

N (µ ,σ 2)的一个样本,而

1,2

,

Λ , yn

为来自正态总体

y y

N (µ ,σ2

2)的一个样本,则样本函数

S2

/ σ 2

Fdef

1 1

~ F (n1

−1, n −1),

2

σ 2

2

其中

S2

2

/

n

n

1

2

S 1 1

2

2

2 2

i

∑ ( −

) ;

1

=

∑ x − x) ,

2

=

( −

n1

1i

=1

S

n2

1i

=1 yi

y

F (n1

− 1, n 2 −

1) 表示第一自由度为 n1

− 1 ,第二自由度为

θ

1

,θ2

,θm

, 即 vk

= vk

(θ1

,θ2

,Λ ,θm

)

。 又 设

1,2

,

Λ , xn

为总体 X 的 n 个样本值,其样本的 k 阶原 x x

点矩为

v∧

1

n

k

k =

∑ x i

(k =

m 1,2,Λ , ).

ni

=1

这样,我们按照“当参数等于其估计量时,总体矩等于 相应的样本矩”

⎧ ∧ ∧ ∧

θ θ

θ =

1

n⎪

v∑

1(1,2

,

Λ ,m

)

x ,

i

⎪⎪

n i=1

∧ ∧ ∧

⎪ θ θ

θ

=

1 n

2

v ( , ,Λ ,

) x ,

⎪2

1

2

m

n i=1

i

⎨⎪ ⎪

⎪Λ Λ Λ Λ Λ Λ Λ Λ Λ⎪

⎪v ∧ ∧ ∧ θ θ θ = 1 n x m . ( , ,Λ , ) ∑ ⎪ m 1 2

m

n=1 i i

由 上 面 的 m 个 方 程 中 , 解 出 的 m 个 未 知参 数

(θ1

,θ2

, Λ , θm

即为参数() θ1

,θ2

,θm

)的矩估计量。

(2)最大似然法

所谓最大似然法就是当我们用样本的函数值估计总 体参数时,应使得当参数取这些值时,所观测到的样本 出现的概率为最大。

当总体 X 为连续型随机变量时,设其分布密度为

f ( x;θ1

,θ2

,Λ ,θm

) ,其中 θ

θ

θm

1,,

2

Λ , 为未知参数。

12

,,

Λ , x为总体的一个

n

样本,称 又设 x x

n

n− 1的 F 分布。

2

n

L

七. 参数估计

(θ,θ,Λ ,

1

2

θ = ∏ f

)

m

i=1

(x;θ,θ,Λ ,

i

1

2

θ

)

m

1、点估计的两种方法

(1)矩法

所谓矩法就是利用样本各阶原点矩与相应的总体矩,来 建立估计量应满足的方程,从而求得未知参数估计量的方 法。

设总体 X 的分布中包含有未知数θ1,θ2,Λ ,θm,则其分 布函数可以表成 F (x;θ1,θ2,Λ ,θm). 显示它的 k 阶原点矩

k

k

为样本的似然函数,简记为 Ln.

当总体 X 为离型随机变量时,设其分布律为

P{X =

x} = p(x;θ,θ,Λ ,

1

2

θ

) ,则称

m

n

L(x, x,Λ , x;θ,θ,Λ , )

1

2

θ = ∏

m

i= 1

θ

p(x;θ,θ,Λ , )

i

1

2

n12

m

为样本的似然函数。

2

若 似 然 函 数 L(x1, x,Λ , xn;θ1,θ,Λ ,θm)

2

v= E (X)(k = m

1,2,Λ ,中 也 包 含 了 未 知 参 数 )

11

∧ ∧ ∧ ∧ ∧ ∧

θ θ θ θ θ θ

,,12 ,Λ , m 处取到最大值,则称 12 ,Λ , m 分别为

Edited by 杨凯钧 2005 年 10 月

1

2

考研数学知识点-概率统计

m

θ,θ,Λ ,θ的最大似然估计值,相应的统计量称为最大似 3、区间估计

∧ ∧

(1)置信区间和置信度

设总体 X 含有一个待估的未知参数θ 。如果我们从样本

θ θ θ

然估计量。我们把使 L达到最大的 1,2 ,Λ , m 分别作为 θ,θ,Λ ,θ

n

1

2

m

的估计量的方法称为最大似然估计法。

,,Λ , x x

1

2

,

x 出 发 , 找 出 两 个 统 计 量

n

由于 lnx Ln与 lnLn同时达到最大

θ1= θ1( x1, x,2,Λ , xn)

值。我们称

∂ ln L ∂

n

θ= θ(x, x,,Λ , x) (

2

2

1

2

n

)

= 0,i =

Λ 1,2, ,m

θ

1

2

1

2

iii

θ

1

2

1−α (0

θ =θ

为似然方程。由多元微分学可知,由似然方程可以求出

θ ≤ θ ≤ θ

P{

1

θ i=θ i(x, x,Λ , x)(i = 1,2,Λ , m)

n

− α } = 1 ,

量。

为θi的最大似然估计

2

容易看出,使得 Ln达到最大θ 也可以使这组样本值 的 i

出现的可能性最大。

那么称区间 [θ1,θ2] 为θ 的置信区间,1 − α 为该区间的 置信度(或置信水平)。

(2)单正态总体的期望和方差的区间估计

2、估计量的评选标准

(1)无偏性

,,Λ , x为 总 体 X ~ N (µ ,σ 2)的 一 个 样 设 x x

本,在置信度为1 − α 下,我们来确定 µ和σ 2 的置信区

1

2

n

,

设θ = θ ( x1, x,2,Λ , xn) 为求知参数θ 的估计量。若 E

间[θ1, θ2] 。具体步骤如下:

θ )=θ θ∧ 为θ 的无偏估计量。

(i)选择样本函数;

若总体 X 的均值 E(X)和方差 D(X)存在,则样本 (ii)由置信度1 − α ,查表找分位数;

均值 x 和样本方差 S2分别为 E(X)和 D(X)的无偏估(iii)导出置信区间 [θ1,θ2] 。 计, 下面分三种情况来讨论。 即 ①

E( x )=E(X), E(S2)=D(X)。

(2)有效性

(i)选择样本函数 设 方 差 σ 2

= σ2

0, 其 中 σ02 为 已 知

设θ 1θ 1x1, x,2, Λ , xn) 和θ 2θ 2x1, x,2,Λ , xn)

=(=(

数 。 我 们 知

是未知参数θ 的两个无偏估计量。若 D(θ 1

)

1

x = ∑ x是µ 的一个点估计,并且知道包含未知参数

n

i

n=1

i

θ 1 比θ 2 有效。

(3)一致性(相合性)

θ 是θ 的

一串估计

量,

如果对于任意的

正数 ε ,都有

µ 的样本函数。

x u−µ= /0

~ N n

(0,1).

n

lim P(|θ n − θ |> ε ) = 0,

n→∞

(ii) 查表找分位数

对于给定的置信度1 − α ,查正态分布分位数表,找出分 位数 λ ,使得

P(| u |≤ λ) = 1 − α 。

12

Edited by 杨凯钧 2005 年 10 月则θ 为θ 的一致估计量(或相合估计量)。 称 n

考研数学知识点-概率统计

λ

=

P

λ ⎟⎟− α

⎜⎜ − ≤x

1

.

σ2

/

n ⎠

(iii)导出置信区间 由不等式

− λ ≤(

x − µ

σ2

) n ≤ λ

推得

x

− λ σµ ≤ ≤ x + λ σ 0,

n

n

这就是说,随机区间

⎡ λ σ

⎢x

0,x + λ σ 0 ⎤ ⎥ ⎣

n ⎦

以1 − α 的概率包含 µ 。

② 未知方差,估计均值

(i1

,

,2

,Λ , xn

为总体 µ ,σ 2)的一个样本,由于 设 x x

σ 2 是未知的,不能再选取样本函数 u。这时可用样本方差

1n

2

S 2 − ∑ (

− )

=1 xi

x

来代替 σ 2 ,而选取样本函数

x − t = S / n ~ t(n − 1).

x − λ S

µ λ S ,

xn

n

这就是说,随机区间

S

⎢x − λ , x + λ

S ⎤ ⎥ ⎣

n

n ⎦

以1 − α 的概率包含

µ 。

③ 方差的区间估计 (i)选择样本函数

1

,

,2

,Λ , xn

为来自总体 N (µ,σ 2)的一个样本, 设 x x

1

n

我们知道 S 2

=

− ( xx)2i

− n 1i

=1

是σ 2 的一个点估计,并且知道包含未知参数σ 2 的样本 函数

− 2

ω = (n 1)

S ~κ 2(n − 1).

2

(ii)查表找分位数

对于给定的置信度1 − α ,查κ 2 分布分位数表,找出两个分位数

λ1

与λ2

,使得由于κ 2 分布不具有对称性,λ ≤ ω ≤ λ

− α P(1

2

于是有

.

⎛ n − 1)S2

P λ ≤ ≤ λ ⎟⎟ = − α

(ii)查表找分位数

对于给定的置信度1 − α ,查 t 分位数表,找出分位数 λ ,

⎜⎜

1

σ 2

2

⎠ 1

.

使得

P(| u |≤ λ ) = 1 − α 。

λ

µ λ

α

P

− ≤x

− ≤ ⎟⎟ = −

S n 1 . (iii)导出置信区间⎝ / ⎠

由不等式

(x − µ ) n

λ

− ≤

σ

≤ λ

2

推得

(iii)导出置信区间

(n − 1)S2

λ1≤

σ 2 ≤ λ2

由不等式

(n − 1)S2

(n −

2

1)S

λ2

σ

λ1

2

以1 − α 的概率包含σ 2 ,而随机区间

⎡ − − 1 ⎤

n 1SnS ⎢ λ,

λ

2

1

以1 − α 的概率包含σ 。

13

Edited by 杨凯钧 2005 年 10 月

范文三:统计与概率知识点 投稿:孔褛褜

考点1 . 统计的方法

普查与抽样调查:

1)普查:为一特定目的而对所有考察对象做的全面调查叫普查;

2)抽样调查: 为一特定目的而对部分考察对象做的调查叫抽样调查。 说明:

( 1)下列的情形常采用抽样调查: ① 当受客观条件限制,无法对所有个体进行普查时; ②当调查具有破坏性,不允许普查时。

( 2)抽样调查的要求:① 抽查的样本要有代表性;② 抽查的样本不能太少。 考点2 与统计有关的概念:

1)总体:所要考查的对象的全体叫总体;

2)样本:从总体中取出的一部分个体叫做这个总体的一个样本;样本中个体的数目叫做样本容量。使总体的每一个个体有同等的机会被选中,这样的样本称为简单随机样本;

3)个体:总体中每一个考查的对象叫做个体;

4)频数:统计时,每个对象出现的次数叫频数,频数之和等于总数;

5)频率:每个对象出现的次数与总次数的比值叫频率,频率之和等于1。 注意:考查对象不是笼统的某人某物,而是某人某物的某项数量指标。 考点3 统计图表:

1)扇形统计图是用圆代表总体,圆中各个扇形分别代表总体中不同部分的统计图,它可以直观地反映部分占总体的百分比大小,一般不表示具体的数量;

2)条形统计图能清楚地表示每个项目的具体数目及反映事物某一阶段属性的大小变化,复合条形图的描述对象是多组数据;

3)折形统计图可以反映数据的变化趋势;

4)频数分布表和频数分布直方图,能直观、清楚地反映数据在各个小范围内的分布情况。

说明:绘制频数分布直方图的一般步骤:①计算最大值与最小值的差;②决定组距与组数(当数据在100个以内时,一般取5~12组);③确定分点,常使分点比数据多一位小数,并且把第一组的起点稍微减小一点;④列频数分布表;⑤用横轴表示各分段数据,纵轴反映各分段数据的频数,小长方形的高表示频数,绘制频数分布直观图;

考点4 数据的代表:反映数据集中趋势的特征数

1)平均数:一组数据中所有数据之和再除以数据的个数称为这组数据的平均数; ①算术平均数:一般地,如果n个数x1,x2,,xn, 那么

1x(x1x2xn)叫做这n个数的平均数; n

②加权平均数:如果n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次(这里f1f2fkn),那么,根据平均数的定义,这n个数的平均数可以表示为xx1f1x2f2xkfk,这样求得的平均数叫做加权平均数,其中n

f1,f2,,fk叫做权。

2)中位数:将一组数据按照由小到大或由大到小的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数,就是这组数据的中位数;

3)众数:一组数据出现中出现次数最多的数据叫做这组数据的众数。 一组数据的众数可能不止一个。

注意:

1)确定中位数时,一定要注意先把整个数据按照大小顺序排列,再确定;

2) 当一组数据出现极端数据时用平均数往往不能正确反映这组数据的集中趋势,这是就应考虑用中位数或众数来考查。

3)平均数的简化计算:

当所给数据都在某一常数a的上下波动时,一般选用简化公式:

xx'a。

其中,常数a通常取接近这组数据平均数的较“整”的数,x'1x1a,

1x'2x2a,…,x'nxna。x'(x'1x'2x'n)是新数据的平均数(通n

常把x1,x2,,xn,叫做原数据,x'1,x'2,,x'n,叫做新数据)。

考点 5 数据的波动:反映数据波动大小的特征数

( 1)极差:一组数据中最大值与最小值的差,叫做这组数据的极差,它反映了一组数据波动范围的大小;.

(2) 方差:在一组数据x1,x2,,xn,中,各数据与它们的平均数x的差的平方的平均数,叫做这组数据的方差。通常用“s2”表示,即

1s2[(x1x)2(x2x)2(xnx)2] n

简化计算公式(Ⅰ):

21222s[(x1x2xn)nx] n2

2122xn)]x 也可写成s2[(x12x2n

此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方。 简化计算公式(Ⅱ):

21222s[(x'1x'2x'n)nx'] n2

当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据x'1x1a,

212222s[(x'x'x')]x' x'2x2a,…,x'nxna,那么,12nn

此公式的记忆方法是:方差等于新数据平方的平均数减去新数据平均数的平方。

新数据法:

原数据x1,x2,,xn,的方差与新数据x'1x1a,x'2x2a,…,

x'nxna的方差相等,也就是说,根据方差的基本公式,求得x'1,x'2,,x'n,的方差就等于原数据的方差。

(3)标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即

ss2

1[(x1x)2(x2x)2(xnx)2] n

考点6 利用样本估计总体及根据数据进行决策

1)利用样本的特征去估计总体的特征是推断统计的基本思想,要注意样本选取中个体要有足够的代表性.

(2)利用数据进行决策时,要全面、多角度地去分析已有数据,比较它们的代表性和波动大小,发现它们的变化规律和发展趋势,从而作出正确决策。 考点7 事件的分类:

(1)确定事件:在一定条件下,有些事件发生与否可以事先确定,这样的事件叫做确定事件,其中一定会发生的叫做必然事件,不一定会发生的叫做不可能事件;

(2)随机事件:在一定条件下,可能发生也可能不发生的事件称为随机事件; 考点8 概率的概念:

概率:在随机现象中,一个事件发生的可能性大小叫做这个事件的概率;必然事件发生的概率为1,不可能事件发生的概率为0,随机事件发生的概率介于0与1之间。

考点9 概率的计算:

( 1)试验法求概率: 一般地,在大量重复试验中,如果事件A发生的频率m/n会逐渐稳定在某个常数P附近,那么把这个常数P作为这一事件发生的概率的近似值,事件A的概率记作P(A)=m/n

说明:不能说频率等于概率,这两者的区别在于:频率是通过多次试验得到的数据,而概率是理论上事件发生的可能性;一个事件发生的频率接近于概率,必须有足够的大量重复试验,才可以用频率作为事件发生概率的估计值。 ( 2)列举法求概率:

①直接法:一般地,如果在一次试验中,有n种可能的结果,并且它的发生的可能性都相等,事件A包含其中的m种结果,那么事件A发生的概率为P

(A)=m/n

②列表法:当一次试验涉及两个因素,且可能出现的结果数目较多,可采用列表法列出所有可能的结果,再根据P(A)=m/n计算概率;

③画树状图:当一次试验涉及两个或两个以上因素时,可采用画树状图表示出所有可能的结果,再根据P(A)=m/n计算概率。 注意:利用列表法,画树状图求概率,实质上是求等可能性事件的概率,其前提是各种情况出现的可能性必须相等。

考点10 概率的应用:

( 1)用概率分析事件发生的可能性: 概率是表示一个事件发生的可能性大小的数,事件发生的可能性越大,它的概率越接近1,反之事件发生的可能性越小,它的概率越接近0;

(2)用概率设计游戏方案: 在设计游戏规则时要注意设计的方案要使双方获胜的概率相等;同时设计的方案要有科学性、实用性和可操作性等。 注意:游戏的公平性是通过概率来判断,在得分相等的前提下,如果对于参加游戏的每一个人获胜的概率相等则游戏公平,否则不公平;在概率不等的前提下,可将概率乘以相应得分,结果相等即公平,否则不公平。

(一)统计与概率的知识结构图

打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

范文四:统计、概率知识点 投稿:蒋騑騒

统计、概率

本次课学习目标:

1、简单随机抽样、系统抽样、分层抽样2、样本数字特征3、茎叶图、频率分布直方图4、回归直线

5、古典概型6、几何概型

一、统计

1:简单随机抽样

2:系统抽样

(1)系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模)

(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

3:分层抽样

分层的比例问题:抽样比=样本容量各层样本容量 个体容量各层个体容量

4:用样本的数字特征估计总体的数字特征

(1)样本均值:xx1x2xn n

2(2)样本标准差:ss(x1x)2(x2x)2(xnx)2

n

5:用样本的频率分布估计总体分布

(1)频率分布表与频率分布直方图

(2)频率分布折线图 :连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。

(3)总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精 细的信息。

(4)茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。

6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。设已经得到具有线性相关关系的一组数据:

所要求的回归直线方程为:ybxa,其中,

是待定的系数。

二、概 率

1:随机事件的概率及概率的意义

1

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件

nA出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)A为事件A出现的概率:n

对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,

把这个常数记作P(A),称为事件A的概率。

nA

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值n,

它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率

2:概率的基本性质

(1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1

(2)事件的包含、并事件、交事件、相等事件

(3)若A∩B为不可能事件,即A∩B=,那么称事件A与事件B互斥;

(4)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(5)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

(6)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:① 事件A发生且事件B不发生;②事件A不发生且事件B发生;③事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;④事件A发生B不发生;⑤事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3:基本事件

(1)基本事件:基本事件是在一次试验中所有可能发生的基本结果中的一个,它是试验中不能再分的最简单的随机事件。

(2)基本事件的特点:①任何两个基本事件是互斥的②任何事件(除不可能事件外)都可以表示成基本事件的和。

4:古典概型

(1)古典概型的条件:古典概型是一种特殊的数学模型,这种模型满足两个条件:

①试验结果的有限性和所有结果的等可能性。②所有基本事件必须是有限个。

(2)古典概型的解题步骤;

①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式p(A)A所包含的基本事件的个数 总的基本事件个数

5:几何概型

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:p(A)

构成事件A的区域长度(面积或体积); 试验的全部结果所构成的区域长度(面积或体积)2

范文五:概率统计知识点 投稿:方劰励

第一章 随机事件与概率

一、教学要求

1.理解随机事件的概念,了解随机试验、样本空间的概念,掌握事件之间的关系与运算. 2.了解概率的各种定义,掌握概率的基本性质并能运用这些性质进行概率计算.

3.理解条件概率的概念,掌握概率的乘法公式、全概率公式、贝叶斯公式,并能运用这些公式进行概率计算. 4.理解事件的独立性概念,掌握运用事件独立性进行概率计算.

5.掌握贝努里概型及其计算,能够将实际问题归结为贝努里概型,然后用二项概率计算有关事件的概率. 本章重点:随机事件的概率计算. 二、知识要点

1.随机试验与样本空间

具有下列三个特性的试验称为随机试验: (1) 试验可以在相同的条件下重复地进行; ·

(2) 每次试验的可能结果不止一个,但事先知道每次试验所有可能的结果; (3) 每次试验前不能确定哪一个结果会出现.

试验的所有可能结果所组成的集合为样本空间,用表示,其中的每一个结果用记作

e表示,e称为样本空间中的样本点,

{e}.

2.随机事件

在随机试验中,把一次试验中可能发生也可能不发生、而在大量重复试验中却呈现某 种规律性的事情称为随机事件(简称事件).通常把必然事件(记作)与不可能事件(记作看作特殊的随机事件.

3.**事件的关系及运算 (1) 包含:若事件

)

A发生,一定导致事件B发生,那么,称事件B包含事件A,记作AB(或BA). A与B相互包含,即AB且BA,那么,称事件A与B相等,记作AB.

(2) 相等:若两事件

(3) 和事件:“事件A与事件B中至少有一个发生”这一事件称为A与B的和事件,记作

AB

;“n个事件

A1,A2,,An

中至少有一事件发生”这一事件称为

n

A1,A2,,An

的和,记作

A1A2An(简记为i1

A1,

Ai

).

(4) 积事件:“事件A与事件B同时发生”这一事件称为A与B的积事件,记作

AB(简记为AB);“n

个事件

A2,,An同时发生”这一事件称为A1,

n

A2,,An的积事件,记作A1A2An(简

AAAn或i1记为12

A1,A1,

A2,,

An

Ai

).

(5) 互不相容:若事件A和B不能同时发生,即

AB,那么称事件

A与B互不相容(或互斥),若n个事件

(1≤i

中任意两个事件不能同时发生,即

AiAj

A2,,An互不相容.

AB且AB,那么,称A与B是

(6) 对立事件:若事件A和B互不相容、且它们中必有一事件发生,即对立的.事件A的对立事件(或逆事件)记作

A.

AB(或AB) .

(7) 差事件:若事件A发生且事件B不发生,那么,称这个事件为事件A与B的差事件,记作

(8) 交换律:对任意两个事件A和B有

ABBA,ABBA.

(9) 结合律:对任意事件A,B,C有

A(BC)(AB)C, A(BC)(AB)C.

(10) 分配律:对任意事件A,B,C有

A(BC)(AB)(AC), A(BC)(AB)(AC).

(11) 德摩根(De Morgan)法则:对任意事件A和B有

ABAB, ABAB.

4.频率与概率的定义 (1) 频率的定义

设随机事件A在n次重复试验中发生了

nA次,则比值nA/n

称为随机事件A发生的频率,记作

fn(A),即

fn(A)

nAn

.

(2) 概率的统计定义

在进行大量重复试验中,随机事件A发生的频率具有稳定性,即当试验次数n很大时,频率

fn(A)在一个稳定的值

p(0

(3) **古典概率的定义

具有下列两个特征的随机试验的数学模型称为古典概型: (i) 试验的样本空间是个有限集,不妨记作

{e1,e2,,en};

ei (ii) 在每次试验中,每个样本点i(

1,2,,n)出现的概率相同,即

P({e1})P({e2})P({en}).

在古典概型中,规定事件A的概率为

P(A)

(4) 几何概率的定义

A中所含样本点的个数nA

中所含样本点的个数n

如果随机试验的样本空间是一个区域(可以是直线上的区间、平面或空间中的区域),且样本空间中每个试验结果的出现具有等可能性,那么规定事件A的概率为

P(A)

(5) 概率的公理化定义

A的长度(或面积、体积)

样本空间的的长度(或面积、体积)·

P(A)是实值函数,若满足下列三条公理:

设随机试验的样本空间为,随机事件A是的子集, 公理1 (非负性) 对于任一随机事件A,有 公理2 (规范性) 对于必然事件,有

P(A)≥0;

P()1;

公理3 (可列可加性) 对于两两互不相容的事件

A1,A2,,An,,有

P(Ai)P(Ai)

i1

i1



则称

P(A)为随机事件A的概率.

5.**概率的性质

由概率的三条公理可导出下面概率的一些重要性质 (1)

P()0.

(2) (有限可加性) 设n个事件

A1,A2,,An两两互不相容,则有

P(A1A2An)P(Ai)

i1n

(3) 对于任意一个事件A:

P(A)1P(A).

(4) 若事件A,B满足

AB,则有

P(BA)P(B)P(A),

P(A)P(B).

(5) 对于任意一个事件A,有

P(A)1.

P(AB)P(A)P(B)P(AB).

(6) (加法公式) 对于任意两个事件A,B,有

对于任意n个事件

n

A1,A2,,An,有

n

P(Ai)P(Ai)

i1

i1

1ijn

P(AiAj)

1ijkn

P(iAAA)(n11)jk

1

P(A

n

A)

.

6.**条件概率与乘法公式

设A与B是两个事件.在事件B发生的条件下事件A发生的概率称为条件概率,记作定

P(A|B).当P(B)0,规

P(A|B)

在同一条件下,条件概率具有概率的一切性质. 乘法公式:对于任意两个事件A与B,当

P(AB)

P(B).

P(A)0,P(B)0时,有

P(AB)P(A)P(B|A)P(B)P(A|B).

7.*随机事件的相互独立性 如果事件A与B满足

P(AB)P(A)P(B),

那么,称事件A与B相互独立.

关于事件A,月的独立性有下列两条性质: (1) 如果

P(A)0,那么,事件A与B相互独立的充分必要条件是P(B|A)P(B);如果P(B)0,那么,

事件A与B相互独立的充分必要条件是

P(A|B)P(A).

这条性质的直观意义是“事件A与B发生与否互不影响”. (2) 下列四个命题是等价的: (i) 事件A与B相互独立; (ii) 事件A与B相互独立; (iii) 事件 (iv) 事件

A与B相互独立; A与B相互独立.

对于任意n个事件事件

A1,A2,,An相互独立性定义如下:对任意一个k2,,n,任意的1i1ikn,若

A1,A2,,An总满足

P(Ai1Aik)P(Ai1)P(Aik),

则称事件

A1,A2,,An相互独立.这里实际上包含了2nn1个等式.

P(A)p(0p1),则在n

次重复独立试验中.,事件A恰发生k次

8.*贝努里概型与二项概率

设在每次试验中,随机事件A发生的概率的概率为

nk

Pn(k)p(1p)nk,k0,1,,n

k,

称这组概率为二项概率. 9.**全概率公式与贝叶斯公式

AA,A1,2,n 全概率公式:如果事件两两互不相容,且i1

P(Ak|B)

n

i

n

Ai

P(Ai)0,i1,2,,n,则

P(Ak)P(B|Ak)

,k1,2,,n

P(A)P(B|A)

i

i1

第二章 离散型随机变量及其分布

一、教学要求

1.理解离散型随机变量及其概率函数的概念并掌握其性质,掌握0-1分布、二项分布、泊松(Poisson)分布、均匀分布、几何分布及其应用.

2.理解二维离散型随机变量联合概率函数的概念及性质;会利用二维概率分布计算有关事件的概率. 3.理解二维离散型随机变量的边缘分布,了解二维随机变量的条件分布. 4.掌握离散型随机变量独立的条件.

5. 会求离散型随机变量及简单随机变量函数的概率分布. 本章重点:离散型随机变量的分布及其概率计算. 二、知识要点 1.一维随机变量

若对于随机试验的样本空间中的每个试验结果称

e,变量X

都有一个确定的实数值与

e相对应,即XX(e),则

X

是一个一维随机变量.

概率论主要研究随机变量的统计规律,也称这个统计规律为随机变量的分布. 2.**离散型随机变量及其概率函数 如果随机变量

X

仅可能取有限个或可列无限多个值,则称

X

为离散型随机变量.

设离散型随机变量

X

a(i的可能取值为i1,2,,n,),

piP(Xai),i1,2,,n,.

若i1

p

i

1

,则称

pi(i1,2,,n,)离散型随机变量X

的概率函数,概率函数也可用下列表格形式表示:

3.*概率函数的性质 (1)

pi0, i1,2,,n,;

(2) i1

p

i

1

由已知的概率函数可以算得概率

P(XS)pi

aiS

其中,S是实数轴上的一个集合. 4.*常用离散型随机变量的分布 (1) 0—1分布

B(1,p),它的概率函数为

P(Xi)pi(1p)1i,

其中,i

0或1,0p1.

B(n,p),它的概率函数为

(2) 二项分布

n

P(Xi)pi(1p)ni

i,

其中,

i0,1,2,,n,0p1.

P(),它的概率函数为

(4) 泊松分布

P(Xi)

其中,

i

i!

e

i0,1,2,,n,,0.

(5) 均匀分布,它的概率函数为

P(Xai)

其中,

5.二维随机变量

若对于试验的样本空间中的每个试验结果

1

n,

i0,1,2,,n.

(X,Y)都有确定的一对实数值与e相对应,XX(e),e,有序变量即

YY(e),则称(X,Y)为二维随机变量或二维随机向量.

6.*二维离散型随机变量及联合概率函数 如果二维随机变量

(X,Y)仅可能取有限个或可列无限个值,那么,称(X,Y)为二维离散型随机变量. (X,Y)的分布可用下列联合概率函数来表示:

二维离散型随机变量

P(Xai,Ybj)pij,i,j1,2,,

pij0,i,j1,2,,

其中,

p

i

j

ij

1

7.二维离散型随机变量的边缘概率函数 设

P(Xai)(i1,2,)(X,Y)为二维离散型随机变量,pij为其联合概率函数(i,j1,2,)

,称概率

X

的边缘概率函数,记为

为随机变量

pi并有

j

pi.P(Xai)pij,i1,2,

称概率

P(Ybj)(j1,2,)为随机变量Y的边缘概率函数,记为p.j,并有

p.j=

P(Ybj)pij,j1,2,

i

.

8.随机变量的相互独立性 . 设

(X,Y)为二维离散型随机变量,X

与Y相互独立的充分必要条件为

pijpipj,对一切i,j1,2,.

多维随机变量的相互独立性可类似定义.即多维离散型随机变量的独立性有与二维相应的结论. 9.随机变量函数的分布 设

X

是一个随机变量,

g(x)是一个已知函数,Yg(X)是随机变量X

的函数,它也是一个随机变量.对离散型

随机变量

X,下面来求这个新的随机变量Y的分布.

设离散型随机变量

X

的概率函数为

则随机变量函数

Yg(X)的概率函数可由下表求得

但要注意,若

g(ai)的值中有相等的,则应把那些相等的值分别合并,同时把对应的概率pi相加.

第三章 连续型随机变量及其分布

一、教学要求

1.理解连续型随机变量及其概率密度的概念,并掌握其性质,掌握均匀分布、指数分布、正态分布及其应用.

2.理解二维随机变量的联合分布的概念、性质以及连续型随机变量联合概率密度;会利用二维概率分布计算有关事件的概率.

3.理解二维随机变量的边缘分布,了解二维随机变量的条件分布. 4.理解随机变量的独立性概念,掌握连续型随机变量独立的条件.

5.掌握二维均匀分布;了解二维正态分布的密度函数,理解其中参数的概率意义.

(不考)6.会求两个独立随机变量的简单函数的分布,会求两个独立随机变量的简单函数的分布,会求两个随机变量之和的概率分布.

(不考)7.会求简单随机变量函数的概率分布.

本章重点:一维及二维随机变量的分布及其概率计算,边缘分布和独立性计算. 二、知识要点 1.*分布函数

随机变量的分布可以用其分布函数来表示,随机变量函数,记作

X

取值不大于实数

x的概率P(Xx)称为随机变量X

的分布

F(x), 即

F(x)P(Xx),x.

F(x)的性质

2.分布函数 (1) (2)

0F(x)1;

F(x)是非减函数,即当x1x2时,有F(x1)F(x2);

x

x

F(x)0,limF(x)1lim (3) ;

(4)

F(x)F(a)

F(x)是右连续函数,即limxa0.

X

的分布函数

由已知随机变量

F(x),可算得X

落在任意区间

(a,b]内的概率

P(aXb)F(b)F(a);

也可以求得

P(Xa)F(a)F(a0).

3.联合分布函数 二维随机变量

(X,Y)的联合分布函数规定为随机变量X

取值不大于

x实数的概率,同时随机变量Y

取值不大于实数

y的概率,并把联合分布函数记为F(x,y),即

F(x,y)P(Xx,Yy),x,y.

4.联合分布函数的性质 (1) (2)

0F(x,y)1;

F(x,y)是变量x(固定y)或y(固定x)的非减函数;

x

y

limF(x,y)0,limF(x,y)0

(3)

limF(x,y)0,limF(x,y)1

xy

xy

(4) (5)

F(x,y)是变量x(固定y)或y(固定x)的右连续函数;

P(x1Xx2,y1Yy2)F(x2,y2)F(x2,y1)F(x1,y2)F(x1,y1).

X

的分布函数为

5.**连续型随机变量及其概率密度 设随机变量

F(x),如果存在一个非负函数f(x),使得对于任一实数x,有

F(x)f(x)dx



x

成立,则称X为连续型随机变量,函数 6.**概率密度 (1)

f(x)称为连续型随机变量X

的概率密度.

f(x)及连续型随机变量的性质

f(x)0;

(2)



f(x)dx1

X

(3)连续型随机变量 (4)设 (5) 设

的分布函数为

F(x)是连续函数,且在F(x)的连续点处有F(x)f(x);

P(Xc)0;

X

为连续型随机变量,则对任意一个实数c,

f(x)是连续型随机变量X

b

的概率密度,则有

P(aXb)P(aXb)P(aXb)P(aXb)

=a

f(x)dx

7.**常用的连续型随机变量的分布 (1) 均匀分布

R(a,b),它的概率密度为

1

,axb;

f(x)ba

其余. 0,

其中,

ab).

E(),它的概率密度为

(2) 指数分布

ex,x0;f(x)

其余. 0,

其中,

0.

N(,2),它的概率密度为

(3) 正态分布

f(x)

其中,

(x)222

,x

,0,当0,1时,称N(0,1)为标准正态分布,它的概率密度为

f(x)

标准正态分布的分布函数记作

x22

,x

(x),即

(x

)

当出

(x)

x

dt,

t2

2

x0时,(x)可查表得到;当x0时,(x)可由下面性质得到

(x)1(x).

2

X~N(,),则有 设

F(x)(

x

)

P(aXb)(

b

)(

a

)

8.**二维连续型随机变量及联合概率密度 对于二维随机变量(X,Y)的分布函数有

F(x,y),f(x,y),(x,y)如果存在一个二元非负函数使得对于任意一对实数

F(x,y)

成立,则

9.二维连续型随机变量及联合概率密度的性质 (1)

x



y

f(s,t)dtds

(X,Y)为二维连续型随机变量,f(x,y)为二维连续型随机变量的联合概率密度.

f(x,y)0,x,y;

(2)









f(x,y)dxdy1

(3) 设 (4) 在

(X,Y)为二维连续型随机变量,则对任意一条平面曲线L,有P((X,Y)L)0; ’

f(x,y)的连续点处有

2F(x,y)

f(x,y)

xy;

(5) 设

(X,Y)为二维连续型随机变量,则对平面上任一区域D有

P((X,Y)D)f(x,y)dxdy

D

10,**二维连续型随机变量 设

(X,Y)的边缘概率密度

的边缘概率密度为

f(x,y)为二维连续型随机变量的联合概率密度,则X

fX(x)

Y

的边缘概率密度为





f(x,y)dy

fY(y)

11.常用的二维连续型随机变量 (1) 均匀分布





f(x,y)dx

如果

(X,Y)在二维平面上某个区域G上服从均匀分布,则它的联合概率密度为

1

,(x,y)G;

f(x,y)G的面积

0,其余. 

22

N(,,,,) 1212 (2) 二维正态分布

如果

(X,Y)的联合概率密度

f(x,y)

则称

(x1)2(x1)(y2)(x1)21

22222(1)1121

2(X,Y)~N(1,2,12,2,).

(X,Y)服从二维正态分布,并记为

2222

(X,Y)~N(,,,,)X~N(,)Y~N(,),即二维正态分布的边12121122 如果,则,

缘分布还是正态分布.

12.**随机变量的相互独立性 . 如果

X与Y的联合分布函数等于

X,Y

的边缘分布函数之积,即

F(x,y)FX(x)FY(y),对一切x,y,

那么,称随机变量 设

X与Y相互独立.

与Y相互独立的充分必要条件为

(X,Y)为二维连续型随机变量,则X

f(x,y)fX(x)fY(y),在一切连续点上.

如果

2(X,Y)~N(1,2,12,2,).那么,X

与Y相互独立的充分必要条件是

0.

多维随机变量的相互独立性可类似定义.即多维随机变量的联合分布函数等于每个随机变量的边缘分布函数之积,多维连续型随机变量的独立性有与二维相应的结论. 13.随机变量函数的分布 **一维随机变量函数的概率密度 设连续型随机变量

X

的概率密度为

fX(x),则随机变量Yg(X)的分布函数为

Iy

FY(y)P(Yy)P(g(X)y)P(XIy)

其中,

f

X

(x)dx

{XIy}与{g(X)y}是相等的随机事件,而Iy{x||g(x)y}是实数轴上的某个集合.随机变量Y

f(y)可由下式得到:

的概率密度Y

fY(y)FY'(y).

连续型随机变量函数有下面两条性质: (i) 设连续型随机变量的概率密度为

fX(x),Yg(X)是单调函数,且具有一阶连续导数,xh(y)是

yg(x)的反函数,则Yg(X)的概率密度为

fY(y)f(h(y))|h'(y)|.

(ii) 设

X~N(,),YkXb~N(kb,k),

则当k0时,有特别当

X

222

k

1

,b

YkXb~N(0,1),

时,有

特别有下面的结论:

~N(0,1)

22

X~N(,)Y~N(,11,22),且X设22

XY~N(,1212). 与Y相互独立,则

第四章 随机变量的数字特征

一、教学要求

1.理解随机变量的数学期望、方差的概念,并会运用它们的基本性质计算具体分布的期望、方差, 2.掌握二项分布、泊松分布、均匀分布、指数分布、正态分布的数学期望和方差. 3.会根据随机变量布计算其函数

X

的概率分布计算其函数

g(X)的数学期望E[g(X)];会根据随机变量(X,Y)的联合概率分

g(X,Y)的数学期望正E[g(X,Y)].

(不考)4.理解协方差、相关系数的概念,掌握它们的性质,并会利用这些性质进行计算,了解矩的概念。

本章重点:随机变量的期望。方差的计算. 二、知识要点 1.**数学期望 设

X

是离散型的随机变量,其概率函数为

P(Xai)pi,i1,2,,

如果级数i

ap

i

i

绝对收敛,则定义

X

的数学期望为

E(X)aipi

i

X

为连续型随机变量,其概率密度为

f(x),如果广义积分xf(x)dx绝对可积,则定义X



的数学期望为

E(X)xf(x)dx





2.*随机变量函数的数学期望 设

X

为离散型随机变量,其概率函数

P(Xai)pi,i1,2,,

如果级数i

g(a)p

i

i

绝对收敛,则

X

的函数

g(X)的数学期望为

i

E[g(X)]g(ai)pi

(X,Y)为二维离散型随机变量,其联合概率函数

P(Xai,Ybj)pij,i,j1,2,,

如果级数j



i

g(ai,bj)pij

绝对收敛,则

(X,Y)的函数g(X,Y)的数学期望为

E[g(X,Y)]g(ai,bj)pij

j

i

E(X)aipij;E(Y)bjpij

特别地

i

i

j

i

.

X

为连续型随机变量,其概率密度为

f(x),如果广义积分







g(x)f(x)dx

绝对收敛,则

X

的函数

g(X)

的数学期望为

E[g(X)]g(x)f(x)dx





(X,Y)为二维连续型随机变量,f(x,y),

其联合概率密度为如果广义积分

(X,Y)的函数g(X,Y)的数学期望为





g(x,y)f(x,y)dxdy

绝对收敛,则

E[g(x,y)]

特别地









g(x,y)f(x,y)dxdy

E(x)







xf(x,y)dxdy

,



E(Y)

3.**数学期望的性质 (1) (2) (3)







yf(x,y)dxdy

.

E(c)c (其中c为常数);

E(kXb)kE(X)b (k,b为常数); E(XY)E(X)E(Y);

X

与相互独立,则

(4) 如果

E(XY)E(X)E(Y).

4.**方差与标准差 随机变量

X

的方差定义为

D(X)E[XE(X)]2.

计算方差常用下列公式:

D(X)E(X2)[E(X)]2’

X

为离散型随机变量,其概率函数为

P(Xai)pi,i1,2,,

如果级数i

(aE(X))

i

2

pi

收敛,则

X

的方差为

D(X)(aiE(X))2pi

i

X

为连续型随机变量,其概率密度为

2

f(x),如果广义积分(xE(X))f(x)dx收敛,则X



的方差为

D(X)(xE(x))2f(x)dx





.

随机变量

X

的标准差定义为方差

D(X

) 5.**方差的性质 (1) (2)

D(c)0 (c是常数);

D(kX)k2D(X) (k为常数);

X

与Y独立,则

(3) 如果

D(XY)D(X)D(Y).

6.原点矩与中心矩 随机变量X 随机变量

k

E(X); k的阶原点矩定义为

X

的k阶中心矩定义为

E[(XE(X))k]];

kl

(X,Y)(k,l)E(XY);

随机变量的阶混合原点矩定义为

kl

(X,Y)(k,l)E[(XE(X))(YE(Y))].

随机变量的阶混合中心矩定义为

一阶原点矩是数学期望

E(X);

二阶中心矩是方差D(X);

(1,1)阶混合中心矩为协方差cov(X,Y).

X

7.**常用分布的数字特征 (1) 当

服从二项分布

B(n,p)时,

E(X)np,D(X)np(1p).

(2) 当

X

服从泊松分布

p()时,

E(X),D(X),

(3) 当

X

服从区间

(a,b)上均匀分布时,

ab(ba)2

E(X),D(X)

212

(4) 当

X

服从参数为

的指数分布时,

E(X)

1

,D(X)

1

2

(5) 当

X

服从正态分布

N(,2)时,

E(X),D(X)2.

(6) 当

22

(X,Y)服从二维正态分布N(1,2,1,2,)时,

E(X)1,D(X)12;

E(Y)2,D(Y)22;

cov(X,Y)12,XY

第五章 数理统计的基本概念

一、基本教学要求与主要内容 (一)教学要求

1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解

分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。

3.掌握正态总体的某些常用统计量的分布。 本章重点:统计量的概念及其分布。 (二)主要内容 1.总体、个体

我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体

密度函数。当 X服从正态分布 (1) (2) (3)

未知,但未知,但和

已知; 已知;

时,称总体X为正态总体。正态总体有以下三种类型:

均未知。

2.简单随机样本

数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为称为样本。n称为样本容量。 ( 如果样本( (1) (2) 则称(

)满足 相互独立;

服从相同的分布,即总体分布; )为简单随机样本。简称样本。

,则样本(

)的联合概率函数(联合密度函数为)

)称为样本观测值。

,这一过程称为抽样。由于抽样前无法,n维随机向量(

)

设总体X的概率函数(密度函数)为

3. 统计量 完全由样本确定的量,是样本的函数。 即:设

未知参数,则

是来自总体X的一个样本,

是一个n元函数,如果

中不含任何总体的

,则

为一个统计量,经过抽样后得到一组样本观测

为统计量观测值或统计量值。

4. **常用统计量

(1)样本均值:

1n

S(Xi)2n1i1

(2)样本方差:

n1

Sn2(Xi)2

ni1

2

观察值仍分别称为样本均值、样本方差

5. **三个重要分布 (1)设记为称满足:(2)t分布

设随机变量X与Y独立,

,则称

的点

分布的

分位点。

分布

为独立标准正态变量,称随机变量

的分布为自由度为n的

分布,

的分布为自由度n的t分布,记为称满足:(3)F分布

设随机变量U与V相互独立,

,则称

的点

。 为t分布的

分位点。

的分布为自由度称满足:

的F分布,记为

的点

。 为F分布的

分位点,且有

6. **正态总体的抽样分布 统计量的分布称为抽样分布,设的均值和样本方差,则有

是来自正态总体

的一个简单随机样本,

分别为样本

(1)(2)

与相S

2

1n

(Xi)2互独立; n1i1

(3)

n1

2

S22(n1)

学习要点

1,统计学的核心问题是由样本推断总体,因此理解统计量的概念非常重要。它是样本的函数,统计量的选择和运用在统计推断中占据核心地位。

2,样本均值、样本方差以及其他样本矩都是一些常用的统计量,必须熟悉它们的计算方法及其有关性质。 3,统计量的分布称为抽样分布,其中的查表方法;

4,正态总体抽样分布是统计学中最重要的一个理论结果,必须弄清它的条件及结论,并能运用判断一些常用统计量的分布。 第六章 参数估计 一、教学基本要求与主要内容 (一)教学基本要求 1.理解点估计的概念。

2.掌握矩估计法(一阶、二阶)和极大似然估计法。 3.了解估计量的评选标准(无偏性、有效性)。 4.理解区间估计的概念。

5.会求单个正态总体的均值和方差的置信区间。

不考6.会求两个正态总体的均值差和方差比的置信区间。

本章重点:未知参数的矩估计,极大似然估计及正态总体未知参数的区间估计。 (二)主要内容 1. **点估计方法 设则称

为参数

是来自总体X的样本,是总体的未知参数,若用一个统计量

的估计量,在抽样后,称

为参数

的估计值。这种估计称为点估计。

来估计

分布、t分布、F分布即是本章的重点,必须熟悉它们的定义、性质及其上

分位点

矩估计和最大似然估计是两种常用的点估计法。 (1)**矩估计法

用样本的各阶原点矩去估计对应的各阶总体的原点矩,这就是矩估计的基本方法。

\

nn11kkABVX, U(X)kkikkini1ni1

nn11kk(,,,)VX,U(,,,)(X)ik12mnk12mini1i1

(2)**最大似然估计法 设总体X的密度函

的观察值,则求

① 写出似然函数

(其

的最大似然估计值

为未知参数),已

的步骤如下:

为总体X的样

L()f(x1,x2,,xn,)f(xi,)

i1

n

② 似然函数取对数

lnL(x1,x2,,xn,)lnf(xi,)

i1

n

(3)建立并求似然方程

dlnL

0

d

(4)最大似然估计值可以由解对数似然方程得到。 2. 点估计的优良性评判准则 (1)无偏性 设

,对每一

则称(2)有效性 设

是有效。

无偏估计中,方差最小的那一个为一致最小方差无偏估计。 的两个无偏估计,如对每一

,有

且至少对某个

使之成立严格不等式,则称

的一个估计量,若

成立

的一个无偏估计。

称在所有的

3. **单正态总体下的置信区间

是取自正态总体

的一个样本,置信水平为

,样本均值

,样本方差

(1)均值

的置信区间

若已知,取,故的双侧置信区间为:

若未知,取,故的双侧置信区间为:

(2)方差

的置信区间

若已知,取,故的双侧置信区间为:

若未知,取,故的双侧置信区间为:

学习要点

1本章的要点是理解参数点估计的概念,掌握参数点估计的评判标准,会能实际应用。特别是要掌握矩估计法和最大似然估计法这二种点估计的常用方法,并能熟练地运用这二种点估计的常用方法去求参数的估计量.

2本章的另一要点是理解参数区间估计的概念和置信水平、置信区间的概念及其意义,熟悉对单正态总体的均值与方差和两正态总体的均值差进行区间估计的方法及步骤,并能熟练地运用以上方法求各种置信区间。

第七章 假设检验

一. 教学基本要求

1.理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率,并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。

2.理解单个及正态总体的均值和方差的假设检验。3.(不考)了解总体分布假设的 本章重点:单个正态总体的参数的假设检验。 二. 内容提要

1.假设检验的基本概念

假设检验是基于样本判定一个关于总体分布的理论假设是否成立的统计方法。方法的基本思想是当观察到的数据差异达到一定程度时,就会反映与总体理论假设的真实差异,从而拒绝理论假设。

原假设与备选假设是总体分布所处的两种状态的刻画,一般都是根据实际问题的需要以及相关的专业理论知识提出来的。通常,备选假设的设定反映了收集数据的目的。

检验统计量是统计检验的重要工具,其功能在用之于构造观察数据与期望数之间的差异程度。要求在原假设下分布是完全已知的或可以计算的。检验的名称是由使用什么统计量来命名的。

否定论证是假设检验的重要推理方法,其要旨在:先假定原假设成立,如果导致观察数据的表现与此假定矛盾,则否定原假设。通常使用的一个准则是小概率事件的实际推断原理。

2.两类错误概率。第一类错误概率即原假设成立,而错误地加以拒绝的概率;第二类错误概率即原假设不成立,而错误地接受它的概率。

3.显著水平检验。在收集数据之前假定一个准则,即文献上称之为拒绝域,一旦样本观察值落入拒绝域就拒绝原假设。若在原假设成立条件下,样本落入拒绝域的概率不超过事先设定的

,则称该拒绝域所代表的检验为显著水平

的检验,而称

拟合优度检验法。

显著水平。由定义可知,所谓显著水平检验就是控制第一类错误概率的检验。 4.**单正态总体均值和方差的检验(U检验,T检验和卡方检验) 我们以单正态总体均值U检验:

(1) 列出问题,即明确原假设和备选假设。先设

已知,检验

其中

已知。

,提出检验统计量U检验为例,即假定总体

(2) 基于的估计

~N(0,1)

(3) 对给定水平

Pu,/2构造水平

检验的拒绝域

Uu2

其中2为标准正态分布的

u双侧分位点。

(4) 基于数据,算出

的观察值,如

u则拒绝

,否则只能接受.

因此检验使用统计量U,称之为U-检验。

注意:单边检验的区别 H:=;H:

0010

Pu构造水平

H:=;H:

0010

检验的拒绝域U

u单侧分位数

Pu构造水平

T-检验。 当

未知时,改检验统计量U为T统计量

检验的拒绝域U

u单侧分位数

(1) 列出问题,即明确原假设和备选假设。先设未知,检验

其中未知。

,提出检验统计量T

(2) 基于的估计

~t(n1)

(3) 对给定水平

,P

t(n1)



构造水平检验的拒绝域

Tt(n1)

其中2为标准正态分布的

t双侧分位点。

T

t2(n1)则拒绝

,否则只能接受

.

(4) 基于数据,算出

T

的观察值,如

因此检验使用统计量T,称之为T-检验。

注意:单边检验的区别 H:=;H:

0010

Pt(n1)构造水平

H:=;H:

0010

检验的拒绝域T

t(n1)单侧分位数

Pt(n1)构造水平

检验的拒绝域T

t(n1)单侧分位数

2检验。

当未知时,单正态总体方差

的检验

(1) 列出问题,即明确原假设和备选假设。先设未知,检验

22

H0:20;H1:20;

其中未知。

(2) 基于的估计,提出检验统计量



2

(n1)S2

2

0

~2(n1)

(3) 对给定水平,

2P22(n1),P2(n1)

1

2222

构造水平检验的拒绝域

2

222(n1)或21n1)2(

其中

2

12(n1),2(n1)为标准正态分布的双侧分位点。

2

2的观察值,如2)或2122(n1)则拒绝2(n1

(4) 基于数据,算出,否则只能接受.

因此检验使用统计量2,称之为2-检验。 学习要点

1本章内容涉及概念及方法两大部分,要求理解和掌握假设检验的一些基本概念,如两类错误概率,否定论证原理,显著水平,弄清显著水平

检验的确切含义。

2掌握单正态总体检验的基本方法。

第八章 方差分析

检验假设H0

:12...r 找到F统计量

单因素试验方差分析表

方差来源 平方和 自由度 组间 组内 总和

简便计算公式:

均方和

MSA

SSA

dfA

F 值

F 值临介值

SSA

dfAdfE

dfT

F

MSAMSE

Fr1,nr

SSESST

MSE

SSEdfE

Ti2T2

SSA

ni1ni

rTi2

SSEX,SSTSSASSE

ni1j1i1i

r

2

ij

r

ni

TiXij,TTi

j1i1nir

dfAr1,dfEnr,dfTn1

第九章 回归分析

1.回归函数或回归方程的建立 y01x

Lxy1Lxx 10

1n1n

xi, yini1ni1

Lxy(xi)(yi)xiyi*i1

ni1nn

Lxx(xi)2xi22

i1

ni1nn

Lyy(yi)yi222

i1i1

2.回归方程的有效性检验F检验法

检验假设H0: 10, H1: 10, 找到F统计量 一元回归分析表

方差来源平方和 自由度回归

剩余

总和

简便计算公式: 均方和 MSRSSRdfRF 值 FMSRMSEF 值临介值 F1,n2SSRdfR1SSESSTdfEdfTMSESSEdfE

SSR1Lxy SSELyy-1Lxy, SSTSSASSELyy dfR1,dfEn2,dfTn1

3回归方程的点预测

ˆabx0即为 y 的点预测值。 xx0,y

范文六:统计与概率知识点 投稿:任菕菖

圆梦辅导中心 必修三 概率与统计知识点总结

第二章 统计

一、简单随机抽样 1.总体和样本

在统计学中 , 把研究对象的全体叫做总体. 把每个研究对象叫做个体. 把总体中个体的总数叫做总体容量.

为了研究总体的有关性质,一般从总体中随机抽取一部分:,

研究,

我们称它为样本.其中个体的个数称为样本容量.

2.简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 3.简单随机抽样常用的方法:

(1)抽签法;⑵随机数表法;⑶计算机模拟法 4.抽签法:

(1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签

(3)对样本中的每一个个体进行测量或调查 5.随机数表法:

例:利用随机数表在所在的班级中抽取10位同学参加某项活动。 二、系统抽样

1.系统抽样(也叫等距离抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体)/n(样本个数)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布有某种循环性规律,且这种循环和抽样距离重合。

2.系统抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。

三、分层抽样

1.分层抽样:先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样方法抽取样本。 2.分层抽样是把差异性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体。

分层标准:

(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间差异性强、突出总体内在结构的变量作为分层变量。 (3)以那些有明显分层区分的变量作为分层变量。 3.分层的比例问题:

(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 四、用样本的数字特征估计总体的数字特征

x

x1x2xn

1、样本均值:

n

s2

(x1x)2(x2x)2(xnx)2

s2、样本标准差:n(标准差是方差的算术平方根)

3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍, 五、两个变量的线性相关

1、概念:(1)回归直线方程 (2)回归系数 2.回归直线方程的应用

(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系

(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气

中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

4.在生活中应用直线回归的注意事项(不要求):

(1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图;

(3)回归直线不要外延。

第三章 概 率

一、随机事件的概率及概率的意义

1、基本概念:

(1)必然事件:在一定条件下,必然会发生的事件,叫做必然事件; (2)不可能事件:在一定条件下,一定不会发生的事件,叫做不可能事件; (3)确定事件:必然事件和不可能事件统称为确定事件;

(4)随机事件:在一定条件下可能发生也可能不发生的事件,叫做随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事

件A出现的频数;称事件A出现的比例fA

n(A)=

nn

为事件A出现的概率。对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,则把这个常数记作P(A),称为事件A的概率。 (6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值

nA

n

,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率 二、 概率的基本性质 1、基本概念:

(1)事件的包含、并事件、交事件、相等事件;

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,且A∪B为必然事件,那么称事件A与事件B互为对立事件;注意:对立事件一定是互斥

事件,但互斥事件不一定是对立事件!

(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,所

以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

2、概率的基本性质:

1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1; 2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);

4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件是互斥事件的特殊情形。

三、古典概型及随机数的产生

1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。 (2)古典概型的解题步骤; ①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式P(A)=

A包含的基本事件数

总的基本事件个数

四、几何概型及均匀随机数的产生 1、基本概念:

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型; (2)几何概型的概率公式: P(A)=

构成事件A的区域长度(面积或体积)

试验的全部结果所构成的区域长度(面积或体积)

(3)几何概型的特点:1)试验中所有可能出现的结果(基本事件)有无限多个;

2)每个基本事件出现的可能性相等.

范文七:统计与概率知识点 投稿:胡烲烳

统计与概率知识点

一:统计

1:简单随机抽样

(1)总体和样本

①在统计学中 , 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量. ④为了研究总体

的有关性质,一般从总体中随机抽取一部分:

样本.其中个体的个数称为样本容量.

(2)简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随

机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

(3)简单随机抽样常用的方法:

①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

(4)抽签法:

①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;

③对样本中的每一个个体进行测量或调查

(5)随机数表法:

2:系统抽样

(1)系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也

比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

3:分层抽样

(1)分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各,

, ,

研究,我们称它为

个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

①先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

②先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

(2)分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本

分别代表该子总体,所有的样本进而代表总体。

分层标准:

①以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

③以那些有明显分层区分的变量作为分层变量。

(3)分层的比例问题:抽样比=样本容量各层样本容量 个体容量各层个体容量

①按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 ②不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要

是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

(1)样本均值:xx1x2xn n

2(x1x)2(x2x)2(xnx)2

(2)样本标准差:ss n

用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

(3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。

(4)中位数:在样本数据中,累计频率为1.5时所对应的样本数据值(只有一个)。

注意:

①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变

②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍 ③一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用;

“去掉一个最高分,去掉一个最低分”中的科学道理

5:用样本的频率分布估计总体分布

1:频率分布表与频率分布直方图

频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。

具体步骤如下:

第一步:求极差,即计算最大值与最小值的差.

第二步:决定组距和组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,

以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.一般来说,容量不超过100的组数在5至12之间.组距应最好“取整”,它与极差有关. 组距

注意:组数的“取舍”不依据四舍五入,而是当极差极差不是整数时,组数=[]+1. 组距组距

②频率分布折线图 :连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。

③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精细的信

息。

2:茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。

例:例如:为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男

解:按照下列值的差

(1)求最大值与最小计.在上述数据中,最大值是76,最小值是55,极差是76-55=21.

(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为

2,组数为11.

(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为

了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是

[54.5,56.5),[56.5,58.5),„,[74.5,76.5).

频率分布直方如图2-2-3所示.

连接频率直方图中各小长方形上端的中点,就得到频率分布折线图.如图2-2-4所示.

例2:某赛季甲、乙两名篮球运动员每场比赛得分情况如下

甲的得分:15,21,25,31,36,39,31,45,36,48,24,50,37;

乙的得分:13,16,23,25,28,33,38,14,8,39,51.

上述的数据可以用下图来表示,中间数字表示得分的十位数,两边数字分别表示两个人各场比赛得分的个位数. 重0.0.0.0.0.0.0.甲 乙

08

513 6 4

4 5 13 5 8

7 6 9 1 6 13 8 9

8 54

01

图2-2-5

通常把这样的图叫做茎叶图.请根据上图对两名运动员的成绩进行比较.

从这个茎叶图上可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是25.因此甲运动员发挥比较稳定,总体得分情况比乙好.

用茎叶图表示有两个突出的优点:其一,从统计图上没有信息的损失,所有的信息都可以从这个茎叶图中得到;其二,茎叶图可以在比赛时随时记录,方便记录与表示.但茎叶图只能表示两位的整数,虽然可以表示两个人以上的比赛结果(或两个以上的记录),但没有两个记录表示得那么直观,清晰.

6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量

之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。 设已经得到具有线性相关关系的一组数据:

所要求的回归直线方程为:ybxa,其中,

是待定的系数。

(2)回归直线过的样本中心点(,)

二:概 率

1:随机事件的概率及概率的意义

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A

出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)nA为事件A出现的概率:对于n

给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。

nA

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值n,

它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率

2:概率的基本性质

(1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1

(2)事件的包含、并事件、交事件、相等事件

(3)若A∩B为不可能事件,即A∩B=,那么称事件A与事件B互斥;

(4)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(5)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

(6)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:① 事件A发生且事件B不发生;②事件A不发生且事件B发生;③事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;④事件A发生B不发生;⑤事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3:基本事件

(1)基本事件:基本事件是在一次试验中所有可能发生的基本结果中的一个,它是试验中不能再分的最简单的随机事件。

(2)基本事件的特点:①任何两个基本事件是互斥的②任何事件(除不可能事件外)都可以表示成基本事件的和。

4:古典概型:

(1)古典概型的条件:古典概型是一种特殊的数学模型,这种模型满足两个条件:

①试验结果的有限性和所有结果的等可能性。②所有基本事件必须是有限个。

(2)古典概型的解题步骤;

①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式p(A)

5:几何概型

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:p(A)构成事件A的区域长度(面积或体积); 试验的全部结果所构成的区域长度(面积或体积)A所包含的基本事件的个数 总的基本事件个数

(3)几何概型的特点:①试验中所有可能出现的结果(基本事件)有无限多个;②每个基本事件出现的可能性相等.

注意:几何概型也是一种概率模型,它与古典概型的区别是试验的可能结果不是有限个。其特点是在一

个区域内均匀分布,所以随机事件的概率大小与随机事件所在区域的形状位置无关,值域该区域的大小有关。如果随即事件所在区域是一个单点,由于单点的长度、面积、体积均为0,则它出现的概率为0,但它不是不可能事件;如果一个随机事件所在区域是全部区域扣除一个单点,则它出现的概率为1,但他不是必然事件。

综上可得:必然事件的概率为1;不可能事件的概率为0。

概率为1的事件不一定为必然事件;概率为0的事件不一定为不可能事件。

范文八:高中数学概率统计知识点总结概括 投稿:夏适逃

高中数学概率统计知识点总结概括

来源:未知 | 作者:admin | 本文已影响 4508 人

  一.算法,概率和统计

  1.算法初步(约12课时)

  (1)算法的含义、程序框图

  ①通过对解决具体问题过程与步骤的分析(如,二元一次方程组求解等问题),体会算法的思想,了解算法的含义。

  ②通过模仿、操作、探索,经历通过设计程序框图表达解决问题的过程。在具体问题的解决过程中(如,三元一次方程组求解等问题),理解程序框图的三种基本逻辑结构:顺序、条件分支、循环。

  (2)基本算法语句

  经历将具体问题的程序框图转化为程序语句的过程,理解几种基本算法语句--输入语句、输出语句、赋值语句、条件语句、循环语句,进一步体会算法的基本思想。

  (3)通过阅读中国古代数学中的算法案例,体会中国古代数学对世界数学发展的贡献。

  3.概率(约8课时)

  (1)在具体情境中,了解随机事件发生的不确定性和频率的稳定性,进一步了解概率的意义以及频率与概率的区别。

  (2)通过实例,了解两个互斥事件的概率加法公式。

  (3)通过实例,理解古典概型及其概率计算公式,会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。

  (4)了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义(参见例3)。

  (5)通过阅读材料,了解人类认识随机现象的过程。

  2.统计(约16课时)

  (1)随机抽样

  ①能从现实生活或其他学科中提出具有一定价值的统计问题。

  ②结合具体的实际问题情境,理解随机抽样的必要性和重要性。

  ③在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。

  ④能通过试验、查阅资料、设计调查问卷等方法收集数据。

  (2)用样本估计总体

  ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图(参见例1),体会他们各自的特点。

  ②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。

  ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。

  ④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会

样本频率分布和数字特征的随机性。

  ⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。

  ⑥形成对数据处理过程进行初步评价的意识。

  (3)变量的相关性

  ①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

  ②经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

  二.常用逻辑用语

  1。命题及其关系

  ①了解命题的逆命题、否命题与逆否命题。

  ②理解必要条件、充分条件与充要条件的意义,会分析四种命题的相互关系。

  (2)简单的逻辑联结词

  通过数学实例,了解 (5)了解圆锥曲线的简单应用。

  三.统计案例(约14课时)

  通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。

  ①通过对典型案例(如

范文九:第六部分《统计与概率》知识点 投稿:任妥妦

第六部分《统计与概率》知识要点

普查:总体与个体(研究对象中心词)两查抽样调查:样本与容量(无单位的数量)折线图(发展趋势与波动性横纵轴坐标单位长度要统一)三图条形图(纵坐标起点为零高度之比等于频数或频率之比)扇形图(知道各量的百分比可用加权平均数求平均值)算术平均数平均数参照平均数加权平均数三数众数(可能不止一个)中位数(排序、定位)

12(xx1)2(xx2)2(xxn)2方差:s统计与概率n(一组数据整体被扩大n倍,平均数扩大n倍,方差扩大n2倍);三差(一组数据整体被增加m,平均数增加m,方差不变)标准差:方差的算术平方根s极差:最大数与最小数之差(方差与标准差均衡量数据的波动性,方差越小波动越小) 必然事件:(概率为1)确定事件事件不可能事件:(概率为0)不确定事件:(概率在0与1之间)

频率:(试验值,多次试验后频率会接近理论概率)比例法(数量之比、面积之比等)两率概率:求法列表法(返回与不返回的两步实验求概率)树状图(返回与不返回的两步或两步以上的试验求概率)

范文十:高中统计与概率知识点 投稿:曾秾秿

高中统计与概率知识点(文科)

(一)统计

一、简单随机抽样

1.总体和样本

在统计学中 , 把研究对象的全体叫做总体.

把每个研究对象叫做个体.

把总体中个体的总数叫做总体容量.

为了研究总体的有关性质,一般从总体中随机抽取一部分:, , ,

研究,我们称它为样本.其中个体的个数称为样本容量.

2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随

机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:

(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:

(1)给调查对象群体中的每一个对象编号;

(2)准备抽签的工具,实施抽签

(3)对样本中的每一个个体进行测量或调查

例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:

例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

二、系统抽样

1.系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模) 前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布成某种循环性规律,且这种循环和抽样距离重合。

系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

三、分层抽样

1.分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

(1)先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

(2)先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:

(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

(3)以那些有明显分层区分的变量作为分层变量。

3.分层的比例问题:

(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

四、用样本的频率分布估计总体分布

1.频率分布直方图

①组距与分组:样本容量越大,分组越多,当样本容量不超过100时,一般可分成5~12组,组距力求“取整”。 ②直方图中小长方形的面积表示相应各组的频率,小长方形的面积之和为1。

③频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

2.茎叶图:茎是指中间的一列数,叶就是从茎的旁边生长出来的数,中间的数字表示得数的十位数,旁边的数字分别表示两个人得分的个位数.一般将各个数据的叶按大小次序写在茎的左右侧。

五、用样本的数字特征估计总体的数字特征

1.平均数:xx1x2xn

n

2.极差:一组数据中的最大值减去最小值的差,它反映了这组数据的偏离程度.

3.方差:(x1x)2(x2x)2(xnx)2

4.标准差:ss n,标准差越小越稳定.2

5.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

6.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变

(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍

(3)一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用;

“去掉一个最高分,去掉一个最低分”中的科学道理

7.如何从频率分布直方图估计样本的数字特征:

① 中位数:在直方图中,中位数左边和右边的直方图的面积应该相等。

② 平均数:在直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。

六、两个变量的线性相关

1、概念:

(1)回归直线方程:散点图中的点从整体上看分布在一条直线附近,这条直线叫回归直线.

(2)回归系数:直线方程y=kx+b,我们把直线方程记作:y=bx+a,其中,a,b叫做回归系数.b是直线的斜率,a是截距.

2.最小二乘法

3.直线回归方程的应用

(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系

(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,

即可得到个体Y值的容许区间。

(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到

了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

(二)概 率

随机事件的概率及概率的意义

1、基本概念:

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次

nA

试验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)=n为

事件A出现的概率:对于给定的随机事件A,如果随着试验次数的增加,事件A发生的

频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数

nA

n的比值n,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,

这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机

事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率。

3.1.3 概率的基本性质

1、基本概念:

(1)事件的包含、并事件、交事件、相等事件

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,

所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

2、概率的基本性质:

1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;

2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);

4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3.2.1 —3.2.2古典概型及随机数的产生

1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。

(2)古典概型的解题步骤;

①求出总的基本事件数;

A包含的基本事件数

②求出事件A所包含的基本事件数,然后利用公式P(A)=总的基本事件个数

3.3.1—3.3.2几何概型及均匀随机数的产生

1、基本概念:

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:

构成事件A的区域长度(面积或体积)

的区域长度(面积或体积)P(A)=试验的全部结果所构成;

(1) 几何概型的特点:

1)试验中所有可能出现的结果(基本事件)有无限多个;

2)每个基本事件出现的可能性相等.

站点地图