小学统计与概率知识点_范文大全

小学统计与概率知识点

【范文精选】小学统计与概率知识点

【范文大全】小学统计与概率知识点

【专家解析】小学统计与概率知识点

【优秀范文】小学统计与概率知识点

范文一:统计、概率知识点 投稿:蒋騑騒

统计、概率

本次课学习目标:

1、简单随机抽样、系统抽样、分层抽样2、样本数字特征3、茎叶图、频率分布直方图4、回归直线

5、古典概型6、几何概型

一、统计

1:简单随机抽样

2:系统抽样

(1)系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模)

(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

3:分层抽样

分层的比例问题:抽样比=样本容量各层样本容量 个体容量各层个体容量

4:用样本的数字特征估计总体的数字特征

(1)样本均值:xx1x2xn n

2(2)样本标准差:ss(x1x)2(x2x)2(xnx)2

n

5:用样本的频率分布估计总体分布

(1)频率分布表与频率分布直方图

(2)频率分布折线图 :连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。

(3)总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精 细的信息。

(4)茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。

6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。设已经得到具有线性相关关系的一组数据:

所要求的回归直线方程为:ybxa,其中,

是待定的系数。

二、概 率

1:随机事件的概率及概率的意义

1

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件

nA出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)A为事件A出现的概率:n

对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,

把这个常数记作P(A),称为事件A的概率。

nA

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值n,

它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率

2:概率的基本性质

(1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1

(2)事件的包含、并事件、交事件、相等事件

(3)若A∩B为不可能事件,即A∩B=,那么称事件A与事件B互斥;

(4)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(5)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

(6)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:① 事件A发生且事件B不发生;②事件A不发生且事件B发生;③事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;④事件A发生B不发生;⑤事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3:基本事件

(1)基本事件:基本事件是在一次试验中所有可能发生的基本结果中的一个,它是试验中不能再分的最简单的随机事件。

(2)基本事件的特点:①任何两个基本事件是互斥的②任何事件(除不可能事件外)都可以表示成基本事件的和。

4:古典概型

(1)古典概型的条件:古典概型是一种特殊的数学模型,这种模型满足两个条件:

①试验结果的有限性和所有结果的等可能性。②所有基本事件必须是有限个。

(2)古典概型的解题步骤;

①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式p(A)A所包含的基本事件的个数 总的基本事件个数

5:几何概型

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:p(A)

构成事件A的区域长度(面积或体积); 试验的全部结果所构成的区域长度(面积或体积)2

范文二:统计与概率知识点1 投稿:杜樆樇

统计与概率中考复习

考点一、统计学中的几个基本概念

1、总体:所有考察对象的______叫做总体。

2、个体:总体中___________________叫做个体。(考查方式 :________________________)

3、样本:从总体中所抽取的____________叫做总体的一个样本。

4、样本容量:样本中个体的_______叫做样本容量。

5、样本平均数:_______中所有个体的平均数叫做样本平均数。

6、总体平均数:________中所有个体的平均数叫做总体平均数,在统计中,通常用__________估计总体平均数。

例1. 为了了解某区九年级7000名学生的体重情况,从中抽查了500名学生的体重,就这个问题来说,下面说法正确的是( )

A. 7000名学生是总体 B. 每个学生是个体

D. 样本容量为500 C. 500名学生是所抽取的一个样本

例2.(2006年南安市)下列调查方式,你认为正确的是 ( )

A. 了解一批炮弹的杀伤半径,采用普查方式;

B. 了解南安市每天的流动人口数,采用抽查方式;

C. 要保证“神舟6号”载人飞船成功发射,对重要零部件采用抽查方式检查;

D. 了解南安市居民日平均用水量,采用普查方式.

例3:为了调查某年级学生的身高情况,对该年级指定100名学生进行身高测试,在这个问题中,总体是______________,个体是 ,样本是100名学生的身高,这种调查方式是__ ____

考点二、平均数 、众数、中位数

1、平均数:一般地,如果有n个数x1,x2,,xn,这n个数的平均数x=__________

2、加权平均数:如果n个数中,x1出现f1次,x2出现f2次,„,xk出现fk

次(这里f1f2fkn),那么,根据平均数的定义,这n个数的平均数x=_____________,其中________________叫做权。

3、众数:在一组数据中,_______________数据叫做这组数据的众数。

4、中位数:将一组数据按大小依次排列,把处在___________位置的一个数据(或_______________)叫做这组数据的中位数。

例3.(2006年海南省) 在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如下表:

这些运动员跳高成绩的中位数和众数分别是

A.1.65,1.70 B.1.70,1.65 C.1.70,1.70 D.3,5 例4.在学校组织的“喜迎奥运,知荣明耻,文明出行”的知识竞赛中,每班参加比赛的人数相同,成绩分为A,B,C,D四个等级,其中相应等级的得分依次记为100分,90分,80分,70分,学校将某年级的一班和二班的成绩整理并绘制成如下的统计图:

一班竞赛成绩统计图 二班竞赛成绩统计图

第23题图

请你根据以上提供的信息解答下列问题:(08年沈阳)

(1)此次竞赛中二班成绩在

C级以上(包括C级)的人数为 ;

(2)请你将表格补充完整:

(3)请从下列不同角度对这次竞赛成绩的结果进行分析:

①从平均数和中位数的角度来比较一班和二班的成绩;

②从平均数和众数的角度来比较一班和二班的成绩;

③从B级以上(包括B级)的人数的角度来比较一班和二班的成绩.

考点三、方差

1、方差的概念:在一组数据x1,x2,,xn,中,各数据与它们的平均数x的差的

2平方的平均数,叫做这组数据的方差。通常用“s”表示,即

s2=______________________________

2、标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即S=_________

考点四、频率分布的有关概念

①极差:____________的差

②频数:落在各个小组内的数据的个数

③频率:每一小组的_________________的比值叫做这一小组的频率。 考点五、确定事件和随机事件

1、确定事件

____________事件和_______________事件

2、不确定事件

例5.下列事件中是必然事件的是( )(2007年沈阳)

A.小婷上学一定坐公交车 B.买一张电影票,座位号正好是偶数

C.小红期末考试数学成绩一定得满D.将豆油滴入水中,豆油会浮在水面上 例6.下列说法错误的是( )(09年沈阳)

A.必然发生的事件发生的概率为1 B.不可能发生的事件发生的概率为0

C.不确定事件发生的概率为0 D.随机事件发生的概率介于0和1之间 考点七:会用扇形统计图、条形统计图、折线统计图表示数据.

例7.吸烟有害健康.你知道吗,被动吸烟夜大大危害着人类的健康.为此,联合国规定每年的5月31日为“世界无烟日”.为配合今年的“世界无烟日”宣传活动,小明和同学们在学校所在地区开展了以“我支持的戒烟方式”为主题的问卷调查活动,征求市民的意见,并将调查结果分析整理后,制成了统计图:(09年沈阳)

戒烟 戒烟 戒烟 戒烟

(1)求小明和同学们一共随机调查了多少人?

(2)根据以上信息,请你把统计图补充完整;

(3)如果该地区有2万人,那么请你根据以上调查结果,估计该地区大约

有多少人支持“强制戒烟”这种戒烟方式?

范文三:统计与概率知识点 投稿:任菕菖

圆梦辅导中心 必修三 概率与统计知识点总结

第二章 统计

一、简单随机抽样 1.总体和样本

在统计学中 , 把研究对象的全体叫做总体. 把每个研究对象叫做个体. 把总体中个体的总数叫做总体容量.

为了研究总体的有关性质,一般从总体中随机抽取一部分:,

研究,

我们称它为样本.其中个体的个数称为样本容量.

2.简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 3.简单随机抽样常用的方法:

(1)抽签法;⑵随机数表法;⑶计算机模拟法 4.抽签法:

(1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签

(3)对样本中的每一个个体进行测量或调查 5.随机数表法:

例:利用随机数表在所在的班级中抽取10位同学参加某项活动。 二、系统抽样

1.系统抽样(也叫等距离抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体)/n(样本个数)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布有某种循环性规律,且这种循环和抽样距离重合。

2.系统抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。

三、分层抽样

1.分层抽样:先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样方法抽取样本。 2.分层抽样是把差异性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体。

分层标准:

(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间差异性强、突出总体内在结构的变量作为分层变量。 (3)以那些有明显分层区分的变量作为分层变量。 3.分层的比例问题:

(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 四、用样本的数字特征估计总体的数字特征

x

x1x2xn

1、样本均值:

n

s2

(x1x)2(x2x)2(xnx)2

s2、样本标准差:n(标准差是方差的算术平方根)

3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍, 五、两个变量的线性相关

1、概念:(1)回归直线方程 (2)回归系数 2.回归直线方程的应用

(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系

(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气

中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

4.在生活中应用直线回归的注意事项(不要求):

(1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图;

(3)回归直线不要外延。

第三章 概 率

一、随机事件的概率及概率的意义

1、基本概念:

(1)必然事件:在一定条件下,必然会发生的事件,叫做必然事件; (2)不可能事件:在一定条件下,一定不会发生的事件,叫做不可能事件; (3)确定事件:必然事件和不可能事件统称为确定事件;

(4)随机事件:在一定条件下可能发生也可能不发生的事件,叫做随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事

件A出现的频数;称事件A出现的比例fA

n(A)=

nn

为事件A出现的概率。对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,则把这个常数记作P(A),称为事件A的概率。 (6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值

nA

n

,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率 二、 概率的基本性质 1、基本概念:

(1)事件的包含、并事件、交事件、相等事件;

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,且A∪B为必然事件,那么称事件A与事件B互为对立事件;注意:对立事件一定是互斥

事件,但互斥事件不一定是对立事件!

(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,所

以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

2、概率的基本性质:

1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1; 2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);

4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件是互斥事件的特殊情形。

三、古典概型及随机数的产生

1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。 (2)古典概型的解题步骤; ①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式P(A)=

A包含的基本事件数

总的基本事件个数

四、几何概型及均匀随机数的产生 1、基本概念:

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型; (2)几何概型的概率公式: P(A)=

构成事件A的区域长度(面积或体积)

试验的全部结果所构成的区域长度(面积或体积)

(3)几何概型的特点:1)试验中所有可能出现的结果(基本事件)有无限多个;

2)每个基本事件出现的可能性相等.

范文四:统计与概率知识点 投稿:胡烲烳

统计与概率知识点

一:统计

1:简单随机抽样

(1)总体和样本

①在统计学中 , 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量. ④为了研究总体

的有关性质,一般从总体中随机抽取一部分:

样本.其中个体的个数称为样本容量.

(2)简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随

机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

(3)简单随机抽样常用的方法:

①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

(4)抽签法:

①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;

③对样本中的每一个个体进行测量或调查

(5)随机数表法:

2:系统抽样

(1)系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也

比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

3:分层抽样

(1)分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各,

, ,

研究,我们称它为

个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

①先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

②先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

(2)分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本

分别代表该子总体,所有的样本进而代表总体。

分层标准:

①以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

③以那些有明显分层区分的变量作为分层变量。

(3)分层的比例问题:抽样比=样本容量各层样本容量 个体容量各层个体容量

①按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 ②不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要

是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

(1)样本均值:xx1x2xn n

2(x1x)2(x2x)2(xnx)2

(2)样本标准差:ss n

用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

(3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。

(4)中位数:在样本数据中,累计频率为1.5时所对应的样本数据值(只有一个)。

注意:

①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变

②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍 ③一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用;

“去掉一个最高分,去掉一个最低分”中的科学道理

5:用样本的频率分布估计总体分布

1:频率分布表与频率分布直方图

频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。

具体步骤如下:

第一步:求极差,即计算最大值与最小值的差.

第二步:决定组距和组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,

以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.一般来说,容量不超过100的组数在5至12之间.组距应最好“取整”,它与极差有关. 组距

注意:组数的“取舍”不依据四舍五入,而是当极差极差不是整数时,组数=[]+1. 组距组距

②频率分布折线图 :连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。

③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精细的信

息。

2:茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。

例:例如:为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男

解:按照下列值的差

(1)求最大值与最小计.在上述数据中,最大值是76,最小值是55,极差是76-55=21.

(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为

2,组数为11.

(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为

了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是

[54.5,56.5),[56.5,58.5),„,[74.5,76.5).

频率分布直方如图2-2-3所示.

连接频率直方图中各小长方形上端的中点,就得到频率分布折线图.如图2-2-4所示.

例2:某赛季甲、乙两名篮球运动员每场比赛得分情况如下

甲的得分:15,21,25,31,36,39,31,45,36,48,24,50,37;

乙的得分:13,16,23,25,28,33,38,14,8,39,51.

上述的数据可以用下图来表示,中间数字表示得分的十位数,两边数字分别表示两个人各场比赛得分的个位数. 重0.0.0.0.0.0.0.甲 乙

08

513 6 4

4 5 13 5 8

7 6 9 1 6 13 8 9

8 54

01

图2-2-5

通常把这样的图叫做茎叶图.请根据上图对两名运动员的成绩进行比较.

从这个茎叶图上可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是25.因此甲运动员发挥比较稳定,总体得分情况比乙好.

用茎叶图表示有两个突出的优点:其一,从统计图上没有信息的损失,所有的信息都可以从这个茎叶图中得到;其二,茎叶图可以在比赛时随时记录,方便记录与表示.但茎叶图只能表示两位的整数,虽然可以表示两个人以上的比赛结果(或两个以上的记录),但没有两个记录表示得那么直观,清晰.

6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量

之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。 设已经得到具有线性相关关系的一组数据:

所要求的回归直线方程为:ybxa,其中,

是待定的系数。

(2)回归直线过的样本中心点(,)

二:概 率

1:随机事件的概率及概率的意义

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A

出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)nA为事件A出现的概率:对于n

给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。

nA

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值n,

它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率

2:概率的基本性质

(1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1

(2)事件的包含、并事件、交事件、相等事件

(3)若A∩B为不可能事件,即A∩B=,那么称事件A与事件B互斥;

(4)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(5)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

(6)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:① 事件A发生且事件B不发生;②事件A不发生且事件B发生;③事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;④事件A发生B不发生;⑤事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3:基本事件

(1)基本事件:基本事件是在一次试验中所有可能发生的基本结果中的一个,它是试验中不能再分的最简单的随机事件。

(2)基本事件的特点:①任何两个基本事件是互斥的②任何事件(除不可能事件外)都可以表示成基本事件的和。

4:古典概型:

(1)古典概型的条件:古典概型是一种特殊的数学模型,这种模型满足两个条件:

①试验结果的有限性和所有结果的等可能性。②所有基本事件必须是有限个。

(2)古典概型的解题步骤;

①求出总的基本事件数;

②求出事件A所包含的基本事件数,然后利用公式p(A)

5:几何概型

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:p(A)构成事件A的区域长度(面积或体积); 试验的全部结果所构成的区域长度(面积或体积)A所包含的基本事件的个数 总的基本事件个数

(3)几何概型的特点:①试验中所有可能出现的结果(基本事件)有无限多个;②每个基本事件出现的可能性相等.

注意:几何概型也是一种概率模型,它与古典概型的区别是试验的可能结果不是有限个。其特点是在一

个区域内均匀分布,所以随机事件的概率大小与随机事件所在区域的形状位置无关,值域该区域的大小有关。如果随即事件所在区域是一个单点,由于单点的长度、面积、体积均为0,则它出现的概率为0,但它不是不可能事件;如果一个随机事件所在区域是全部区域扣除一个单点,则它出现的概率为1,但他不是必然事件。

综上可得:必然事件的概率为1;不可能事件的概率为0。

概率为1的事件不一定为必然事件;概率为0的事件不一定为不可能事件。

范文五:统计与概率知识点 投稿:孔褛褜

考点1 . 统计的方法

普查与抽样调查:

1)普查:为一特定目的而对所有考察对象做的全面调查叫普查;

2)抽样调查: 为一特定目的而对部分考察对象做的调查叫抽样调查。 说明:

( 1)下列的情形常采用抽样调查: ① 当受客观条件限制,无法对所有个体进行普查时; ②当调查具有破坏性,不允许普查时。

( 2)抽样调查的要求:① 抽查的样本要有代表性;② 抽查的样本不能太少。 考点2 与统计有关的概念:

1)总体:所要考查的对象的全体叫总体;

2)样本:从总体中取出的一部分个体叫做这个总体的一个样本;样本中个体的数目叫做样本容量。使总体的每一个个体有同等的机会被选中,这样的样本称为简单随机样本;

3)个体:总体中每一个考查的对象叫做个体;

4)频数:统计时,每个对象出现的次数叫频数,频数之和等于总数;

5)频率:每个对象出现的次数与总次数的比值叫频率,频率之和等于1。 注意:考查对象不是笼统的某人某物,而是某人某物的某项数量指标。 考点3 统计图表:

1)扇形统计图是用圆代表总体,圆中各个扇形分别代表总体中不同部分的统计图,它可以直观地反映部分占总体的百分比大小,一般不表示具体的数量;

2)条形统计图能清楚地表示每个项目的具体数目及反映事物某一阶段属性的大小变化,复合条形图的描述对象是多组数据;

3)折形统计图可以反映数据的变化趋势;

4)频数分布表和频数分布直方图,能直观、清楚地反映数据在各个小范围内的分布情况。

说明:绘制频数分布直方图的一般步骤:①计算最大值与最小值的差;②决定组距与组数(当数据在100个以内时,一般取5~12组);③确定分点,常使分点比数据多一位小数,并且把第一组的起点稍微减小一点;④列频数分布表;⑤用横轴表示各分段数据,纵轴反映各分段数据的频数,小长方形的高表示频数,绘制频数分布直观图;

考点4 数据的代表:反映数据集中趋势的特征数

1)平均数:一组数据中所有数据之和再除以数据的个数称为这组数据的平均数; ①算术平均数:一般地,如果n个数x1,x2,,xn, 那么

1x(x1x2xn)叫做这n个数的平均数; n

②加权平均数:如果n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次(这里f1f2fkn),那么,根据平均数的定义,这n个数的平均数可以表示为xx1f1x2f2xkfk,这样求得的平均数叫做加权平均数,其中n

f1,f2,,fk叫做权。

2)中位数:将一组数据按照由小到大或由大到小的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数,就是这组数据的中位数;

3)众数:一组数据出现中出现次数最多的数据叫做这组数据的众数。 一组数据的众数可能不止一个。

注意:

1)确定中位数时,一定要注意先把整个数据按照大小顺序排列,再确定;

2) 当一组数据出现极端数据时用平均数往往不能正确反映这组数据的集中趋势,这是就应考虑用中位数或众数来考查。

3)平均数的简化计算:

当所给数据都在某一常数a的上下波动时,一般选用简化公式:

xx'a。

其中,常数a通常取接近这组数据平均数的较“整”的数,x'1x1a,

1x'2x2a,…,x'nxna。x'(x'1x'2x'n)是新数据的平均数(通n

常把x1,x2,,xn,叫做原数据,x'1,x'2,,x'n,叫做新数据)。

考点 5 数据的波动:反映数据波动大小的特征数

( 1)极差:一组数据中最大值与最小值的差,叫做这组数据的极差,它反映了一组数据波动范围的大小;.

(2) 方差:在一组数据x1,x2,,xn,中,各数据与它们的平均数x的差的平方的平均数,叫做这组数据的方差。通常用“s2”表示,即

1s2[(x1x)2(x2x)2(xnx)2] n

简化计算公式(Ⅰ):

21222s[(x1x2xn)nx] n2

2122xn)]x 也可写成s2[(x12x2n

此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方。 简化计算公式(Ⅱ):

21222s[(x'1x'2x'n)nx'] n2

当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据x'1x1a,

212222s[(x'x'x')]x' x'2x2a,…,x'nxna,那么,12nn

此公式的记忆方法是:方差等于新数据平方的平均数减去新数据平均数的平方。

新数据法:

原数据x1,x2,,xn,的方差与新数据x'1x1a,x'2x2a,…,

x'nxna的方差相等,也就是说,根据方差的基本公式,求得x'1,x'2,,x'n,的方差就等于原数据的方差。

(3)标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即

ss2

1[(x1x)2(x2x)2(xnx)2] n

考点6 利用样本估计总体及根据数据进行决策

1)利用样本的特征去估计总体的特征是推断统计的基本思想,要注意样本选取中个体要有足够的代表性.

(2)利用数据进行决策时,要全面、多角度地去分析已有数据,比较它们的代表性和波动大小,发现它们的变化规律和发展趋势,从而作出正确决策。 考点7 事件的分类:

(1)确定事件:在一定条件下,有些事件发生与否可以事先确定,这样的事件叫做确定事件,其中一定会发生的叫做必然事件,不一定会发生的叫做不可能事件;

(2)随机事件:在一定条件下,可能发生也可能不发生的事件称为随机事件; 考点8 概率的概念:

概率:在随机现象中,一个事件发生的可能性大小叫做这个事件的概率;必然事件发生的概率为1,不可能事件发生的概率为0,随机事件发生的概率介于0与1之间。

考点9 概率的计算:

( 1)试验法求概率: 一般地,在大量重复试验中,如果事件A发生的频率m/n会逐渐稳定在某个常数P附近,那么把这个常数P作为这一事件发生的概率的近似值,事件A的概率记作P(A)=m/n

说明:不能说频率等于概率,这两者的区别在于:频率是通过多次试验得到的数据,而概率是理论上事件发生的可能性;一个事件发生的频率接近于概率,必须有足够的大量重复试验,才可以用频率作为事件发生概率的估计值。 ( 2)列举法求概率:

①直接法:一般地,如果在一次试验中,有n种可能的结果,并且它的发生的可能性都相等,事件A包含其中的m种结果,那么事件A发生的概率为P

(A)=m/n

②列表法:当一次试验涉及两个因素,且可能出现的结果数目较多,可采用列表法列出所有可能的结果,再根据P(A)=m/n计算概率;

③画树状图:当一次试验涉及两个或两个以上因素时,可采用画树状图表示出所有可能的结果,再根据P(A)=m/n计算概率。 注意:利用列表法,画树状图求概率,实质上是求等可能性事件的概率,其前提是各种情况出现的可能性必须相等。

考点10 概率的应用:

( 1)用概率分析事件发生的可能性: 概率是表示一个事件发生的可能性大小的数,事件发生的可能性越大,它的概率越接近1,反之事件发生的可能性越小,它的概率越接近0;

(2)用概率设计游戏方案: 在设计游戏规则时要注意设计的方案要使双方获胜的概率相等;同时设计的方案要有科学性、实用性和可操作性等。 注意:游戏的公平性是通过概率来判断,在得分相等的前提下,如果对于参加游戏的每一个人获胜的概率相等则游戏公平,否则不公平;在概率不等的前提下,可将概率乘以相应得分,结果相等即公平,否则不公平。

(一)统计与概率的知识结构图

打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

范文六:高中数学概率统计知识点总结概括 投稿:夏适逃

高中数学概率统计知识点总结概括
来源:未知 | 作者:admin | 本文已影响 4508 人

  一.算法,概率和统计
  1.算法初步(约12课时)
  (1)算法的含义、程序框图
  ①通过对解决具体问题过程与步骤的分析(如,二元一次方程组求解等问题),体会算法的思想,了解算法的含义。
  ②通过模仿、操作、探索,经历通过设计程序框图表达解决问题的过程。在具体问题的解决过程中(如,三元一次方程组求解等问题),理解程序框图的三种基本逻辑结构:顺序、条件分支、循环。
  (2)基本算法语句
  经历将具体问题的程序框图转化为程序语句的过程,理解几种基本算法语句--输入语句、输出语句、赋值语句、条件语句、循环语句,进一步体会算法的基本思想。
  (3)通过阅读中国古代数学中的算法案例,体会中国古代数学对世界数学发展的贡献。
  3.概率(约8课时)
  (1)在具体情境中,了解随机事件发生的不确定性和频率的稳定性,进一步了解概率的意义以及频率与概率的区别。
  (2)通过实例,了解两个互斥事件的概率加法公式。
  (3)通过实例,理解古典概型及其概率计算公式,会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。
  (4)了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义(参见例3)。
  (5)通过阅读材料,了解人类认识随机现象的过程。
  2.统计(约16课时)
  (1)随机抽样
  ①能从现实生活或其他学科中提出具有一定价值的统计问题。
  ②结合具体的实际问题情境,理解随机抽样的必要性和重要性。
  ③在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。
  ④能通过试验、查阅资料、设计调查问卷等方法收集数据。
  (2)用样本估计总体
  ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图(参见例1),体会他们各自的特点。
  ②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。
  ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。
  ④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会
样本频率分布和数字特征的随机性。
  ⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。
  ⑥形成对数据处理过程进行初步评价的意识。
  (3)变量的相关性
  ①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
  ②经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
  二.常用逻辑用语
  1。命题及其关系
  ①了解命题的逆命题、否命题与逆否命题。
  ②理解必要条件、充分条件与充要条件的意义,会分析四种命题的相互关系。
  (2)简单的逻辑联结词
  通过数学实例,了解 (5)了解圆锥曲线的简单应用。
  三.统计案例(约14课时)
  通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。
  ①通过对典型案例(如

范文七:概率统计知识点及经典例题 投稿:夏湪湫

统计、随机变量及其分布

第1讲 随机事件的概率

1.随机事件和确定事件 (1)在条件S下,一定会发生的事件叫做相对于条件S的必然事件. (2)在条件S下,一定不会发生的事件叫做相对于条件S的不可能事件.

(3)必然事件与不可能事件统称为确定事件. (2)任何事件(除不可能事件)都可以表示成基本事件的和. 2.古典概型

具有以下两个特点的概率模型称为古典概率模型,简称古典概型.

(1)试验中所有可能出现的基本事件只有有限个.

(4)在条件S下可能发生也可能不发生的事件,叫做随机事件.

(5)确定事件和随机事件统称为事件,一般用大写字母A,B,C„表示. 2.频率与概率

(1)在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事

件A出现的比例fnn(A)=n

为事件A出现的

频率.

(2)对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率,简称为A的概率. 3.互斥事件与对立事件

(1)互斥事件:若A∩B为不可能事件(A∩B=∅),则称事件A与事件B互斥,其含义是:事件A与事件B在任何一次试验中不会同时发生.

(2)对立事件:若A∩B为不可能事件,而A∪B为必然事件,那么事件A与事件B互为对立事件,其含义是:事件A与事件B在任何一次试验中有且仅有一个发生. 4.概率的几个基本性质

(1)概率的取值范围:0≤P(A)≤1. (2)必然事件的概率:P(A)=1. (3)不可能事件的概率:P(A)=0. (4)互斥事件的概率加法公式:

①P(A∪B)=P(A)+P(B)(A,B互斥).

②P(A1∪A2∪„∪An)=P(A1)+P(A2)+„+P(An)(A1,A2,„,An彼此互斥). (5)对立事件的概率:P(A)=1-P(A).

第2讲 古典概型

1.基本事件的特点

(1)任何两个基本事件是互斥的.

(2)每个基本事件出现的可能性相等. 3.古典概型的概率公式

P(A)=A包含的基本事件的个数基本事件的总数

.

第3讲 几何概型 1.几何概型

事件A理解为区域Ω的某一子区域A,A的概率只与子区域A的几何度量(长度、面积或体积)成正比,而与A的位置和形状无关.满足以上条件的试验称为几何概型. 2.几何概型中,事件A的概率计算公式

P(A)

构成事件A的区域长度面积或体积

试验的全部结果所构成的区域长度面积或体积

3.要切实理解并掌握几何概型试验的两个基本特点 (1)无限性:在一次试验中,可能出现的结果有无限多个; (2)等可能性:每个结果的发生具有等可能性.

第4讲 离散型随机变量的分布列 1.离散型随机变量的分布列 (1)随机变量

如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,随机变量常用字母X,Y,ξ,η等表示. (2)离散型随机变量

对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. (3)分布列

设离散型随机变量X可能取得值为x1,x2,„,xi,„xn,X取每一个值xi(i=1,2,„,n)的概率为P(X=x

,则称表 列.

(4)分布列的两个性质

①pi≥0,i=1,2,„,n;②p1+p2+„+pn=_1_.

2.两点分布

如果随机变量X的分布列为

其中0

在含有M件次品数的N件产品中,任取n件,其中含有X件次品数,则事件{X=k}

n-kCkMCN-M

发生的概率为:P(X=k)=(k=

CN

0,1,2,„,m),其中m=min{M,n},且n≤N,

*

,则称分布列

独立重复试验是指在相同条件下可重复进

行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的. (2)二项分布

在n次独立重复试验中,设事件A发生的次数为k,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰

kn-

好发生k次的概率为P(X=k)=Cknp(1-p)k

(k=0,1,2,„,n),此时称随机变量X服从二项分布,记作X~B(n

,p),并称p为成功概率.

第6讲 离散型随机变量的均值与方差 离散型随机变量的均值与方差 若离散型随机变量X的分布列为 称

第5讲 二项分布及其应用

1.条件概率及其性质

(1)对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做条件概率,用符号P(B|A)来表示,其公式为P(B|A)PAB=. PA

在古典概型中,若用n(A)表示事件A中基本

nAB

事件的个数,则P(B|A)=.

nA

(2)条件概率具有的性质: ①0≤P(B|A)≤1;

②如果B和C是两互斥事件,则P(B∪C|A)=P(B|A)+P(C|A). 2.相互独立事件

(1)对于事件A、B,若A的发生与B的发生互不影响,则称A、B是相互独立事件. (2)若A与B相互独立,则P(B|A)=P(B), P(AB)=P(B|A)·P(A)=P(A)·P(B). (3)若A与B相互独立,则A与B,A与B,A与B也都相互独立.

(4)若P(AB)=P(A)P(B),则A与B相互独立. 3.独立重复试验与二项分布 (1)独立重复试验

EX=x1p1+x2p2++xipi++xnpn

为随机变量X的均值 或数学期望,它反映了离散型随机变量取值的平均水平. (2)方差 称DX=

xi-EXpi为随机变

i1

n

2

量X的方差,它刻画了随机变量X与其均值

E(X)的平均偏离

程度,其算术平方根

X的标准差.

第7讲 正态分布

1.正态曲线及性质

(1)正态曲线的定义

x-μ21

函数φμ,σ(x)e-,

2σσ

x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,我们称φμ,σ(x)的图象(如图)为正态分布密度曲线,简称正态曲线. (2)正态曲线的解析式

①指数的自变量是x定义域是R,即x∈(-∞,+∞).

②解析式中含有两个常数:π和e,这是两

个无理数.

③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.

④解析式前面有一个系数为1

2πσ

,后面是一

个以e为底数的指数函数的形式,幂指数为-x-μ22σ.

2.正态分布

(1)正态分布的定义及表示

如果对于任何实数a,b(a

b

a,xdx,则称X

的分布为正态分布,记作N(μ,σ2).

(2)正态总体在三个特殊区间内取值的概率值

①P(μ-σ

第8讲 随机抽样 1.简单随机抽样

(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样的方法:抽签法和随机数法.

2.系统抽样的步骤

假设要从容量为N的总体中抽取容量为n的样本.

(1)编号:先将总体的N个个体编号;

(2)分段:确定分段间隔k,对编号分段,当Nn(n是样本容量)是整数时,取k=Nn; (3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k); (4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 3.分层抽样 (1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在

一起作为样本,这种抽样方法叫做分层抽样. (2)分层抽样的应用范围:

当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.分层抽样的步骤

(1)分层:将总体按某种特征分成若干部分; (2)确定比例:计算各层的个体数与总体的个体数的比;

(3)确定各层应抽取的样本容量;

(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.

第9讲 用样本估计总体

1.频率分布直方图

(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.

(2)作频率分布直方图的步骤

①求极差(即一组数据中最大值与最小值的差).

②决定组距与组数. ③将数据分组. ④列频率分布表. ⑤画频率分布直方图.

(3)在频率分布直方图中,纵轴表示频率

组距

据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.

2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.

(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 3.茎叶图的优点

用茎叶图表示数据有两个突出的优点: 一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到; 二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. 4.样本方差与标准差

设样本的元素为x1,x2,„,xn,样本的平均数为x,

(1)样本方差:s2=1

[(x1-x)2+(x2-x)2

n+„+(xn-x)2].

(2)样本标准差: s=nx1-x2+x2-x2+„+xn-x2]

第3讲 变量间的相关关系与统计案例 1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:

(x1,y1),(x2,y2),„,(xn,yn),其回归方

程为^y=^bx+^

a,则

n

nxiy

^xi-xyi-yyi-n x b=i=1n=

i=1i=x1

i-x2

nx2i-n x2



i=1

^a=y-^

b x.

其中,b是回归方程的斜率,a是在y轴上的截距.

4.样本相关系数

nxi-xyi-yr=i=1n

xi-x2nyi-y

2i=1i=1

用它来衡量两个变量间的线性相关关系.

(1)当r>0时,表明两个变量正相关; (2)当r<0时,表明两个变量负相关; (3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型

(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差. (2)相关指数

用相关指数R2来刻画回归的效果, R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好. 6.独立性检验

(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等. (2)列出的两个分类变量的频数表,称为列联表.

(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

K2

=a+ba+cc+db+d(其中n=a+b

+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.

这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

题型专练

(Xi)1. 已知随机变量X的分布列为P

i

(X2). i1,2,3),则P

2a

2.



3. 如果~B15,1,则使P(=k)取最大值的k值为.



44. 已知的分布列为=-1,0,1,对应P=

111

,,,且设=2+1,则的期望是. 263

1

,相应奖金为1210

5. 一次抽奖活动规则为:先花10元买10张奖券,每张获奖概率均为

元。若张三花了10元参加该活动,则他最后盈利期望为元。

6. 一个篮球运动员投篮一次得3分的概率为a,得2分的概率为b,不得分的概率为c,已知他投篮一次得分的期望为1,则ab的最大值为 7. 在某项测量中,测量结果服从正态分布N(11)内取值的概率,2)(0).若在(0,

为0.4,则在(0,2)内取值的概率为. 8. 已知随机变量服从正态分布N(2,2),P(≤4)0.84,则P(≤0) 9. 某中学200名考生的高考数学成绩近似服从正态分布N(120,100),则此校数学成绩在140分以上的考生人数约为。 (注:正态总体N(,2)在区间(2,2)内取值的概率约为0.954)

10. 求:(1)

11. 一袋中装有编号为1,2,3,4,5,6的6个大小相同的球,现从中随机取出3个球,以X表示取出的最大号码,求X的期望。

12. 一名学生每天骑车上学,从他家到学校的途中有6个交通岗,假设他在各个交通岗遇到

1红灯的事件是相互独立的,并且概率都是3.

(1)设X为这名学生在途中遇到红灯的次数,求X的分布列及期望; (2)设Y为这名学生在首次停车前经过的路口数,求Y的分布列及期望;

13. 某校高三年级某班的数学课外活动小组中有6名男生,4名女生,从中选出4人参加数学竞赛考试,用X表示其中的男生人数,求X的概率分布及期望.

14. 甲、乙两人轮流投篮直至某人投中为止,已知甲投篮每次投中的概率为0.4,乙每次投篮投中的概率为0.6,各次投篮互不影响.设甲投篮的次数为,若乙先投,且两人投篮次数之和不超过4次,求的概率分布及期望.

15.在1,2,3,,9这9个自然数中,任取3个数.

(1)求这3个数中恰有1个是偶数的概率;

(2)设为这3个数中两数相邻的组数(例如:若取出的数为1,2,3,则有两组相邻的

数1,2和2,3,此时的值是2).求随机变量的分布列及其数学期望E.

16.购买某种保险,每个投保人每年度向保险公司交纳保费a元,若投保人在购买保险的一年度内出险,则可以获得10 000元的赔偿金.假定在一年度内有10 000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10 000元的概率为10.99910.

(1)求一投保人在一年度内出险的概率p;

(2)设保险公司开办该项险种业务除赔偿金外的成本为50 000元,为保证盈利的期望不

小于0,求每位投保人应交纳的最低保费(单位:元).

17. 在一次抗洪抢险中,准备用射击的方法引爆从桥上游漂流而下的一巨大汽油罐.已知只有5发子弹备用,且首次命中只能使汽油流出,再次命中才能引爆成功,每次射击命中

2

率都是.,每次命中与否互相独立.

3

(1) 求油罐被引爆的概率.

(2) 如果引爆或子弹打光则停止射击,设射击次数为ξ,求ξ的分布列及ξ的数学期望;

18. 某地有A、B、C、D四人先后感染了H7N9流感,其中只有A到过疫区.B肯定是受A感染的.对于C,因为难以断定他是受A还是受B感染的,于是假定他受A和受B感染的概率都是

4

11

.同样也假定D受A、B和C感染的概率都是.在这种假定之下,B、C、D中直.23

接受A感染的人数X就是一个随机变量.写出X的分布列(不要求写出计算过程),并求X.

的均值(即数学期望).

20. 甲、乙、丙三人参加了一家公司的招聘面试,面试合格者可正式签约,甲表示只要面试

合格就签约.乙、丙则约定:两人面试都合格就一同签约,否则两人都不签约.设每人面

1

,且面试是否合格互不影响.求: 2

(1)至少有1人面试合格的概率;(2)签约人数的分布列和数学期望.

试合格的概率都是

21. 在某校组织的一次篮球定点投篮训练中,规定每人最多投3次;在A处每投进一球得3分,在B处每投进一球得2分;如果前两次得分之和超过3分即停止投篮,否则投第三次,某同学在A处的命中率q1为0.25,在B处的命中率为q2,该同学选择先在A处投一球,以后都在B处投,用表示该同学投篮训练结束后所得的总分,其分布列为

(1)求q2的值;(2)求随机变量的数学期望E。

22. 为振兴旅游业,四川省2009年面向国内发行总量为2000万张的熊猫优惠卡,向省外人士发行的是熊猫金卡(简称金卡),向省内人士发行的是熊猫银卡(简称银卡)。某旅游公司组织了一个有36名游客的旅游团到四川名胜旅游,其中3是省外游客,其余是省内

4

游客。在省外游客中有1持金卡,在省内游客中有2持银卡。

3

3

(1)在该团中随机采访3名游客,求恰有1人持金卡且持银卡者少于2人的概率; (2)在该团的省内游客中随机采访3名游客,设其中持银卡人数为随机变量,求的

分布列及数学期望E。

范文八:概率统计复习知识点 投稿:汪屫屬

概率统计复习知识点

第一章、随机事件及其概率

1. 事件间的关系与运算,例1.1.5

2. 概率的性质及运算,如PABP(A)P(B)P(AB)等

3. 条件概率及乘法公式

4. 全概率与贝叶斯公式的应用,例1.4.4

5. 事件的相互独立性,P(AB)P(A)P(B)

第二章、随机变量及其分布

1.已知离散型随机变量分布列,求事件的概率,如P(X1)

常见的离散型随机变量的分布:0-1分布,二项分布,泊松分布,掌握其分布列,并会求事件的概率

2.分布函数的定义及性质,如F()1,F()0

3.连续型随机变量的定义、性质,如

f(x)dx1

常见的连续型随机变量的分布:均匀分布,指数分布掌握其密度函数,正态分布掌握密度曲线的特征。已知密度函数,会求事件的概率,例2.4.2

4.求随机变量函数的分布的方法,离散型,连续型,例2.5.1

第三章、多维随机变量

1.二维随机变量的联合分布函数的性质,

如F(,)0,F(,)0,F(,)0,F(,)1;

2.已知联合分布列、联合密度函数,会求边缘分布列、边缘密度函数, 例3.2.1,例3.2.2

3.随机变量相互独立的充要条件,如连续型f(x,y)f(x)f(y)

4.求二维随机变量函数的分布的方法,例3.4.1,并会求事件的概率,如P(XY1)

第四章、随机变量的数字特征

1.数学期望的性质及计算方法,离散型:取值乘概率求和,连续型:取值乘密度函数求积分。

2.方差的定义、性质及计算方法,掌握随机变量常见类型的期望与方差

3.协方差、相关系数的定义及计算方法

第六章、数理统计

1.常用的统计量:样本均值、样本方差、样本的K阶原点矩、样本的K阶中心矩、最大(小)顺序统计量,定理6.2.1

2.卡方分布、t分布、F分布的定义

3.有关正态总体的三个定理,定理6.4.1,定理6.4.2,定理6.4.3

第七章、参数估计

1.参数的点估计:矩估计法、极大似然估计法,例7.1.2,例7.1.8

2.无偏估计,有效性的判断, 例7.2.4

第八章、假设检验

1.参数的假设检验:对均值的假设检验:U检验和T检验. 例8.2.1,例8.2.3

范文九:第六部分《统计与概率》知识点 投稿:任妥妦

第六部分《统计与概率》知识要点

普查:总体与个体(研究对象中心词)两查抽样调查:样本与容量(无单位的数量)折线图(发展趋势与波动性横纵轴坐标单位长度要统一)三图条形图(纵坐标起点为零高度之比等于频数或频率之比)扇形图(知道各量的百分比可用加权平均数求平均值)算术平均数平均数参照平均数加权平均数三数众数(可能不止一个)中位数(排序、定位)

12(xx1)2(xx2)2(xxn)2方差:s统计与概率n(一组数据整体被扩大n倍,平均数扩大n倍,方差扩大n2倍);三差(一组数据整体被增加m,平均数增加m,方差不变)标准差:方差的算术平方根s极差:最大数与最小数之差(方差与标准差均衡量数据的波动性,方差越小波动越小) 必然事件:(概率为1)确定事件事件不可能事件:(概率为0)不确定事件:(概率在0与1之间)

频率:(试验值,多次试验后频率会接近理论概率)比例法(数量之比、面积之比等)两率概率:求法列表法(返回与不返回的两步实验求概率)树状图(返回与不返回的两步或两步以上的试验求概率)

范文十:统计和概率知识点总结 投稿:高哖哗

数据的收集、整理与描述

1、全面调查:考察全体对象的调查方式叫做全面调查。

2、抽样调查:调查部分数据,根据部分来估计总体的调查方式称为抽样调查。

3、总体:要考察的全体对象称为总体。

4、个体:组成总体的每一个考察对象称为个体。

5、样本:被抽取的所有个体组成一个样本。

6、样本容量:样本中个体的数目称为样本容量。

7、样本平均数:样本中所有个体的平均数叫做样本平均数。

8、总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。

9、频数:一般地,我们称落在不同小组中的数据个数为该组的频数。

10、频率:频数与数据总数的比为频率。

11、组数和组距:在统计数据时,把数据按照一定的范围分成若干各组,分成组的个数称为组数,每一组两个端点的差叫做组距。

数据的分析

x1,x2,,xn,那么,x1(x1x2xn)n叫1、平均数:一般地,如果有n个数

做这n个数的平均数,x读作“x拔”。

xf2、加权平均数:如果n个数中,x1出现f1次,x2出现f2次,„,k出现k次

(这里f1f2fkn)。那么,根据平均数的定义,这n个数的平均数可以xx1f1x2f2xkfk

n,这样求得的平均数x叫做加权平均数,其中表示为

f1,f2,,fk叫做权。

3、中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数(median);如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。

4、众数:一组数据中出现次数最多的数据就是这组数据的众数(mode)。

5、极差:组数据中的最大数据与最小数据的差叫做这组数据的极差(range)。

6、在一组数据x1,x2,,xn,中,各数据与它们的平均数x的差的平方的平均数,

叫做这组数据的方差。通常用“s2”表示,即

1s2[(x1x)2(x2x)2(xnx)2] n

7、标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即

ss21[(x1x)2(x2x)2(xnx)2] n

8、方差越大,数据的波动越大;方差越小,数据的波动越小,就越稳定。

概率

1、确定事件:必然发生的事件。在一定的条件下重复进行试验时,在每次试验中必然会发生的事件。P(A)=1

2、不可能发生的事件:有的事件在每次试验中都不会发生,这样的事件叫做不可能的事件。P(A)=0

3、随机事件:在一定条件下,可能发生也可能不放声的事件,称为随机事件。

一般地,随机事件发生的可能性是有大小的,不同的随机事件发生的可能性的大小有可能不同。

4、概率:一般地,在大量重复试验中,如果事件A发生的频率

常数p附近,那么这个常数p就叫做事件A的概率。

5.两种模型的概率

(1) 等可能性事件的概率:

在一次试验中,如果不确定现象的可能结果只有有限个,且每一个结果都是等可能的,求这种类型事件的概率称为等可能事件的概率型.如摸球、掷硬币、掷骰子等都属于等可能性.

在等可能事件中, 如果所有等可能的结果为n,而其中所包含的事件A可

m能出现的结果数是m,那么事件A的概率P(A)=. n

(2) 区域事件发生的概率:在与图形有关的概率问题中,概率的大小往往与面积有关,这种类型的概率称为区域型概率.在区域事件中,某一事件发生的概率等于这一事件所有可能结果组成的图形的面积除以所有可能结果组成的图形的面积.如P(小猫停留在黑砖上)=

6.确定事件概率 黑砖总面积. 地板砖总面积n会稳定在某个m

(1)当A是必然发生的事件时,P(A)=1

(2)当A是不可能发生的事件时,P(A)=0

7.列表法求概率

(1)、列表法

用列出表格的方法来分析和求解某些事件的概率的方法叫做列表法。

(2)、列表法的应用场合

当一次试验要设计两个因素, 并且可能出现的结果数目较多时,为不重不漏地列出所有可能的结果,通常采用列表法。

8.树状图法求概率

(1)、树状图法

就是通过列树状图列出某事件的所有可能的结果,求出其概率的方法叫做树状图法。

(2)、运用树状图法求概率的条件

当一次试验要设计三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果,通常采用树状图法求概率。

9.利用频率估计概率

(1)、利用频率估计概率

在同样条件下,做大量的重复试验,利用一个随机事件发生的频率逐渐稳定到某个常数,可以估计这个事件发生的概率。

(2)、在统计学中,常用较为简单的试验方法代替实际操作中复杂的试验来完成概率估计,这样的试验称为模拟实验。

(3)、随机数

在随机事件中,需要用大量重复试验产生一串随机的数据来开展统计工作。把这些随机产生的数据称为随机数。

字典词典观念决定成败观念决定成败【范文精选】观念决定成败【专家解析】保护小树的话保护小树的话【范文精选】保护小树的话【专家解析】酒店会员卡酒店会员卡【范文精选】酒店会员卡【专家解析】