Excel在概率统计中的应用
国家基金委-儿童节英文
Excel在概率统计中的应用
第一节 基本概念
随机变量——在一定范围内以一定的概率分布随机取值的变量。
随机变量(random v
ariable)表示随机现象(在一定条件下,并不总是出现相同结果的现象
称为随机现象)各种结果
的变量(一切可能的样本点)。例如某一时间内公共汽车站等车乘
客人数,电话交换台在一定时间内收到
的呼叫次数等等,都是随机变量的实例。
随机变量可分为离散型随机变量和连续型随机变量
定义2 若随机变量
可能取的值至多可列个(有限个或可列无限个),
则称
为离散型
(discrete)随机变量。
对离散型随机变量,设{
记作
x
j
}为其可能取值的集合,关键问题是写出概率
P(
x
i
)
(简
p(x
i
)
或
p
i
),
i
=1,2,…。 称
x
2
x
n
x
1
p(x
n
)
p(x
1
)p(x
2
)
为
的分布列(distribution
sequence),有时也就称它为
的概率分布。
有些离散型随机变量的分布除
了用上述分布列表示外,还可以用数学的解析表达式来表示其
概率分布。
1、二项分布 二项分布即重复n次的伯努利试验。在每次试验中只有两种可能的结果,而且是
互相对立的,是独立
的,与其它各次试验结果无关,结果事件发生的概率在整个
系列试验中保持不变,则这一系列试验称为伯
努力试验。
二项分布的概率函数为:
2、泊松分布
泊松
分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在
一定时间内到达的人数,
电话交换机接到呼叫的次数,汽车站台的候客人数,机器出
现的故障数,自然灾害发生的次数,一块产品
上的缺陷数,显微镜下单位分区内的细
菌分布数等等。
泊松分布的概率函数为:
泊松分布P (λ)中只有一个参数λ ,它既是泊松分布的均值,也是泊松分布的方差。
3、几何分布
几何分布(Geometric distribution)
是离散型概率分布。其中一种定义
为:在第
n
次伯努利试验中,试验
k
次才得到第一次成功的机率。详细的
说,是:前
k
-1次皆失败,第
k次成功的概率。
几何分布的概率函数为:
数学期望和方差:
E(m) = (1-p)p, var(m) = (1-p)p^2。
4、负二项分布
昆虫种群内个体有明显的集聚现象,呈疏密相间的空间分布型,其数学表达式与指数为负的
二项
分布类似,故名之。
它表示,已知一个事件在伯努利试验中每次的出现概率是p,在一连串伯努利试验
中,
一件事件刚好在第r + k次试验出现第r次的概率。
概率函数为:
取r = 1,负二项分布等于几何分布。
第二节:excel中常用概率分布的计算
一、二项分布
BINOMDIST
返回一元二项式分布的概率值。函数
BINOMDIST 适用于固定次数的独立试验,
当试验的结果只包含成功或失败二种情况,且当成功
的概率在实验期间固定不
变。例如,函数 BINOMDIST
可以计算三个婴儿中两个是男孩的概率。
语法
BINOMDIST(试验成功的次数k,试验总次n,每次试验成功的概率,cumulative)
Number_s 为试验成功的次数。
Trials 为独立试验的次数。
Probability_s 为每次试验中成功的概率。
Cumulative
为一逻辑值,用于确定函数的形式。如果 cumulative 为 TRUE,函
数
BINOMDIST 返回累积分布函数,即至多 k 次成功的概率;如果为
FALSE,返
回概率密度函数,即k 次成功的概率。
说明
Number_s 和 trials 将被截尾取整。
如果 number_s、trials 或 probability_s 为非数值型,函数
BINOMDIST 返回错误
值 #VALVE!。
如果 number_s < 0
或 number_s > trials,函数 BINOMDIST 返回错误值 #NUM!。
如果 probability_s < 0 或 probability_s > 1,函数
BINOMDIST 返回错误值
#NUM!。
一元二项式概率密度函数的计算公式为:
1
2
3
4
5
A
二项分布概率函数
项目
试验成功次数k
独立试验次数n
每次试验的成功概率p
B
数据
6
10
0.5
6
7
8
9
10
公式
结果:10 次试验成功 6 次
的概率
公式
结果:10次试验最多成功6
次的概率
=BINOMDIST(B3,B4,B5,FALSE)
0.205078125
=BINOMDIST(B3,B4,B5,TRUE)
0.828125
二、超几何分布
HYPGEOMDIST
返回超几何分布。给定样本容量、样本总体容量和样本总体中成功的次数,函数
HYPGEOMDIST 返回样本取得给定成功次数的概率。使用函数 HYPGEOMDIST 可
以
解决有限总体的问题,其中每个观察值或者为成功或者为失败,且给定样本容量
的每一个子集
有相等的发生概率。
语法
HYPGEOMDIST(样本中成功的次数k, 样本容量n,
样本总体中成功的次数M, 样
本总体的容量N)
说明
所有参数将被截尾取整。
如果任一参数为非数值型,函数 HYPGEOMDIST
返回错误值 #VALUE!。
如果 sample_s < 0 或 sample_s 大于
number_sample 和 population_s 中的较小值,
函数
HYPGEOMDIST 返回错误值 #NUM!。
如果 sample_s 小于 0 或
(number_sample - number_population + population_s)
中
的较大值,函数 HYPGEOMDIST 返回错误值 #NUM!。
如果
number_sample < 0 或 number_sample >
number_population,函数
HYPGEOMDIST 返回错误值 #NUM!。
如果 population_s < 0 或 population_s >
number_population,函数 HYPGEOMDIST
返回错误值 #NUM!。
如果 number_population < 0,函数 HYPGEOMDIST 返回错误值
#NUM!。
超几何分布的计算公式如下:
M
NM
k
nk
P(Xk)h(k,n,M,N)<
br>
N
n
式中:
x = sample_s
n = number_sample
M = population_s
N = number_population
函数 HYPGEOMDIST 用于在有限样本总体中进行不退回抽样的概率计算。
三、负二项分布
NEGBINOMDIST
返回负二项式分布。当成功概率为常量
probability_s 时,函数 NEGBINOMDIST
返回在到达 number_s
次成功之前,出现 number_f 次失败的概率。此函数与二
项式分布相似,只是它的成功次数固
定,试验总数为变量。与二项式分布类似的
是,试验次数被假设为自变量。
例如,如果要找
10 个反应敏捷的人,且已知具有这种特征的候选人的概率为
0.3。函数
NEGBINOMDIST 将计算出在找到 10
个合格候选人之前,需要对给定
数目的不合格候选人进行面视的概率。
语法
NEGBINOMDIST(失败次数k, 成功的极限次数r成功的概率p)
Number_f 失败次数。
Number_s 成功的极限次数。
Probability_s 成功的概率。
说明
Number_f 和 number_s 将被截尾取整。
如果任一参数为非数值型,函数 NEGBINOMDIST 返回错误值 #VALUE!。
如果 probability_s < 0 或 probability > 1,函数
NEGBINOMDIST 返回错误值
#NUM!。
如果 number_f < 0
或 number_s < 1,函数 NEGBINOMDIST 返回错误值 #NUM!。
负二项式分布的计算公式如下:
kr1
rk
nb(k,r,p)<
br>
p(1p)
r1
取r =
1,负二项分布等于几何分布。
POISSON
返回泊松分布。泊松分布通常用
于预测一段时间内事件发生的次数,比如一分钟
内通过收费站的轿车的数量。
语法
POISSON(k,mean,cumulative)
X(k) 事件数。
Mean 期望值。
Cumulative 为一逻辑值,确定所返回的概率分布形式。如果
cumulative 为
TRUE,函数 POISSON
返回泊松累积分布概率,即,随机事件发生的次数在 0 到
x 之间(包含 0 和 1);如果为
FALSE,则返回泊松概率密度函数,即,随机
事件发生的次数恰好为 x。
说明
如果 x
不为整数,将被截尾取整。
如果 x 或 mean 为非数值型,函数 POISSON
返回错误值 #VALUE!。
如果 x < 0,函数 POISSON 返回错误值
#NUM!。
如果 mean ≤ 0,函数 POISSON 返回错误值 #NUM!。
函数 POISSON 的计算公式如下:
假设 cumulative =
FALSE:
e
k
P(Xk)
k!
假设 cumulative = TRUE:
e
i
P(Xk)
i!
i0
k