统计学计算公式

余年寄山水
628次浏览
2021年01月09日 03:37
最佳经验
本文由作者推荐

电脑开机死机-销售年度工作总结

2021年1月9日发(作者:卫铄)


第4章

计划完成程度相对指标
实际完成数
计划任务数< br>100%
K

X
实际


X
 100%(公式4-2)
计划

计划任务数为平均数时
K
实际

X
X
100%(公式4-3)
计划

(ⅰ)当计划任务数表现为提高率时
K
1实际提高百分数
1计划提高 百分数
100%(公式4-4)

ⅱ)当计划任务数表现为降低率时

K
1实际降低百分数
1-计划降低百分数
100% (公式4-5)

计划执行进度
本期内累计实际完成数
全期的计划任务数
100%

时间进度=
截止到本期的累计时间
全期时间
100%(公式4-7)

计划完 成程度相对指标
计划期间实际完成累计数
计划期间计划规定累计数
100%(公式 4-8)

计划完成程度相对指标
计划末期实际达到的水平
计划规定末期应 达到的水平
100%(公式4-9)

结构相对指标
总体中某一部分数值
总体的全部数值
100%
比例相对指标
总体中某一部分数值
总体 中另一部分数值
(公式4-11)

比较相对指标
甲地区(部门或单位)的 某一指标数值
同时期乙地区(部门或单位)的同一指标数值
(公式4-12)
强度相对 数
某一总量指标数值
另一性质不同但有一定联系的总量指标数值
(公式4-13)< br>
公(


动态相对数
某指标报告期数值
1 00%
该指标基期数值
(公式4-14)

对于分组数据,众数的求解公式为:
上限公式:M
0
U
fm
f
m1
d
(f
m
f
m1
)(f
m
f
m1
)


s
m1
f
m
f
m
f
m1
上限公式:M
0Ud
(f
m
f
m1
)(f
m
f
m1
)
s
m1
f
m
对于分组的数值型数据, 中位数按照下述公式求解:
nn
下限公式:M
e
L
2

d上限公式:M
e
U-
2
d
对于分组的数值型数据, 四分位数按照下述公式求解:
n
S
L1
Q
L
LL

4
d
L
f
L
< br>3n
S
U1
Q
U
L
U

4< br>d
u
f
U

(1)简单算数平均数 (2)加权算数平均数
x

x
i1
n
i
x


xf
i1
k
k
ii
n

i 1
f
i


x
i

i1
kf
i

f
i1
k
i

各变量值与算术平均数的离差之和为零。


(xx)0或

(xx)f0
各变量值与算术平均数的离差平方和为最小。

22(xx)min或(xx)fmin

2、调和平均数(Harmonic mean)
(1)简单调和平均数 (2)加权调和平均数

x
H



n
n
111
...
x
1
x
2
x
n
n
1

i1
x
i
n
m
1
m
2
...m
n
x
H

m
m
1
m
2
...
n
x
1
x
2
x
n

m
i1
n
i
m
i< br>
i1
x
i


3、几何平均数
(1)简单几何平均数 (2)加权几何平均数


x
G


f
i
i1
n
x
1
1
x
2
2
...x
nfff
n
x
G

n
x
1
x
2
...x
n

n

x
i1
ni
一、分类数据:异众比率 二、顺序数据:四分位差


V
r
ff

< br>
f
i
i
m
f
m
1

f
i
Q
d
Q
u
Q
L
三、数值型数据的 离散程度测度值
1、极差(Range)
2、平均差
(1)如果数据是未分组数据(原始数据),则用简单算术平均法来计算平均差:
Rmax(x
i
)min(x
i
)

M
d


xx
i
i1
n
n
(n为变量 值个数)

(2)如果数据是分组数据,采用加权算术平均法来计算平均差:
Md


x
i1
k
i
xf
i
(k为组数)
i

f
i1
k

3、方差(Variance)与标准差
总体方差和标准差的计算公式:
方差:(未分组数据) (分组数据) < br>2
(X

)

i
i1
N
2



N

2


2
(X

)f
i

i
i1
K
N


标准差:(未分组数据) (分组数据)
2
(X

)

i
i1
N


N



2
(X

)f
i

i
i1
K
N

样本方差和标准差
方差的计算公式
未分组数据 : 分组数据:
2
(xx)

i
i1
n
2
(xx)f
i

i
i1
k
s
2
< br>n1
s
2


n1

标准差的计算公式
未分组数据 : 分组数据:
2
(xx)

i
i1
n
2
(xx)f
i

i
i1
k
s
n1
s

n1

4、变异系数(离散系数)
标准差系数计算公式
s
v


v
s

(总体离散系数)
x

X

一、分布的偏态

(样本离散系数)
对未分组数据 对分组数据


sk

n1

n2
s
n

x
i
x

3
3

sk


xx

i
i1
k
3
f
i

ns
3
二、分布的峰态
(未分组数据) 对已分组数据


k
n

n1


x
i
x3

x
i
x

4

n1

n2

n3

s

4



n1


2
2
k


x
i1
k
i
xf
i
4

4
ns
3


第5章
离散型随机变量的概率分布
(2)二项分布

(3) 泊松分布:

P(Xk)

k
k!
e


当n很大,p很小时,B(n,p)可近似看成参数=np的P().即,


kk
P{Xk}limC
n
p(1p)
nk

n

k
k!
e


,k0,1,2,
分布函数

F(x)P(Xx)P(Xx
i
)p
i

x
i
xx
i
x

F(x) 的性质:
F(x
1
)F(x
2
)
(a)单调性 若
x

1



x

2
,则


P(axb)F(b)F(a)

(b)有界性
0F(x)1
limF(x)1
limF(x)0< br>x
x

(c)右连续性

lim

F(x)F(x
0
)
xx
0

(d)对任意的x0



x)F(x)F(x0)P

(

X
000


若F(x)在X=x0处连续,则
P(Xx)0
0

连续型随机变量的概率分布
x


F(x)

f(t)dt

概率密度函数 f(x)的性质
(a)非负性 f(x) ≥0;

(b)归一性 ;
f(x)dx1


b
(c)
P(axb)F(b)F(a)f(x)dx

a
;




(d)在f(x)的连续点x处,有
f(x)F

(x)
(e)
P(aXb)P(aXb)P(aXb)P(a

几种常见的连续型分布

1
(1)均匀分布
axb

若随机变量X的概率密度为
f(x)

ba


其他


0

则称X在(a,b)上服从均匀分布,记为X

U (a,b).

另:对于
a



c



d



b
, 我们有
dc
P(cXd)

Xb)



(2)指数分布
ba


e


x
,x0
若随机变量X的概率密度为
f(x)

x0

0,



其中常数 ,则称X服从参数为

的指数分布,相应的分布函数为

1e


x
,x 0
F(x)

x0

0,


0
EX

x
i
p
i
i1
.随机变量的数学期望

连续型随机变量的数学期望:
EX

数学期望的性质



xf(x)dx
性质1. 设C是常数,则E(C)=C;
性质2. 若X和Y相互独立,则 E(XY)=E(X)E(Y);
性质3. E(X±Y) =E(X) ±E(Y) ;
性质4. 设C是常数,则 E(CX)=C E(X)。
性质2可推广到任意有限多个相互独立的随机变量之积的情形。




常见的离散型随机变量的数学期望 :
(a)两点分布 若X~B(1,p),则EX=p.
(b)二项分布 若X~B(n,p),则EX=np.
(c)泊松分布 若X~P(

),则EX=

.

常见的连续型随机变量的数学期望:
(a)均匀分布: 设X

U (a,b),则EX=(a+b)2。
(b)指数分布: 设X服从参数为



的指数分布,则 EX=

*方差的性质
性质1 设X是一个随机变量,C为常数,则有 D(C)=0;
性质2 D(CX)=C2DX;
性质3 若X与Y相互独立,则D(X±Y) =D(X) +D(Y) 特别地
性质3可以推广到n个随机变量的情形。
性质4 DX=0的充要条件是X以概率1取常数EX。

常见的离散型随机变量的方差:
(a)两点分布 若X~B(1,p),则DX=p(1-p);
(b)二项分布 若X~B(n,p),则DX=np(1-p);
(c)泊松分布 若X~P(

),则DX=



常见的连续型随机变量的方差:
(a)均匀分布 设X

U (a,b),则DX=(b-a)212;
1


D(X-C)=DX

1

2


(b)指数分布 设X服从参数为

的指数分布,则 DX= 。


离散型随机变量的数字特征:


期望:
E

X

X1
P
1
X
2
P
2


X
n
P
n


X
i
P
i
i 1
2
N
2
N
方差 : σ

X





X
i
E

X



 P
i


i1


标准差 : σ

X





X
i
E

X



 P
i
2
i  1
N

概率






统计

数 学 期 望 方 差
E

X



X
i
P
i
i  1
N


σ

X




X
i
E

X


P
i

2
2
i1
N

平 均 数 方 差

fi
x

x
i



f
i 1
i

n




σ

x



x
i
- x
2
i1
n




2

f
i

f
i
连续型随机变量的数字特征:





2
方差— σ
2

X




2


xE X f

x

dx

标准差— σ

X




xE

X



2
f

x

dx


则:
2


2

X



1
2


2

2


n



i
2

i1
n
σ
2
σ
σ X  ; σ X 
n
n

222
σ
1

σ
2



σ
n
1
2
σ X  
σ
i
n
n
2
2


重置抽样下的抽样分布
考虑顺序时:样本个数=N
n
=5
2
=25


(Nn1)!
不考虑顺序时:样本个数=
C
n

Nn1
(N1)!n!
E(x)

D(x)

n
2


不重置抽样下的抽样分布
考虑顺序时:样本个数=

N!
P
(Nn)!
nN
N!
C
(Nn)!n!
不考虑顺序时:样本个数=
n< br>N
与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以修正系

即:

正态分布密度函数及其数学性质
正态分布的密度函数:

(Nn)(N1)
E(x)

D(x)

2
Nn
nN1
1
f

x

 e


2

正态分布的分布函数:


2
x



2

2

记作XN







2
2
t



1
F

x



e
- 

2

x
2

2
dt
标准正态分布的密度函数:
1


x

e
2



x
2

2

记作XN

0 1,


x



-
x
标准正 态分布的分布函数:


1
e
2

t
2

2
dt
Z
对任意正态分布
2
作变换
(0)0.5
(x)1(x)



N






X

< br>~ N

0, 1


第六章
二、 总体平均数的检验
1.大样本(
n30
)(2 已知或2未知)
 假定条件
总体服从正态分布
若不服从正态分布, 可用正态分布来近似(n30)
 使用Z-统计量
2 已知:
Z
X

0

n
~N(0,1)

2 未知:
Z
X

0
Sn
~N(0,1)

2. 小样本(
n30
) (2 已知或2未知)
 假定条件:
总体服从正态分布, 小样本(n < 30)
 检验统计量


2 已知:
z
x

0
,1)


n
~N(0

2 未知:
t
x

0
sn
~t(n1)
均值的单尾 t 检验
检验统计量:
t
x

0

sn
三、总体比例的检验

41000
41000



40000
0.894
 假定条件: 1、有两类结果;
500020
2、总体服从二项分布;
 比例检验的 Z 统计量
Z
P

0
0

~N(0,1)
00
(1

0
0
)
n
3、可用正态分布来近似 。


其中:0为假设的总体比例

第八章
cov(x,y)
 总体的简单线性相关系数:


var(x)var(y)
样本的简单线性相关系数:
r



(xx)(yy)

(xx)< br>
(yy)
22

n

xy

x

y
n

x
2
(

x)2
n

y
2
(

y)
2
 相关系数r的取值范围是[-1,1]
 当|r|=1,表示完全相关,其中r =-1此时表示完全负相关,r =1,表示完全正相关
 r = 0时不存在线性相关关系
 当-1r<0时,表示负相关,0 当|r|越趋于1表示相关关系越密切,|r|越趋于0表示相关关系越不密切
 一般来说,当|r |在大于0.8时,即可认为存在高度相关关系,|r|在0.5到0.8之间时,
可认为相关关系程度 一般,|r|小于0.5时,可认为相关关系程度较弱。

一、一元线性回归模型的设定
 总体回归函数
条件均值形式:E(y) =

0+

1x
个别值形式:y =

0+

1 x+


其中,

0和

1称为模型的参数 ,

是误差项

ˆ


ˆ
x
ˆ
y


条件均值形式:
01
ˆ


ˆ
xe
个别值形式:
y

01
 样本回归函数


其中:





ˆ

0
是样本回归直线在 y 轴上的截距;
ˆ
是直线的斜率; 是 y 的估计值;

是样本回归模型的残差,是样本回归函数预测结果与实际值的差。
e
1
最小二乘估计

ˆ



1



(xx)(yy)

n
< br>xy(

x)(

y)
n

x(

x)

(xx)
ˆ
y

ˆ
x< br>
iiiiii
22
2
i
ii
01
三、一元 线性回归模型的检验

22
ˆˆ

(y
i
y) 

(y
i
y)

(y
i
y
i
)
2
i1i1
nnn

i1

总平方和,记作称为
SST


反映因变量的 n 个
观察值与其均值的总

离差。)

称为回归平方和,记作SSR
(反映自变量 x 的变化对因
变量 y 取值变化的影响,或
者说,是由于 x 与 y 之间的
线性关系引起的 y 的取值变
化,也称为可解释的平方和。)
称为残差平方和,记作SSE
(反映除 x 以外的其他因素
对 y 取值的影响,也称为不
可解释的平方和或余平方
和。)

即: SST=SSR+SSE
根据拟合优度的定义,计算模型的拟合优度,只需将SSRSST。计算的结 果称为可决系
数(或判定系数),记作R2。 即: R2 = SSRSST = 1-SSESST

(4)检验步骤
提出假设:H0: β1 = 0 (没有线性关系) H1: β1 ≠ 0 (有线性关系)
ˆ
0
ˆ

11
~t(n2)
计算检验的统计量:
t
ˆ
)SE
ˆ
)
ˆ
(

ˆ
(
SE
11
确定显著性水平

,若|t|>t

,则 拒绝H0,认为模型通过检验,认为x对y有显著影
响;若|t|< t

,不拒绝H0,认为模型没有通过检验,认为x对y没有显著影响。


第九章
拉氏指数

数量指标的

拉氏指数
q



q
1
0
1
0
p
0
p
0
q
0
p
1

质量指标的

拉氏指数

q
0
p
0< br>质量指标的
帕氏指数

帕氏指数
q


数量指标的


q
帕氏指数


p
1
p
1

q

q
1
p
1
p
01
算术平均指数
qp
设: k
q

q
00
—q
0
p
0
为权数:
1
q
0
, k
p

1
p
0

x

xf

f
qp

k



A
p


q
k
p

q
0
p
0



A
p


q
0
p
0
q
00
q
1

q

q
0
p
0


0


q
0
p
0
1
0
qp



qpp

p

qp


q



qp

q
1
0
0
0
000
0
0
p
1
p
0

m
m
x

0

调和平均指数
H
q

qp


1
11
—q
1
p
1
为权数
H
1
0
1
1
qp

k



q


q
1
p
1
q
0

q

q
1
p
1


1
q



q
p
1
p
1
p
1
p
0
H
p


q
1
p
1
1

k

q
1
p
1


p


q

1
p
1
p
0

q
1
p
1


p
1
q



q
1
1

指数因素分析方法
简单现象数因素分析


0101
q
0
p
0
 q
1
p
0
 q
1
p
1

qqpp


q
1
p
1


qp

00
q
1p
0
q
1
p
1
q
1
p
1

q
0
p
0
q
1
p
0
q
0
p
0


q
1
p
1
q
0
p
0


qpqp



qpqp



qq

pq
pp

10001110
100110


总体现象的因素分析







q
1
p
1
q

1
p
0

q
1
p
1




qp



q
0
p
0
q
0
p
0



q
1
p1


q
0
p
0




q
1
p
0


q
0
p
0






q
1
p
1


q
1
p
0



10
010101


a
0
b
0
c
0


a
1
b
0
c
0


a
1
b1
c
0


a
1
b
1
c
1


aabbcc

1

< br>a
1
b
1
c
1
a
1
b
0< br>c
0
a
1
b
1
c
0





a
0
b
0
c
0
a
0
b
0
c
0

a
1b
0
c
0





a
1
b
1
c
1


a
0b
0
c
0




a
1
b
0
c
0





a
1
b
1
c
0

平均数变动的因素分析
平均指标指数:


a

a

a
b
1
c
1
b
1
c
0
b
0
c
0

1
1
0

a
1
b
0
c
0





a
1
b
1
c
1


a b
1
c
0


结 构 指 标
水 平 指 标
xf

x 

f
频率(总体的结构)
编制平均指标指数 :


f
x

结构影响指数 : I
结构



1
f
1

f





 x




f


变量值(各组的水平)

0

fx

f
0
0
0



















f
f
x

x


固定构成指数 : I
固定





1
1
1
f
1
0
f
1
f
x

fx

可变构成指数 : I
可变




f
1
1
00
f
1
0
I
可变
 I
结构
 I
固定



f
1
x
1



f
1




f
0
x
0



f
0




fx
f



fx

f1
1
0
00
0

fx
f



fx

f
1
1
1
1
1< br>0

fx

f
1
1
1
fx



f
0
0
0


f1
x
0

f
0
x
0






f

f
01

fx



f
1
1


f
1
x
1

f
1
x
0






f

f
11






x
0
fx< br>


f
0
0
0
x

0< br>x
1
fx



f
1
1
1


x
1
x

x
1




x
0
x


x
0


x
1
 x
0
 x

 x
0
 x
1
 x



1) 两因素分析



x

x
1
11
f
0
f
0



f
1
f
0

x
1
x
0

x


f1


x
0
f
0


f
1


f
0

x
0


f
1


x
1
x
0

2. 指数体系:



xf

xf
11
00
f



f
1

x

x
1






x
0
x


0

10
0

xf

xf



f

f

x

< br>f

x
1100
1

x
0
< br>

f
1
x
1


f
1< br>x
0



3.建立平均指标指数体系 :
x
0
fx



f
0
00
x

fx



f
1
10
x< br>1
fx



f
1




11
x
1
x
0

x

x
0

x
1
x

x
1
 x
0
 x

 x
0
 x
1
 x


第10章














时 间 数 列
时 期



每天资料





持续天内
序 时 平 均 数
y
1
y
2


y
n
1
y

y
i
nn

y
1
f
1
y
2
f
2


y
n
f
n
y

f
1
f
2


f
n

指标不变




间 隔
相 等
间 隔
不 等
11
y
0
y
1


y
n1
y
n
2
y
2

n
y
0
y
1
y
n1
y
n
y
1
y
2
f
1
f
2


 f
n
222
y

f
1
f
2


f
1
c 
a

b
相对数
平均数
a
c
b

3.1 增长量和平均增长量
增长量=报告期水平—基期水平

t
y
t
y
t1

逐期增长量
增长量

s
t
y
t
y
0

累计增长量



1. 累计增长量
t
2. 逐期增长量
相邻两期

s




y
t
y
n1



逐期增长量 ;

t
s
t
s
t1

累计增长量之差

平均增长量
— 逐期增长量的序时平均






环比增长量
环比增产量项数
累计增长量

期 数



t
n
s
n

n
y
n
y
0

n
y
n
y
0n


累计法(总和法)计算平均增长量
2

y1
y
2


y
n
ny
0

n

n1



3.2 发展速度与增长速度
报告期水平
发展速度100%

1. 发展速度:
基期水平
y
t



环比发展速度
y
t1


y
t
y
t
y
1
y
2




1

定基发展速度





环比发展速度
y
0
y
0
y
1
y
t1



发展速度



定基发展速度
y
t

y
0

2

环比发展速度=相邻定基发展速度的比
报告期增长量

2. 增长速度:
增长速度
基期水平





y
t
y
t
y
0

y
t1
y
t1
y
0
y
t
y
t1



环比




y
t1

增长速度

yy



定基


y


t0
0
增长速度  发展速度  1
发展速度  增长速度  1
1% 的绝对值 :

3. 增长
y
t
y
t1
y

逐 期 增 长 量
t1
增长 1%


增长 1% 绝对值
yy< br>
tt1
100
环比增长速度100
100
绝 对值
y
t1

3.3 平均发展速度和平均增长速度

平均增长速度 = 平均发展速度  1
(2)平均发展速度的计算方法:
n
yyyy
nn
几何平均法
b 
1

2


 
y
0
y
1
y
n1
y
0
n

n
n



环比发展速度

定基发展速度< /p>


高次方程法

y
0
 b b



  

b


< br>
y
2n
n
i1
i
b b    b =

2

n

y
i1
n
i
y
0

最小平方法(直线趋势)


如果将原数列的中间项作为原点,使

t = 0 ,则联立方程式可简化为下式



季节变动的测定方法
按月(季)平均法 第二步,计算各年所有月(季)的总平均数
第三步,计算季节比率 第四步,预测
































日本人口多少-有没有什么好听的歌


信仰的力量-我为你喝彩


北京龙庆峡-合家团圆


文科大学排名-什么是人生


湖北郧阳医学院-国际睡眠日


有机化学方程式-英语四级范文


圆周运动公式-班级班规


潘镜丞-仿佛的近义词是什么