stata:数据包络分析(DEA)简明教程
数据包络分析(DEA)是是由美国著名运筹学家 A.Charnes(查恩斯)、W.W.Cooper(库铂)、E.Rhodes(罗兹)于 1978 年首先提出,在相对效率评价概念基础上发展起来的一种非参数检验方法。此文章主要介绍如何在stata中进行DEA分析以及进行boostrap检验,用到的命令为tenonradial
,teradialbc
等。需要说明的是,尽管此命令的运算速度与矩阵的最大处理量要优于dea
命令,但是其仍有一些限制。
DEA模型简介
技术效率的概念
在数据包络分析中,技术效率是指一个生产单元(DMU)的生产水平达到该行业技术水平的程度。技术效率可以从投入和产出两个角度来衡量,在投入既定的情况下,技术效率由产出最大化的程度来衡量。在产出既定的情况下,技术效率由投入最小化的程度来衡量。当然,在计算TFP的过程中,一般都是投入既定的。
下面举一个一种投入一种产出时的例子,来帮助我们理解技术效率的概念。
单位 | x x x(投入) | y y y(产出) | y / x y/x y/x | y / x y/x y/x(标准化) |
---|---|---|---|---|
A | 2 | 1 | 0.5 | 0.625 |
B | 3 | 2 | 0.667 | 0.533 |
C | 4 | 3 | 0.75 | 0.938 |
D | 5 | 4 | 0.8 | 1.00 |
E | 5 | 2 | 0.4 | 0.5 |
在此表中,
y
/
x
y/x
y/x反应各个生产单元技术效率的高低,
y
/
x
y/x
y/x(标准化)是将各单元的
y
/
x
y/x
y/x除以其中的最大值。这样就是为了更好的比较这一数值。
当涉及多个产出时,就会对各个投入与产出赋予一定的权重,然后分别加权,计算产出投入比。如:
v
=
v
1
x
1
+
v
2
x
2
+
.
.
.
+
v
n
x
n
v = v_1x_1+v_2x_2+...+v_nx_n
v=v1x1+v2x2+...+vnxn
u
=
u
1
y
1
+
u
2
y
2
+
.
.
.
+
u
n
y
n
u=u_1y_1+u_2y_2+...+u_ny_n
u=u1y1+u2y2+...+unyn
则产出投入比为
u
/
v
u/v
u/v
数据包络分析就是在讨论如何通过数据本身来获得权重,从而计算各个DMU的技术效率。
径向距离模型
此命令径向效率的度量方法采用的是Debreu–Farrell(Debreu 1951; Farrell 1957)方法。假设有
k
k
k个
D
M
U
DMU
DMU。对于
D
M
U
K
DMU_K
DMUK,有
N
N
N种投入,记为
x
k
=
(
x
k
1
,
.
.
.
,
x
k
N
)
∈
R
N
x_k =(x_{k1},...,x_{kN}) \in R^N
xk=(xk1,...,xkN)∈RN,有
M
M
M种产出,记为
y
k
=
(
x
k
1
,
.
.
.
,
x
k
M
)
∈
R
M
y_k =(x_{k1},...,x_{kM}) \in R^M
yk=(xk1,...,xkM)∈RM。然后我们假设在技术条件
T
T
T下产出
y
y
y由投入
x
x
x产出,数学表达为:
T
=
{
(
x
,
y
)
:
y
a
r
e
p
r
o
d
u
c
i
b
l
e
b
y
x
}
T = \{(x,y):y\ are\ producible\ by\ x\}
T={(x,y):y are producible by x}
那么在科技
T
T
T下,生产可能集表示为:
P
(
x
)
=
{
y
:
(
x
,
y
)
∈
T
}
P(x) = \{y:(x,y) \in T\}
P(x)={y:(x,y)∈T}
投入的需求集表示为:
P
(
y
)
=
{
x
:
(
x
,
y
)
∈
T
}
P(y) = \{x:(x,y) \in T\}
P(y)={x:(x,y)∈T}
以生产可能集为例,技术效率就表示为,某个给定数据点与生产可能集边界的距离。若以DEA模型来测量此种技术效率从,则对于
k
k
k个
D
M
U
DMU
DMU,每个
D
M
U
DMU
DMU有
N
N
N种投入,
M
M
M种产出的数据集来说。Debreu–Farrell(Debreu 1951; Farrell 1957)的以产出为导向的估计方法,可以通过下述线性规的方程式来表示,对于每一个数据点
k
(
k
=
1
,
2
,
3...
K
)
k(k= 1,2,3...K)
k(k=1,2,3...K)
F
k
o
(
y
k
,
x
k
,
y
,
x
∣
C
R
S
)
=
m
a
x
θ
s
.
t
.
∑
k
=
1
K
z
k
y
k
m
≥
y
k
m
θ
m
,
m
=
1
,
.
.
.
,
M
∑
k
=
1
K
z
k
x
k
n
≤
x
k
n
θ
n
,
n
=
1
,
.
.
.
,
N
z
k
≥
0
F_k^o(y_k,x_k,y,x|CRS)=max\theta \\ s.t. \sum_{k=1}^Kz_ky_{km} \geq y_{km}\theta_m,m=1,...,M \\ \sum_{k=1}^Kz_kx_{kn} \leq x_{kn}\theta_n,n=1,...,N \\ z_k \geq 0
Fko(yk,xk,y,x∣CRS)=maxθs.t.k=1∑Kzkykm≥ykmθm,m=1,...,Mk=1∑Kzkxkn≤xknθn,n=1,...,Nzk≥0
其中
y
y
y是一个
K
×
M
K\times M
K×M的产出矩阵,
x
x
x是一个
K
×
N
K\times N
K×N的投入矩阵。估计
P
(
x
)
P(x)
P(x)是最小
上一篇: 准备数学建模 23 - 数据包络分析
下一篇: 常用数据分析方法