SBM 模型分析全过程

最编程 2024-04-19 14:46:13

...

数据包络分析DEA时，其研究投入产出效率情况，并且其假定投入和产出之间存在单调线性关系，其为一种线性规划技术来确定DMU相对效率的方法。但有时候会多出下‘非期望产出’，就是不希望有它产出，比如资金投入、教育投入换来了GDP上升和人口素质提升，但同时可能带来环境污染这个非期望产出项。在此种情况时，DEA模型则不满足单调线性关系要求。此时则需要使用非期望SBM模型，该模型由Tone(2001)提出。

非期望SBM模型（undesirable slacks-based measurement，Undesirable SBM）是DEA 衍生模型中的一种。相对传统 DEA 模型，非期望产出 SBM 模型不仅避免径向和角度度量引起的偏差，而且考虑生产过程中非期望产出因素的影响，更能反映效率评价的本质。

除此之外，效率值计算时会出现为1时无法对比，此时可使用超效率SBM模型进行分析，便于对决策单元DMU进行效率值对比排序等。

SBM模型案例

1 背景

当前有一项效率数据研究，DMU为中国31省市并且从2012~2021共计10年的数据，数据包括2个投入项，1个产出项和1个非期望产出项，如下：

GDP产出通常受到投资和消费的影响，因而将房地产投资金融与居民人均消费支出作为投入项，将人均GDP作为产出项，并且还有非期望产出项即二氧化硫排放量。研究数据从国家统计局官网下载并且整理得到，共计10年数据，因而在下述分析时可分别筛选出对应年份进行分析，本案例仅筛选出2021年数据进行分析。部分数据展示如下：

2 理论

SBM模型规划形式如下：

上式为BCC模型结构式，如果为CCR结构式，则没有这一限制条件。

上式中，代表决策单元的投入项，期望产出项和非期望产出项，分别表示投入、期望产出和非期望产出的松弛向量，λ为权重向量，模型中下标“0”为被评价单元。目标函数值ρ为制造业能源生态效率，其关于严格单调递减,其取值范围在0-1之间。

当ρ=1，均为0时，决策单元是有效率的；当ρ<1时,表明决策单元存在效率损失,有必要在投入产出上做出相应改进。

SBM模型可以设定投入导向、产出导向和非导向三种，投入导向是指在保证产出一定时,寻找最少的投入；产出导向是指在投入量一定时，寻找最大的产出；非导向是指同时从投入和产出角度进行测算，因而也被称作投入产出双向，SPSSAU默认提供为非导向类型，即同时从投入和产出角度进行测算。

除此之外，考虑非期望产出的SBM模型可能会出现多个决策同时有效情况即效率值均为1，从而不便于对这些决策单元进行区分和排序。若测算结果出现多个决策单元同时有效时，则需要使用非期望产出的Super-SBM模型予以解决，即在SPSSAU操作界面中打勾选中‘超效率’复选框。关于超效率SBM模型(Super-SBM)，其BCC规划形式如下：

上式为BCC模型结构式，如果为CCR结构式，则没有这一限制条件。

上述理论来源文献：李根, 刘家国, 李天琦. 考虑非期望产出的制造业能源生态效率地区差异研究——基于SBM和Tobit模型的两阶段分析[J]. 中国管理科学, 2019.

3 操作

本例子操作如下：

选择使用BCC模型，并且放入2个投入项、1个产出项，1个非期望产出项。与此同时，将省放入DMU框中。暂不进行‘超效率SBM’分析，如果需要，此时将‘超效率SBM’进行打勾即可。

与此同时，本案例数据为2012 ~ 2021共计10年数据，本案例仅针对2021年数据进行分析，因而先进行筛选后再分析，筛选如下图所示。

4 SPSSAU输出结果

SPSSAU共输出SBM模型效率值结果和效率值对比图形。如下说明：

5文字分析

从上表格可知：北京、内蒙古、上海、江苏和*共5省，它们的效率值均为1，意味着该5省的投入产出效率最优。与此同时，如果此时还想对比该5个省的效率值，则需要选择‘超效率SBM’复选框后重新分析。

上表格从第3列起，依次展示投入项、产出项、非期望产出项的变量Slack值。具体值的意义说明如下：如果投入项的松弛值>0表示投入需要减少量，如果产出项的松弛值>0表示产出需要增加量，如果非期望产出项的松弛值>0表示非期望产出需要减少量，具体以河北省为例：

河北省的效率值为0.2628意味着投入产出效率较低，‘房地产开发企业本年实际到位资金(亿元)’这一投入项的松弛值为5872.5200>0，意味着需要减少房地产投资金额58772.52亿元才能明显提升效率；‘全体居民人均消费支出(元)’这一投入项的松弛值为4611，意味着如果想让效率值最优，需要减少人均居民消费支出4611元。除此之外，人均GDP松弛值为0.2605万，意味着人均GDP提升0.2605万时可达效率最优。并且非期望产出项值为16.85>0，意味着也需要减少二氧化硫排放量16.85万吨才能让效率值最优。

特别提示：

在实际研究中可针对各DMU（本案例为31省）效率值进行分组，可分成几个组别进一步对比各DMU的投入产出效率情况。以及本案例数据为10年（但仅针对2021年数据进行分析），可多次筛选出不同年份数据进行分析，最后进行汇总和对比不同年份的效率值变化情况等。

上图直观展示各DMU的效率值数据，图中效率值与表格中效率值完全一致，仅为图示化展示。

6 剖析

涉及以下几个关键点，分别如下：

SBM模型时希望输出投入冗余率、产出不足率等信息?
SPSSAU默认输出投入项、产出项和非期望产出项对应的松弛变量Slack值，如果希望计算投入冗余率或者产出不足率，此时可将Slack值除以对应原始数据值，即得到相对率数据，投入项的Slack值除以投入量即为投入冗余率，产出项的Slack值除以产出量即为产出不足率。
超效率SBM模型的使用?
SBM模型时如果出现各DMU项的效率值均为最优即均为1的情况，此时则无法对比DMU的投入产出效率（因为均为1），此时可选中‘超效率SBM’复选框，即使用超效率SBM模型进行分析使用，超效率SBM模型仅针对SBM模型中效率值=1的项进行，因而在SBM模型中效率值<1的项时，各项输出结果不变化。
SBM模型时，BCC和CCR模型的选择？
相比CCR模型，BCC会多出lambda值=1的限制条件，通常情况下使用BCC模型，具体建议以文献为准。
SPSSAU中SBM模型的非负平移功能?
在SBM模型或者超效率SBM模型时，SPSSAU提供非负平移功能，其意义为如果某列（某指标）数据出现小于等于0，则让该列数据同时加上一个‘平移值’【该值为某列数据最小值的绝对值+0.01】，以便让数据全部都大于0。
SPSSAU进行SBM模型时出现null值？

规划求解计算时有可能出现无法计算的现象，此时建议更换模型，比如BCC模型与CCR模型的切换，也或者针对数据进行取对数后再次分析使用。

上一篇： Ubuntu 20.04 设置时区，配置 NTP 同步 timesyncd 而不是 ntpd

下一篇： CentOS 7 设置时间和日期

SBM 模型分析全过程

SBM模型案例

1 背景

2 理论

3 操作

4 SPSSAU输出结果

5文字分析

6 剖析

一篇了解文件上传全过程的文章（1.8W 字的深入分析，进阶必读）

分析分层模型、XHR、跨域

使用 pytorch 构建 GAN 模型的评估 - 代码分析

深入探索 C++ 对象模型的数据成员访问效率分析 (3)

网络通信基础》难点分析 12：Linux epoll 模型

R 语言与 Garch 模型和回归模型对股价的分析--原文来源：顶端数据部落公众号

数学建模常用模型 10：数据包络（DEA）分析（投入产出法）

数学建模中的常用模型 (X)：数据包络（DEA）分析法

数据包络分析 - SBM 建模（第一部分）