系统评估--确定指标权重(II)
指标权重是从事科学研究实践中多因素、多水平分析的一个值得十分重视的关键问题。指标权重是某被测对象各个考察指标在整体中价值的高低和相对重要的程度以及所占比例的大小量化值。按统计学原理,将某事物所含各个指标权重之和视为1(即100%)、而其中每个指标的权重则用小数表示,称为“权重系数”。这里介绍几种权重计算方法,并且依据其原理进行分类,对方法所需的数据格式、指标结果解读进行介绍。另外针对一些常见问题:如多级权重如何计算?用多种方法计算得到的权重如何合并为综合权重用于之后的分析?
一、权重确定方法分类
权重计算的确定方法在综合评价中重中之重,不同的方法对应的计算原理并不相同。在实际分析过程中,应结合数据特征及专业知识选择适合的权重计算。
下面介绍的权重方法,共8种按照计算原理可分成四类。
- 第一类为AHP层次法和优序图法;此类方法利用数字的相对大小信息进行权重计算;此类方法为主观赋值法,通常需要由专家打分或通过问卷调研的方式,得到各指标重要性的打分情况,得分越高,指标权重越大。
此类方法适合于多种领域。比如想构建一个员工绩效评价体系,指标包括工作态度、学习能力、工作能力、团队协作。通过专家打分计算权重,得到每个指标的权重,并代入员工数据,即可得到每个员工的综合得分情况。
- 第二类为熵值法(熵权法);此类方法利用数据熵值信息即信息量大小进行权重计算。此类方法适用于数据之间有波动,同时会将数据波动作为一种信息的方法。
比如收集各地区的某年份的经济指标数据,包括产品销售率(X1)、资金利润率(X2)、成本费用利润率(X3)、劳动生产率(X4)、流动资金周转次数(X5),用熵值法计算出各指标权重,再对各地区经济效益进行比较。
- 第三类为CRITIC、独立性权重和信息量权重;此类方法主要是利用数据的波动性或者数据之间的相关关系情况进行权重计算。
比如研究利用某省医院2011年共计5个科室的数据指标(共计6个指标数据)进行CRITIC权重计算,最终可得到出院人数、入出院诊断符合率、治疗有效率、平均床位使用率、病床周转次数、出院者平均住院日这6个指标的权重。如果希望针对各个科室进行计算综合得分,那么可以直接将权重与自身的数据进行相乘累加即可,分值越高代表该科室评价越高。
- 第四类为因子分析和主成分法;此类方法利用了数据的信息浓缩原理,利用方差解释率进行权重计算。
比如对30个地区的经济发展情况的8项指标作主成分分析,主成分分析法可以将8个指标浓缩为几个综合指标(主成分),用这些指标(主成分)反映原来指标的信息,同时利用方差解释率得出各个主成分的权重。
二、AHP层次分析法
2.1 方法原理及适用场景
AHP层次分析法是一种定性和定量的计算权重的研究方法,采用两两比较的方法,建立矩阵,利用了数字大小的相对性,数字越大越重要权重会越高的原理,最终计算得到每个因素的重要性。
适用场景:层次分析法适用于有多个层次的综合评价中。
AHP层次分析法一般用于专家打分,让多位专家对比两两指标,根据相对重要性的打分判断矩阵,然后进行汇总(一般是去掉最大值和最小值,然后计算平均值得到最终的判断矩阵),最终计算得到各因素的权重。首先用户需要构建判断矩阵,将专家打分结果填入判断矩阵中。
2.2 数据格式
依次将所有打分结果数值代入判断矩阵,即可计算权重及一致性检验结果。
2.3 结果解读
通过一致性检验,说明计算所得权重具有一致性,即可得到最终权重值。如果未通过一致性检验,则需要检查是否存在逻辑问题等,重新录入判断矩阵进行分析。
- 如果计算二级权重或准则层权重?
当有多层级指标时,不论是准测层,还是方案层,计算权重的方法均一致,准测层单独录入判断矩阵进行计算权重即可。如果准测层和方案层均均测量了权重,可以手工进行相乘计算得到各方案层最终的权重值。 - 问卷数据如何使用AHP层次分析计算权重?
如果是问卷数据可以使用SPSSAU【问卷研究--权重】里的AHP权重进行分析。SPSSAU默认自动构建判断矩阵,并计算权重。
三、优序图法
3.1 方法原理及适用场景
优序图法同样是利用了数字大小的相对性,数据上为专家针对各个指标进行大分析。优序图算法上会对指标先进行平均值计算,然后对两两指标进行比较,若指标A比指标B重要,则A得1分;若同等重要,则A得0.5分;若指标B比指标A重要,则A得0分。
适用场景:优序图的计算简单,容易操作,适合有较多指标时使用。
3.2 数据格式
使用优序图计算权重时,需将数据整理为以下格式:
3.3 结果解读
优序图权重表构建方式为:
第一:计算出各分析项的平均值,接着利用平均值大小进行两两对比;
第二:平均值相对更大时计为1分,相对更小时计为0分,平均值完全相等时计为0.5分;
第三:平均值越大意味着重要性越高(请确保是此类数据),权重也会越高。
四、 熵值法
4.1 方法原理及适用场景
熵值法属于一种客观赋值法,其利用数据携带的信息量大小计算权重,得到较为客观的指标权重。熵值是不确定性的一种度量,熵越小,数据携带的信息量越大,权重越大;相反熵越大,信息量越小,权重越小。
适用场景:熵值法广泛应用于各个领域,对于普通问卷数据(截面数据)或面板数据均可计算。在实际研究中,通常情况下是与其他权重计算方法配合使用,如先进行因子或主成分分析得到因子或主成分的权重,即得到高维度的权重,然后再使用熵值法进行计算,想得到具体各项的权重。
4.2 数据格式
使用熵值法计算权重时,需将数据整理为以下格式:
4.3 结果解读
五、 CRITIC权重
5.1 方法原理及适用场景
CRITIC权重法是一种客观赋权法。其思想在于用于两项指标,分别是对比强度和冲突性指标。对比强度使用标准差进行表示,如果数据标准差越大说明波动越大,权重会越高;冲突性使用相关系数进行表示,如果指标之间的相关系数值越大,说明冲突性越小,那么其权重也就越低。权重计算时,对比强度与冲突性指标相乘,并且进行归一化处理,即得到最终的权重。
适用场景:CRITIC权重综合考虑了数据波动情况和指标间的相关性,因此,CRITIC权重法适用于这样一类数据,即数据稳定性可视作一种信息,并且分析的指标或因素之间有着一定的关联关系时。比如医院里面的指标:出院人数、入出院诊断符合率、治疗有效率、平均床位使用率、病床周转次数共5个指标;此5个指标的稳定性是一种信息,而且此5个指标之间本身就可能有着相关性。因此CRITIC权重法刚好利用数据的波动性(对比强度)和相关性(冲突性)进行权重计算。
5.2 数据格式
使用CRITIC权重计算权重时,需将数据整理为以下格式:
5.3 结果解读
建议在分析前需要对数据量纲化处理,以便统一数据的单位,避免量纲问题带来的干扰。但是并不建议标准化这种处理方式,原因在于标准化后所有指标的标准差都为1,导致指标变异性全部一致。
六、 独立性权重
6.1 方法原理及适用场景
独立性权重是一种仅考虑指标相关性的权重计算方法,其思想在于利用指标之间的共线性强弱来确定权重。
适用场景:适合指标间本身带有一定的相关性的数据。
6.2 数据格式
使用独立性权重计算权重时,需将数据整理为以下格式:
1个指标占用1列数据。下图中样本编号只是个编号无实际意义,用于标识下样本的ID号,分析时并不需要使用。
6.3 结果解读
七、 信息量权重
7.1 方法原理及适用场景
信息量权重是一种仅考虑指标变异程度的权重计算方法,变异系数越大,说明其携带的信息越大,因此权重也会越大。
7.2 数据格式
使用信息量权重计算权重时,需将数据整理为以下格式:
7.3 结果解读
八、 主成分分析
8.1 方法原理及适用场景
主成分分析是对数据进行浓缩,将多个指标浓缩成为几个彼此不相关的概括性指标(主成分),从而达到降维的目的。主成分分析可同时计算主成分权重及指标权重。
8.2 方差解释率的计算
如果计算主成分权重,需要用到方差解释率。具体加权处理方法为:方差解释率除累积方差解释率。
第一:计算线性组合系数矩阵,公式为:loading矩阵/Sqrt(特征根),即载荷系数除以对应特征根的平方根;
第二:计算综合得分系数,公式为:累积(线性组合系数*方差解释率)/累积方差解释率,即上一步中得到的线性组合系数分别与方差解释率相乘后累加,并且除以累积方差解释率;
第三:计算权重,将综合得分系数进行归一化处理即得到各指标权重值。
九、因子分析
9.1 方法原理及适用场景
因子分析与主成分分析计算权重的原理基本一致,区别在于因子分析加带了‘旋转’的功能‘,旋转’功能可以让因子更具有解释意义,如果希望提取出的因子具有可解释性,一般使用因子分析法更多;并非说主成分出来的结果就完全没有可解释性,只是有时候其解释性相对较差而已,但其计算更快,因而受到广泛的应用。
9.2 如何计算因子权重?
在计算各因子权重时,使用到的是旋转后的方差解释率进行计算。具体加权处理方法为:旋转后方差解释率除累积方差解释率。计算指标权重时,其步骤与主成分分析计算指标权重步骤均一致,只是在第二步计算综合得分系数,使用的是旋转后的方差解释率。
十、权重计算的常见问题
10.1 多种权重计算方法组合使用,如何得到综合权重?
每种权重计算方法都有其适用范围,有时候往往需要采用多种方法测量同一份数据的权重,这样得到综合权重性能更高,更加能反映出数据的真实特征。比如同时使用熵值法和AHP法, AHP法能够体现专家对不同指标的经验,熵值法可以反映出数据本身提供的信息量特征,两者结合使用不仅可以减少AHP法赋权的主观性,也会减少数据变化导致权重的波动。
- 第一种情况:两种权重计算方法原理相同,属于同一类方法。
此时可计算平均值,所得结果即为综合权重。例如AHP层次分析法和优序图法,都属于主观赋值法,利用数字大小计算权重,此时可计算两者均值作为综合权重。
比如A1指标的综合权重为0.15,即(0.1+0.2)/2=0.15。
- 第二种情况:两种权重采用的计算原理不相同,利用的数据特征也不一致。
例如用熵值法和AHP法计算权重,一个是主观赋值权重,一个是客观赋值权重。将2种方法结合使得到的数据更加能反映实际情况。公式如下,即(\(A*B\)的求和)。A、B为2种方法求得的权重。
10.2 多层级权重如何计算?
在多层次综合评价研究中,不光需要计算方案层权重,还有准则层权重。那么应该如何计算呢?不论是准测层,还是方案层一般均需要测量权重。然后再手工进行相乘计算得到各方案层最终的权重值。
比如,有上面研究需要构建员工绩效评价体系,设计了如上图的评价指标体系,并通过专家打分收集数据。现需要通过AHP法计算各级权重,并使用该评价体系计算每个员工的综合得分情况。
不仅AHP法是这样计算权重,其他方法也同样如此。有一些常用的权重计算方法的搭配组合,比如AHP与熵值法,主成分与熵值法等,AHP或主成分法可能作为一级指标权重的方法。熵值法作为二级指标权重的方法。
这样的组合权重,分析时依然是分别得到一级权重和二级权重,再将一级权重、二级权重相乘,得到可用于分析计算的各指标权重。
总结
任何综合评价系统,都必须确定评价指标的权重。当专家无法凭经验确定指标权重时,如何寻求确定指标权重的客观性标准,是一个既重要又令人困惑的问题。权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。我们常说的权重其实是搜索排序的决策因子。做电商,客服、发货、售后等工作相对都好解决,让大家觉得困难的在于获取流量,倘若有无穷无尽的流量,那么只需坐地数钱就好,想想都美滋滋。要想在平台内获取大量流量,就需要一个好的排名,而好的排名则离不开较高的权重。
参考文献
- SPSSAU_权重确定的方法汇总
- 指标权重确定方法及具体步骤介绍?
- 13种权重的计算方法
推荐阅读
-
系统评估--确定指标权重(II)
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为: