欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

多层次建模 r 语言 多层次分析建模

最编程 2024-05-08 14:58:07
...


内容参考:Stata统计分析:社会科学应用指南  [挪]*玫赫梅托

1.数理基础

多水平回归模型所包含的两个水平的方程如下图所示,logistic则是基于线性回归原理的一种线性变换,公式如下:

多水平模型r语言 多水平分析模型_学习

多水平模型r语言 多水平分析模型_1024程序员节_02

 

 

检验多水平模型的适用性的关键数值为方差分解系数(variance partition coefficient,VPC,也被称为组内相关系数intraclass correlation coefficient,ICC),是用于来衡量第二水平变量对因变量方差变化的解释程度,以本研究为例,能够反映个体在省级层面的聚集性与相似性,计算公式如下图,当这个系数高于5%时,这种二层面的聚集性不应被忽略,应该使用多水平模型进行回归预测。参与具体公式如下:

多水平模型r语言 多水平分析模型_多水平模型r语言_03

 

多水平模型r语言 多水平分析模型_人工智能_04

 

由logistic回归的二项分布数理特征决定,多水平logistic组间差异系数的公式如下图所示:

多水平模型r语言 多水平分析模型_1024程序员节_05

 

2.多水平模型步骤

(1)空模型

空模型的公式为:

Yij = β0+u0j+eij

解释为:

因变量=总均值+水平2误差项+水平1误差项

因其报告了二水平的方差贡献(OLS)或组内相关系数rho(GLM),其主要作用是检验因变量是否需要使用多水平模型进行分析,对组内相关系数的分析上文已有说明。

(2)随机截距模型

在空模型基础上纳入水平1和水平2变量,公式如下图:

Yij = β0+β1X1ij+β2X2ij+β3X3ij+β4X4j+u0j+eij

其中:X1-X3都是水平1变量,X4为水平2变量。从这个模型中可以观察,水平2变量对因变量的解释的变化量 ,从而判断两者之间的关系。

(3)随机截距和随机斜率(系数)模型

同时,当个体因素对因变量的作用受其水平2变量的影响,就应该使用随机斜率(系数)模型,以本题而言,即个体能力层面对是否参与养老志愿服务的影响因其所在省份不同而存在差异,这时需要使用随机斜率模型,其公式为:

Yij = β0+β1X1ij+β2X2ij+β3X3ij+β4X4j+u0j+u1jX3ij+eij

      

其中u1j就是随机效应的部分。