这两天做项目分析用到了GLMM模型,由于不明白GLMM和我之前学习的线性回归模型有啥区别,就差了点相关资料,今天汇总一下吧。
线性回归 --> 线性混合效应模型
我们知道,线性效应模型通常会将因变量\(Y\)分解成固定效应和误差项,比如:\(Y = \beta X + \epsilon\),在这里所有不感兴趣、非系统性或不可测的因素都可以作为误差项。
但是线性模型要求每个样本之间互相独立(还要求数据满足多元正态分布),而在分析时往往会出现时间相关或者空间相关的样本,因此人们就在线性回归模型的基础上建立了线性混合模型,所谓“混合”就是将固定效应与随机效应进行混合了的意思,形如:
\(Y = \beta X + Zr + \epsilon\)
模型中多出来的\(Zr\)便是随机效应。
这种随机效应的表达是是这样式儿的:\(express | factor\),其中express是随机斜率,factor是随机截距。
那什么因素可以作为随机效应放入模型中呢?其实吧,那些具有某种相关性的因素,也就是使样本之间不互相独立的那种因素我觉得就可以作为随机效应。比如说,同一个体在多个时间点上多次采样的样本,就可以把时间放入固定效应,把个体放入随机效应。
另外就是,如果把个体当做随机因素,由于个体有\(N\)个水平,因此会产生\(N\)个截距值。
作者:3between7
链接:https://www.jianshu.com/p/0db4985b299f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。