第 21 章 功效分析

CRAN 上有很多功效计算和分析的 R 包,我们针对不同的混合效应模型和统计检验,提供对应的 R 实现。

MKpower 包提供 Welch 和 Hsu(许宝騄)t 检验、Wilcoxon 秩和检验、符号秩检验的功效分析和样本量计算,经验功效和第一类错误的计算方法是蒙特卡罗模拟。Superpower 基于模拟的方法分析三因素方差分析实验设计的功效,开发者写了本书介绍,详见 https://aaroncaldwell.us/SuperpowerBook/,也开发了两个 Shiny 应用。powerlmm 可用于计算两、三个水平的纵向多水平/线性混合效应模型的功效。pwrAB Welch 两样本 t 检验的功效分析,常用于 A/B 测试。Metin Bulus 开发 PowerUpR 计算响应变量是连续型的多水平随机对照实验统计功效,最小可检测的效应大小,最小样本量要求。simr 通过模拟方法分析广义线性混合效应模型的功效。WebPower 提供相关性、比例、t 检验、单因素方差分析、两因素方差分析、线性回归、逻辑回归、泊松回归、纵向数据分析、结构方程模型和多水平模型等的功效分析,详见网站 https://webpower.psychstat.org/,包含书籍和功效分析的工具。PowerAnalysisIL 功效分析的 shiny 应用 http://daniellakens.blogspot.com/2015/01/always-use-welchs-t-test-instead-of.html

此外,还有 lmerTest (Kuznetsova, Brockhoff, and Christensen 2017) 和 lmtest (Zeileis and Hothorn 2002)。 试验设计 (茆诗松, 周纪芗, and 陈颖 2004) 可以视为一种组织形式,包括各类检验, R 语言实战 (Kabacoff 2015) 作者 Robert I. Kabacoff 创建了网站 Quick-R,实战这本书第 10 章功效分析主要基于 pwr 包来介绍,Jacob Cohen 的著作《Statistical Power Analysis for the Behavioral Sciences》第二版 (Cohen 1988)

https://powerandsamplesize.com/ 功效和样本量计算器

library(pwr)
library(Matrix)
library(lme4)

pbkrtest 提供 parametric bootstrap test、Kenward-Roger-type F-test、Satterthwaite-type F-test 用于线性混合效应模型,parametric bootstrap test 用于广义线性混合效应模型

参考文献

Cohen, Jacob. 1988. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum Associates. https://www.utstat.toronto.edu/~brunner/oldclass/378f16/readings/CohenPower.pdf.
Kabacoff, Robert I. 2015. R in Action: Data Analysis and Graphics with r. 2nd ed. Shelter Island, NY: Manning PUblications Co. https://github.com/kabacoff/RiA2.
Kuznetsova, Alexandra, Per B. Brockhoff, and Rune H. B. Christensen. 2017. lmerTest Package: Tests in Linear Mixed Effects Models.” Journal of Statistical Software 82 (13): 1–26. https://doi.org/10.18637/jss.v082.i13.
Zeileis, Achim, and Torsten Hothorn. 2002. “Diagnostic Checking in Regression Relationships.” R News 2 (3): 7–10. https://CRAN.R-project.org/doc/Rnews/.
茆诗松, 周纪芗, and 陈颖. 2004. 试验设计. 1st ed. 北京: 中国统计出版社.