常用统计方法选择
变量的个数:1个
变量类型
连续变量(如年龄)
正态分布
–
单样本t检验
非正态分布
–
单样本非参数检验
分类变量(如性别)
–
单样本卡方检验
变量的个数:2个
变量类型
两个变量均为连续变量(如年龄)
两个变量均为正态分布
–
pearson相关分析或线性回归分析
至少一个为非正态分布
–
Spearman相关分析或正态转换后使用pearson相关分析或线性回归分析
两个变量均为分类变量(如性别)
两个变量均为二分类(如性别)
–
Pearson卡方检验或Fisher精确概率检验
两个变量均为多分类(如学历、民族)
两个变量均为有序变量(如学历)
–
Spearman相关分析
两个变量均为无序变量(如民族)
–
Pearson卡方检验或Fisher精确概率检验,如需要各组间比较,可用卡方分割检验并对α进行校正
一个变量为有序变量,一个为无序变量
–
独立样本非参数检验
一个变量为二分类,一个为多分类
多分类变量有序
–
趋势卡方检验或非参数检验
多分类变量无序
–
Pearson卡方检验或Fisher精确概率检验,如需要各组间比较,可用卡方分割检验并对α进行校正
一个变量是连续变量,一个变量是分类变量
分类变量为二分类变量
正态分布
–
两独立样本t检验
非正态分布
–
两独立样本非参数检验
无序多分类变量
正态分布
–
单因素方差分析(ANOVA)
非正态分布
–
非参数检验
有序多分类变量
–
spearman相关分析
变量的个数:3个
分因变量和自变量
因变量(y)的个数:1 个
分类变量
二分类变量
–
二元logistic回归(配对资料选用条件logistic回归分析)、泊松回归、log-binomial回归分析和决策树
无序多分类变量
–
多项logistic回归分析
有序多分类变量
–
有序logistic回归分析
连续变量
自变量(x)的变量类型:含有分类变量
–
协方差分析或者多重线性回归分析
自变量(x)的变量类型:均为连续变量
有重复测量
–
重复测量方差分析
无重复测量
自变量有共线性
–
岭回归分析、或者进行主成分分析、因子分析后再进行多重线性回归分析
自变量无共线性
–
多重线性回归分析
因变量(y)的个数:多个
–
多元线性模型、结构方程模型
无因变量、自变量之分
研究关联
–
关联分析(典则相关)、相关阵、偏相关阵、聚类分析
研究潜在维度(降维)
–
主成分分析或因子分析