线性回归与相关分析
3/20/2018
1
1 直线相关
语句格式
proc corr [选项]
[var 变量名列] 可选语句,定义相关分析的变量
[freq 变量名] 可选语句,定义频数变量
proc corr 的[选项]
data=数据集名指定要分析的数据集名
spearman 要求计算spearman等级相关
3/20/2018
2
data corr1;
input x y f @@;
cards;
65 1 55 1 65 1
85 2 95 1 65 2
75 4 85 2 95 2
65 3 75 1 85 3
95 1 115 1 75 1
85 2 95 3 105 1
85 1 95 2 105 2
75 1 95 1 105 1
;
proc corr;
Var x y;
freq f; run;
3/20/2018
3
Correlation Analysis
2 'VAR' Variables: X Y
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
变量名例数均数标准差总和最小值最大值
X 40
Y 40
Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0
/ N = 40 / FREQ Var = F ρ=0
X Y
X X、Y相关系数
ρ=0 的P值
Y
3/20/2018
4
2 Spearman等级相关
等级相关属于非参数统计方法,适用于资料不呈双变量正态分布或总体分布未知,数据一端或两端有不确定值的资料或等级资料。
式中d为每对观察值所对应的秩次之差;n为对子数
语句格式:proc corr spearman;
例13-3 某血吸虫病防治站调查10个公社的钉螺密度(只/m2)与居民血吸虫病感染率(%)的相关关系,。
3/20/2018
5
data spearman;
input x y @@;
cards;
33 17 52 24 22 13 42 27 35 19
49 23 31 18 39 18 45 24 43 20
;
proc corr spearman;
var x y;
run;
3/20/2018
6
Correlation Analysis
2 'VAR' Variables: X Y
Simple Statistics
Variable N Mean Std Dev Median Minimum Maximum
X 10
Y 10
Spearman Correlation Coefficients /
Prob > |R| under Ho: Rho=0 / N = 10
X Y
X 相关系数rs
P值
Y
3/20/2018
7
Proc plot [选项];绘制散点图
常用的[选项]有:
data=数据集名;
plot <纵坐标变量*横坐标变量[=‘绘图符号’]>;
要求该过程作散点图。绘图符号选项可定义散点图中的点的标记,如plot y*x=‘*’,则每个点以“*”表示。
3/20/2018
8
Plot
Proc plot[选择项];
by 变量;
plot 绘制图表达式/选择项;
Plot过程至少一个plot,每个plot 语句可以有多个绘制图表达式
3/20/2018
9
Proc plot语句选择项
data=sas数据集
uniform 与by语句有关,要求by组的坐标刻度相同,于是可直接比较by变量不同水平的图表。
vtoh=值指示plot过程输出时纵横坐标的比例。
vper
直线相关与回归sas 来自淘豆网www.taodocs.com转载请标明出处.