科研统计助手
医学科研资讯
前沿热点动态
统计分析服务
当前位置: 菁英统计工作室 > 统计知识 > 软件技巧 > SAS应用 > 正文
多个率比较的SAS编程实现
作者:Admin  更新时间:2012-02-10  来源 圣才学习网 本条信息浏览人次共有

 

   两个率或多个率的比较,我们非常熟悉的就是采用卡方检验的方法。除此之外,在特定条件下还可根据正态近似的原则采用u检验的方法进行分析。在SAS中,卡方检验的功能包含在freq过程之中,下面我们先熟悉一下freq过程的基本内容和功能。
  一、freq过程的语句和功能
  freq过程包含在SAS的BASE模块中,它可以执行描述性统计以及假设检验的功能,能产生从1维到n维的表格,即频数表以及列联表。对于单因素的频数表,freq过程可以进行比率之间的比较;对于列联表资料(两个或更多因素),它可以对两因素间的关系进行统计学推断,必要时可以按照某些因素进行分层分析。对于两因素关系的统计学分析,freq过程不仅可以检验关系的存在与否,还可以给出这种关系的强度。
  下表(表5.1)是freq过程对于列联表资料可以进行的分析以及计算的统计量。
  表5.1
卡方检验;
关联性的推断及其强度测量;
2×2表资料危险度计算以及危险度差别的检验;
2×2表资料OR值以及相对危险度的计算;
趋势检验;
一致性检验;
Cochran-Mantel-Haenszel 统计量计算。
  1.freq过程的一般格式
  freq过程的一般格式如下所示。
PROC FREQ <选项列表>;
  变量名
  变量名-n>
  ;
 EXACT 统计量关键字</ 选项列表>;
 OUTPUT 统计量
 TABLES 因素表达式</ 选项列表>;
 TEST 统计量关键字;
 WEIGHT 变量名;
RUN;
QUIT;
  表面上看起来freq过程的语句并不复杂,但它可实现很多复杂的功能。下面就freq过程中特有的语句和选项加以简要说明。
  2.freq过程中各语句及选项的格式及功能
  2.1 proc freq语句用以调用freq过程,标志freq过程的开始,其后的选项除和其它过程相同的一般性的控制功能外,没有什么特别之处,我们一般也不太用到。
  2.2 by语句和以前的内容完全相同,这里不再说明。
  2.3 Exact语句用以控制对精确概率的计算以及对指定统计量进行可信限估计。对于以下假设检验,freq过程可以计算其精确P值:拟合优度卡方检验(chi-square goodness-of-fit)、Pearson卡方检验(Pearson chi-square)、似然比卡方检验(likelihood-ratio chi-square)、Mantel-Haenszel卡方检验(Mantel-Haenszel chi-square)、Fisher’s确切概率检验(Fisher's exact test)、Jonckheere-Terpstra检验(Jonckheere-Terpstra test)、Cochran-Armitage 趋势检验(Cochran-Armitage test for trend)以及McNemar's检验(McNemar's test for two-way tables)
  2.4 Output语句大家已很熟悉,它用于将结果数据输出到指定的数据集。
  2.5 Tables语句在freq过程中算是非常关键的语句,它用以指定所要分析的因素如何构成列联表,并在选项中指定所要计算的统计量。其中的因素表达式就是列联表的构成方式,如果只有一个因素,就将该因素的变量名作为表达式;如果因素有两个或以上,各因素之间以星号——“*”相连。这里大家要明确一点,SAS对于两个以上因素组成的表达式,将排在最后的两个变量作为列联表的行和列,而其它排在前面的因素则作为分层因素对待。比如对于表达式:A*B*C*D,SAS绘制出k(等于A、B两因素水平数的乘积)个交叉表,表格的行因素为C,列因素为D。
  在同一个tables语句中,你可以指定多个因素表达式以完成多个交叉表的绘制。灵活运用圆括号的分组语法可达到此目的,具体方法如以下表格(表5.2)中显示的例子。
  表5.2 多表格表达式示例
表达式
等同表达式
tables a*(b c);
tables a*b a*c;
tables (a b)*(c d);
tables a*c b*c a*d b*d;
tables (a b c)*d;
tables a*d b*d c*d;
tables a--c;
tables a b c;
tables (a--c)*d;
tables a*d b*d c*d;
 
Tables语句的选项主要用以指定所要进行的具体统计分析方式,如:agree、all、chisq、alpha、fisher、trend等等,分别指定SAS进行不同的统计计算。
  2.6 test语句用以指定SAS对给定的统计量进行近似检验,此语句的有效性需要相应的tables语句选项来保证。
  2.7 weight语句以前已经讨论过,这里的完全一样。
上一篇:[SAS应用]
下一篇:利用SAS/PRO SUMMARY对数据库进行查重

本站所发表的文章,大部分严格筛选,来源于各相关专业论坛或专业网站,内容仅供大家学习和参阅尊重原作者版权,勿用于商业用途,转载请注明来源。如有学术争议的文章,或可能与事实不符的,与本站立场无关。如有影响到您权益的文章,请及时通知本站,本站立即删除。谢谢监督。
推荐阅读
 
热门文章

Copyright 2010 Powered By 菁英统计工作室 www.tjstat.com 地址1:武汉市珞瑜路1037号 430074 ; 地址2:武汉市航空路13号 430030
邮箱:tjstat@126.com QQ: 点击这里给我发消息 点击这里给我发消息
鄂ICP备10020011号 |