科研统计助手
医学科研资讯
前沿热点动态
统计分析服务
当前位置: 菁英统计工作室 > 统计知识 > 软件技巧 > SAS应用 > 正文
利用SAS/PRO SUMMARY对数据库进行查重
作者:Admin  更新时间:2011-07-15 本条信息浏览人次共有

SAS中sort过程的选项nodup和nodupkey非常好用,nodup对数据库中整条记录相同做删除,nodupkey对by变量相同的记录做删除。均可以把做删除后的记录输出(out选项)到一个数据集中。

但是,如果就想看一下哪些整条记录相同,或者按某几个变量查是相同的,sort过程似乎就不能解决这个问题了。此时,proc summary该闪亮登场了!

看下面的程序:

data b;
input id $ a b c;
cards;
001 1 
20
002 2 
18
003 3 
35
004 4 
40
002 2 
27
006 5 
40
004 4 
60
;
run;
proc summary data=b nway;
class id a b;
output out=c (drop=_type_ 
where=(_freq_>1));
run;
proc print data=c;
run;

结果如下:

                                Obs    id         _FREQ_

                                    002           2
 
                                   004           2
有没有表达清楚呢?

如果还没有,请再看以下程序及结果吧:

程序:

proc sort data=b nodupkey out=d;
by id a b;
run;
proc print data=d;
run;

结果:

                                  Obs    id          c

                                      001        20
 
                                     002        18
 
                                     003        35
 
                                     004        40
 
                                     006        40

OK,就暂到此啦!Good luck!

 

 

 

上一篇:多个率比较的SAS编程实现
下一篇:sas数据读入的几种方式及比较

本站所发表的文章,大部分严格筛选,来源于各相关专业论坛或专业网站,内容仅供大家学习和参阅尊重原作者版权,勿用于商业用途,转载请注明来源。如有学术争议的文章,或可能与事实不符的,与本站立场无关。如有影响到您权益的文章,请及时通知本站,本站立即删除。谢谢监督。
推荐阅读
 
热门文章

Copyright 2010 Powered By 菁英统计工作室 www.tjstat.com 地址1:武汉市珞瑜路1037号 430074 ; 地址2:武汉市航空路13号 430030
邮箱:tjstat@126.com QQ: 点击这里给我发消息 点击这里给我发消息
鄂ICP备10020011号 |