科研统计助手
医学科研资讯
前沿热点动态
统计分析服务
当前位置: 菁英统计工作室 > 统计知识 > 软件技巧 > 专用软件 > 正文
Shesis软件使用说明
作者:tjstat  更新时间:2010-08-22  来源 小木虫 本条信息浏览人次共有

 


1
. Choose the analysis you need,选择你所需要的分析种类,一共有3种:

I Single site analysis 也就是对每个位点进行分析,主要是进行等位基因频率,基因型频率的统计,以及针对等位基因和基因型分别进行case组和control组的卡方检测和odds ratio的计算,最后当然也会分别对case组和control组进行HWE的检测。

II Pair-loci D’/r2 value 选择了这个选项后,软件会对输入的所有位点进行两两的D’和r2的计算。比如说输入了3个位点的数据,那么就会进行12,13和23这三种组合的计算。D’和r2都是用来对位点间LD紧密程度进行度量的两个值。

III Haplotype analysis 选择了这个选项的话,就可以对单倍型进行分析了。分析结果包括这些位点形成了哪些单倍型,每个单倍型的频率,以及单倍型频率在case和control中的分布是否有差异。这时候软件会为每种单倍型都给出一个p值,这个值代表这种单倍型是否在分组中有差异,另外还会给出一个总的p值,这个值是对所有单倍型综合考察后得出的。最后也会给出odds ratio的值。

以上3项至少选1项,可以3项都选。

2. Number of sites 这里输入你所需要分析的位点数,不要输错哦。

3. Selected sites for haplotype analysis 在这里你可以通过输入一个字符串来选择对哪些位点进行单倍型分析,比如你输入了4个位点的数据,但是你只想分析第一,第二,第四个位点形成的单倍型的情况,那么你可以输入1 1 0 1,这样的话第三个位点就不会被分析了。如果不输入,默认是所有位点都分析。

4. Calculate linkage disequilibrium in 这个下拉菜单可以让你选择在计算LD的时候,是只在case中或者control中计算还是全都计算。

5. Lowest frequency threshold (LFT) for haplotype analysis 在进行单倍型分析的时候,有些单倍型的频率非常低,这样的话有可能只在case或者只在control中存在,这时候这种单倍型的频率分布在分组中的差异就非常大,这样的话可能本身你所分析的位点在分组中并没有差异,但是由于这个单倍型的存在而导致分析结果产生偏差。所以我们可以在这个选项中输入数值,比如输入0.03,那么所有频率低于0。03的单倍型就不分析其分布的差异了。如果空白,默认值是0.03。
6. Marker names 这一栏可以输入位点的名称,比如说你所分析的位点的rs号。每个rs号之间用空格隔开,也可以空白,这样的话,默认的命名就是site1,site2等等。

7. 数据输入 shesis软件所能接受的数据输入格式如下所示



第一列是每个样本的ID,这可以使数字也可以是字母,不能输入中文。从第二列开始每2列代表一个位点,也就是说2,3列是第一个位点的2个等位基因,4,5列是第二个位点的2个等位基因,等位基因型可以用字母ATCG表示,也可以用12等数字来表示。如果有些样本没有成功分型,那么它的等位基因就需要用0 0来表示(也需要分成2列)。
说明:
Excel中:左边红色部分为control组,右边为case组,第一、二列为第一个位点的等位基因(T,C….),必须先分裂。如TC,分成T C,一列变成二列,同时等位基因也随之分开。值得注意的是,同个基因的多个位点(rs)必须按上游到下游的顺序从左到右排列。

1
T
C
A
A
G
A
1
T
T
C
A
G
A
2
C
C
C
A
A
A
2
T
C
C
A
G
G
3
T
C
C
A
G
A
3
T
C
A
A
A
A
4
T
C
A
A
A
A
4
T
C
C
A
G
A
5
T
T
C
C
G
A
5
T
T
C
A
G
A
6
T
T
C
A
A
A
6
T
T
C
C
G
A
7
T
T
C
A
G
A
7
T
T
C
C
G
G
8
T
C
C
A
A
A
8
T
C
A
A
G
A
9
T
T
A
A
G
A
9
T
C
C
A
A
A
10
T
C
C
A
A
A
10
T
T
C
A
A
A
11
T
T
A
A
G
A
11
T
C
A
A
G
A
12
T
C
C
A
G
A
12
C
C
C
A
G
G
13
C
C
C
A
G
A
13
T
T
A
A
G
A
14
T
T
C
A
A
A
14
T
T
A
A
A
A
15
T
T
C
A
G
A
15
T
T
C
A
G
A
上一篇:S-PLUS统计软件简介
下一篇:两种计算机软件在医学Meta分析中的应用

本站所发表的文章,大部分严格筛选,来源于各相关专业论坛或专业网站,内容仅供大家学习和参阅尊重原作者版权,勿用于商业用途,转载请注明来源。如有学术争议的文章,或可能与事实不符的,与本站立场无关。如有影响到您权益的文章,请及时通知本站,本站立即删除。谢谢监督。
推荐阅读
 
热门文章

Copyright 2010 Powered By 菁英统计工作室 www.tjstat.com 地址1:武汉市珞瑜路1037号 430074 ; 地址2:武汉市航空路13号 430030
邮箱:tjstat@126.com QQ: 点击这里给我发消息 点击这里给我发消息
鄂ICP备10020011号 |