血研所500例分析思路
2017-04-12 15:22:48 0 举报
对于血研所500例分析,我们可以从以下几个方面入手:首先,对数据进行清洗和预处理,包括去除异常值、缺失值等;其次,对数据进行描述性统计分析,包括频数、均值、标准差等;然后,根据研究目的选择合适的统计方法进行分析,如t检验、方差分析、相关性分析等;最后,对结果进行可视化展示,如绘制柱状图、折线图、散点图等。此外,在分析过程中还需要注意假设检验的前提条件是否满足,以及结果的可靠性和显著性。
作者其他创作
大纲/内容
filter
28 variants in 23 cases
ACMG 开发的变异分类系统并推荐使用特定的标准术语,该系统将变异分为 pathogenic(致病的 ) 、 likelypathogenic(可能致病的) 、 uncertain significance(致病性不明确的) 、 likely benign(可能良性的) 、 benign(良性的) 来描述孟德尔疾病致病基因中发现的突变。
total snps:13071
任务拆分执行
对所有共有基因筛选结果进行ACMG有害性分类标记pathogenic(致病的 ) 、 likelypathogenic(可能致病的)的突变位点
deleterious
项目方案
new siteATP1A1(1)LDLR(1)CACNA1D(1)MME(1)GUCY1A3(2)NPR3(1)CYP3A5(3)BLK(2)GATA4(2)NT5C2(1)WNK1(4)GNB3(1)PTPRO(2)TBX3(1)FBN1(3)FURIN(1)SLC12A3(2)WNK4(1)GNAS(2)EDN3(1)
Novo-zhonghuaMAF 0.01
variant filtering-step4variants not in repeat region
分析流程完善点罗列
ACMG(Pvalue0.001)
流程分析测试
total snps: 49461
Mapping(BWA)
known genes
total snps:8241
new siteHDAC9*(2)LDLR*(1)MAD2L1(1)LPA(1)NOS3(1)SWAP70(1)LRP1(1)HHIPL1(1)CFDP1(1)CDH13(1)ANGPTL4(1)ZNF507(1)
PathogenicATP7A(1)
验收
variant filtering-step3frequency in 1000G & NovoDB (0.01) GnomAD (0.001)
项目需求了解
total snps: 740462
PathogenicHDAC9(1)LDLR(2)
SNP&Indel(samtools)
repeat
frequency
1000G (ALL)MAF 0.01
Exomes of 100 unrelated EH cases
no synonymousno stoploss
protential genes
CADD 15SIFT : DPloyphen_HVAR : D/PPloyphen_HDIV : D/PMutation Taster : A/D(meet any two)
运营-信息收集表上传时间点沟通特殊周期要求沟通
GnomAD(ALL & EST)MAF 0.001
ATP7A(5)AKAP12(6)BARX1(2)UTY(1)SPTA1(10)
1 missing rate =0.9)2 HWE P value 1.0 x 10-83 exclude repeat4 MAF 0.5%; (1000g)5 depth =4 X
variant filtering-step 1 variants site in exon & splicing
Likely PathogenicLDLR(2)
synonymous
known siteHDAC9*(2)LDLR*(6)PCSK9(1)APOB(4)FN1(1)TNS1(4)ARHGEF26(1)C2(1)SVEP1(2)PCNX3(2)LRP1(1)SH2B3(1)KSR2(1)DHX38(1)BCAS3(1)ANGPTL4(1)
whether known
exonic or splicing(2bp)
total snps: 91757
total snps:14052
SNP/INDEL
total snps:20182
total snps:21768
RawData
CleanData
variant filtering-step5predicted deleterious by at least two software
total snps: 62458
Likely PathogenicCACNA1H(1)SLC12A3(4)
variant filtering-step2variants without synonymous & loss of function
total snps: 112965
FilterDB
ACMG
PathogenicGATA4(1)
variation
分析流程自动化完善项目
1 过滤所有SNP/INDEl数据库频率0.052 保留exon/splicing区域突变位点3 去除同义突变位点4 保留预测有害性突变位点(预测软件SIFT、Polyphen2、CADD、MutationTaster)
total snps: 499466
QC
25 variants in 23 cases
Mapping
共有基因筛选分别基于基因(gene)、位点(site)分析
function
TRPC5(3)ARHGEF4(5)SLC6A14(2)PIEZO1(14)IK(3)APLN(1)
Association
筛选无效组样本2个以上共有,有效组样本没有的突变位点
Exomes of 65 unrelated CAD cases
no Repeat or Superrepeat
known siteMTHFR(3)CTNNB1(1)CACNA1D(1)MME(1)ADD1(1)NPR3(2)WNK1(3)PDE3A(1)TBX3(1)FBN1(2)FURIN(1)CACNA1H(3)SCNN1G(1)SCNN1B(1)SLC12A3(3)WNK4(1)GNAS(1)
total snps:12641
bam
0 条评论
下一页