LDblock绘制连锁不平衡和单体型图
创始人
2024-04-02 18:28:44
0

大家好,我是邓飞。

在GWAS分析中,我们挖掘到了一些显著性的位点,如何确定这些位点是不是假阳性呢?我们可以通过LDblock分析并进行可视化进行判断。

我们知道GWAS分析中是依据SNP与性状控制的基因存在LD,所以如果位点显著,则周围应该有一些位点都显著,或者说位点所在的区域LD值比较高,能形成Block,才比较靠谱。否则,显著性为点形单影只,并且没有形成Block,极大可能是假阳性!

下面介绍如何通过基因型数据和GWAS分析结果,绘制LDblock。

要实现的下面的图:

  • 最下方的热图是两两SNP之间的LD值,越高越红,比较红的区域构成一个Block(用黑线连起来)
  • 如果提供gff文件,可以显示基因的上游、下游、外显子、内含子区域
  • 上面是位点的曼哈顿图,是区域性的曼哈顿图
  • 位点之间,也可以根据LD值进行可视化,以最显著的位点为四方形,其它位点与其LD值的大小呈现不同的颜色


软件介绍:(这两款神奇是一人开发,大神呀!)
github链接:https://github.com/BGI-shenzhen/

  • A:整体上宏观上用:PopLDdecay 软件 ,软件己经生物信息Bioinformatics杂志发表online
  • B: 从局部上查看用:LDBlockShow软件, 软件已经正式被 briefings in bioinformatics (影响分子8.99)的杂志接收

1. 数据准备

  • vcf格式的数据,InVCF
  • plink二进制文件,InPlink
  • plink文本文件,InPlink

2. 软件安装

网址:https://github.com/BGI-shenzhen/LDBlockShow

中文说明书:https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf

安装代码:

        git clone https://github.com/hewm2008/LDBlockShow.gitcd LDBlockShow ; chmod 755 configure  ;  ./configure;make;mv LDBlockShow  bin/;    #     [rm *.o]

3. 软件测试

数据:
file.vcf

代码:
这里,绘制染色体1,位置区间是:49670000:49780000

LDBlockShow -InVCF file.vcf -OutPut re5 -Region 1:49670000:50680000 -OutPng -SeleVar 1

结果:

在这里插入图片描述

4. 进阶:Heatmap + block

vcf文件:Test.vcf.gz

在这里插入图片描述

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re1 -Region chr11:24100000:24200000 -OutPng -SeleVar 1

结果文件:

re1.blocks.gz  re1.png  re1.site.gz  re1.svg  re1.TriangleV.gz

5. 进阶:Heatmap + block + GWAS

考虑GWAS的结果,加入参数:-InGWAS gwas.pvalue

vcf文件:Test.vcf.gz

在这里插入图片描述
GWAS结果文件:三列,Chr, Position, Pvalue,没有行头

$ head gwas.pvalue
chr11	24142640	0.00009
chr11	24142660	1.02e-9
chr11	24142669	1e-9
chr11	24142692	0.5
chr11	24142724	0.6
chr11	24142756	0.001
chr11	24142760	0.006

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re2 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1

结果:

re2.blocks.gz  re2.png  re2.site.gz  re2.svg  re2.TriangleV.gz


结果中包括热图,block图和GWAS图合并起来了。

上面的图,可以通过ShowLDSVG软件,进一步优化:

  • -Cutline,阈值定义为7
  • -ShowNum,显示LD值
  • -PointSize,显示点大小
 ShowLDSVG -InPreFix re2 -OutPut temp -InGWAS gwas.pvalue -Cutline 7 -ShowNum -PointSize 3

结果:

6. Heatmap + block + GWAS + Annotation

相比较上图,增加了注释的信息。

文件需要:

  • vcf,vcf格式的文件
  • gwas_pvalue,三列的gwas结果(Chr,Position,Pvalue),无行头
  • gff文件,注释文件
$ cat In.gff
chr11	maker	mRNA	24142646	24142738	.	+	.	ID=GeneName
chr11	maker	five_prime_UTR	24142646	24142652	.	-	.	Parent=GeneName
chr11	maker	CDS	24142653	24142673	.	+	2	Parent=GeneName
chr11	maker	CDS	24142718	24142729	.	+	2	Parent=GeneName
chr11	maker	five_prime_UTR	24142730	24142738	.	+	.	Parent=GeneName

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff

也可以增加SNP的名称:

$ cat Spe.snp
chr11	24142660
chr11	24142669	SpeA
chr11	24142760	SpeB

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff -SpeSNPName Spe.snp

7. 进阶:LDblock+GWAS+Annotation+Locuszoom

可以通过-TopSite在GWAS图中显示最显著位点与其它位点的LD关系。

LDBlockShow -InVcf Test.vcf.gz -OutPut re4 -InGWAS gwas.pvalue -InGFF In.gff -Region chr11:24100000:24200000 -OutPng -SeleVar 3 -TopSite

下图中,最显著的位点为四边形,其它颜色,红色表示LD高,其它颜色表示LD低。在上图的基础上,增加了最显著位点与其它位点的LD情况。

参考:https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf

上一篇:Linux-vim使用

下一篇:Redis学习基础知识

相关内容

热门资讯

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
月入8000+的steam搬砖... 大家好,我是阿阳 今天要给大家介绍的是 steam 游戏搬砖项目,目前...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...