GATK多线程加速怎么做,要点是什么
Admin 2022-08-03 群英技术资讯 1254 次浏览
这篇文章给大家介绍了“GATK多线程加速怎么做,要点是什么”的相关知识,讲解详细,步骤过程清晰,有一定的借鉴学习价值,因此分享给大家做个参考,感兴趣的朋友接下来一起跟随小编看看吧。对于大数据样本可能会比较慢,因此可以按照染色体拆分后进行多线程并行计算。
下面是我写的一个python多线程脚本,仅供参考,拙劣之处敬请指正。
#!/usr/bin/python3
import _thread
import os
import threading
import time
muthreads=[]
bam_file="a.mkdup.bam"
out_file_prefix="flower"
chr_list=["CHR01","CHR02","CHR03","CHR04","CHR05","CHR06","CHR07","CHR08","CHR09","CHR10","CHR11","CHR12","CHR13"]
for chr in chr_list:
threads_comonder_name= "gatk HaplotypeCaller --intervals " + chr +" -R /mnt/j/BSA/02-read-align/Tifrunner2.fasta -I " + bam_file + " -ERC GVCF -O "+ out_file_prefix +"-"+chr+".erc.g.vcf"
muthreads.append(threads_comonder_name)
exitFlag = 0
class myThread (threading.Thread):
def __init__(self, threadID, name, counter, comander):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.counter = counter
self.comander = comander
def run(self):
print ("开始线程:" + self.name)
print_time(self.name, self.counter, 5, self.comander)
print ("退出线程:" + self.name)
def print_time(threadName, delay, counter,comander):
# while counter:
if exitFlag:
threadName.exit()
time.sleep(delay)
print(comander)
os.system(comander)#调用操作系统命令行处理数据
# counter -= 1
# 创建新线程
threadlist=[]
for i, threadsnu in enumerate(muthreads[0:11]):
print(i)
print(threadsnu)
threadsnew=myThread(1, "Thread-" + str(i), 2, threadsnu)
threadlist.append(threadsnew)
# 开启新线程
for threads in threadlist:
threads.start()
for threads in threadlist:
threads.join()
print ("运行结束退出主线程")
多条染色体的同样本的vcf文件合并
# for i in {1..22} X Y ;do echo "-I final_chr$i.vcf" '\';done
# for i in {10..19} {1..9} M X Y ;do echo "-I final_chr$i.vcf" '\';done
module load java/1.8.0_91
GATK=/home/jianmingzeng/biosoft/GATK/gatk-4.0.3.0/gatk
$GATK GatherVcfs \
-I final_chr1.vcf \
-I final_chr2.vcf \
-I final_chr3.vcf \
-I final_chr4.vcf \
-I final_chr5.vcf \
-I final_chr6.vcf \
-I final_chr7.vcf \
-I final_chr8.vcf \
-I final_chr9.vcf \
-I final_chr10.vcf \
-I final_chr11.vcf \
-I final_chr12.vcf \
-I final_chr13.vcf \
-I final_chr14.vcf \
-I final_chr15.vcf \
-I final_chr16.vcf \
-I final_chr17.vcf \
-I final_chr18.vcf \
-I final_chr19.vcf \
-I final_chr20.vcf \
-I final_chr21.vcf \
-I final_chr22.vcf \
-I final_chrX.vcf \
-I final_chrY.vcf \
-O merge.vcf
合并的时候需要注意,vcf文件的顺序跟每个vcf文件里面头文件顺序是相同的。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
Splinter是一个使用Python测试Web应用程序的开源工具,可以自动化浏览器操作,使用Splinter可以使用pyhton脚本来实现,具体安装及操作方法跟随小编一起看看吧
这篇文章主要介绍了python3在各种服务器环境中安装配置过程,源码包编译安装步骤详解,本文通过图文并茂的形式给大家介绍的非常详细,需要的朋友可以参考下
这篇文章主要介绍了如何通过OpenCV MediaPipe实现手部关键点识别,文中的示例代码讲解详细,对我们学习或工作有一定的价值,需要的可以参考一下
Python内置函数-type()函数。type() 函数如果你只有第一个参数则返回对象的类型,三个参数返回新的类型对象。
这篇文章主要为大家介绍的是Pandas两种少用的读取文件方式:读取在线文件的数据和读取剪贴板的数据,感兴趣的小伙伴可以跟随小编一起学习一下
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008