当前位置: 首页 > java >正文

WES(一)——文件准备

1. 下载参考文件

2. 建立索引

3. 建立Dictionary文件

4. 下载已知variation站点文件与VCF索引文件

mkdir aligned_reads reads scripts results data    #创建文件夹#!/bin/bash# Script to call germline variants in a human WGS paired end reads 2 X 100bp
# Following GATK4 best practices workflow - https://gatk.broadinstitute.org/hc/en-us/articles/360035535932-Germline-short-variant-discovery-SNPs-Indels-
# This script is for demonstration purposes onlyIf false  #避免重复下载,耗时耗内存
then
# 下载数据
Wget (-p /绝对路径/reads) ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/phase3/data/HG00096/sequence_read/SRR062634_1.filt.fastq.gz
wget ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/phase3/data/HG00096/sequence_read/SRR062634_2.filt.fastq.gzecho "Run Prep files..."
# ---------------------------download and gunzip .gz-----------------------
#wget  https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz
#gunzip hg38.fa.gz# ---------- index ref - .fai file before running haplotype caller---------
#samtools faidx hg38.fa# ----------- ref dict - .dict file before running haplotype caller---------
/data/software/gatk-4.4.0.0/gatk CreateSequenceDictionary R=hg38.fa O=hg38.dict# ---------download known sites files for BQSR from GATK resource bundle----
wget https://storage.googleapis.com/genomics-public-data/resources/broad/hg38/v0/Homo_sapiens_assembly38.dbsnp138.vcf
#wget https://storage.googleapis.com/genomics-public-data/resources/broad/hg38/v0/Homo_sapiens_assembly38.dbsnp138.vcf.idxfi

所有准备文件已经备好,如下图片:

http://www.xdnf.cn/news/9602.html

相关文章:

  • 机器学习:线性回归、损失函数、导数、偏导
  • 主题阅读输出-关于成年/成熟的认识-01-学习
  • vue3 项目运行 加载 白屏
  • 嵌入式JPEG图像加水印实战技巧
  • 自我觉察是成长的第一步,如何构建内心的平静
  • 仿真每日一练 | ABAQUS水滴入水分析
  • SWMM+HTWATER最新水文水动力模型应用
  • linux版本vmware修改ubuntu虚拟机为桥接模式
  • STM32:ESP8266 + MQTT 云端与报文全解析
  • 微信小程序关于截图、录屏拦截
  • 通义实验室开源针对RAG的预训练框架
  • P1923 【深基9.例4】求第 k 小的数
  • Sentinel限流熔断机制实战
  • 软件测试计划中时间与资源的估算
  • 探索Dify-LLM:构建自定义大模型应用的高效平台
  • IO进程(进程 Process)
  • COF材料前沿应用:多孔晶态材料的催化革新之旅 | 乐研试剂
  • 华南会议|AI驱动仿真未来 2025 Altair区域技术交流会华南站,报名开启!
  • 【人工智能】DeepSeek的AI狂想曲:从训练到应用的交响乐
  • 2025.05.28【Parallel】Parallel绘图:拟时序分析专用图
  • 创建型模式之 Builder (生成器)
  • 从跟跑到领跑:雷克赛恩17年创业历程
  • 正则表达式的修饰符
  • 如何更新和清理 Go 依赖版本
  • 暗通道先验去雾算法实现
  • Trae配置JAVA本地环境,开发前后端
  • ToolsSet之:大数及高精度运算
  • Web 端顶级视效实现:山海鲸端渲染底层原理与发布模式详解
  • 234. Palindrome Linked List
  • Linux系统编程-DAY07