当前位置: 首页 > backend >正文

EPI2ME分析软件测试

一直以来对牛津纳米孔测序技术比较好奇,想要测试下他官方的分析软件,无奈之前的软件很封闭,只能买机器才能用,这两天发现可以以游客身份安装使用啦,这里测试一下。

EPI2ME 是 Oxford Nanopore Technologies 提供的一套生物信息学工作流程平台,专为其长读长测序数据设计。它基于 Nextflow 框架,支持容器技术和软件包管理器,适用于本地、集群和云端部署,非常适合需要高扩展性的科研环境。

命令行流程测试

后面提到,图形界面折腾失败,只能退而求其次,上命令行啦!之前就有安装过nextflow的conda版本,是个独立的环境,于是更新了下版本,用起来!同样面临到了docker hub的网络问题,找了个镜像网址解决的。一个样本默认是用4个线程进行minimap2比对的。
测试数据用的这个:https://trace.ncbi.nlm.nih.gov/Traces/?view=run_browser&acc=SRR30050020&display=metadata
文档在这里:https://epi2me.nanoporetech.com/epi2me-docs/workflows/wf-16s/(和github是同步的,https://github.com/epi2me-labs/wf-16s)

# 好久不用,运行流程报错,升级下
mamba update nextflow
# 拉取流程并运行,会下载两个docker镜像
nextflow run epi2me-labs/wf-16s     --fastq  /mnt/d/epime/data/SRR30050020.fastq.gz --minimap2_by_reference     -profile  standard

二十多分钟后,就愉快地有了报告,还是网页版本,不错的。有个插曲就是硬件配置不足,一次是修改了WSL的硬件配置,拉满到了全部硬件,就是修改了windows用户目录下的.wslconfig文件。另一个就是报硬件不足,本来以为要失败时想了下,应该是数据一百多M过大,于是抽取了前10万条,终于运行成功啦!

结果查看

报告有两个,一个是流程的运行情况,这个用处不太大,一般是用于优化算力上的流程参数的。

另一个就是我们最关心的结果报告啦,官网也给出了示例版本:https://epi2me.nanoporetech.com/workflows/wf-16s/wf-16s-report.html#Section_b90ae906eb624f53a77553eba1782c6c

稍微有点失望的是只注释到了属,有的还不到,可能原因是数据是旧的芯片版本或者nanopore对16S的测序还确实不太如人意呀!多样性指数,可视化还是不错的,圆盘,百分比堆积柱状图,桑基图,稀释曲线,优势物种图都是有的。


还有个kraken2的流程,没有找到详细的运行参数,没做尝试,相信结果也是类似的啦。初步总结,还是基本满足需求的,特别是对于分析基础相对弱的,有现成的软件工具可用,方便很多。

图形界面的尝试

就直接跟着官网的步骤下载安装啦,网址在这:https://epi2me.nanoporetech.com/downloads/,windows, mac, linux三大平台都是有的。官网说,对于外行来说,安装生物信息学软件可能是出了名的困难。 EPI2ME 桌面应用程序旨在允许任何人随时随地分析任何内容。 简化了 Oxford Nanopore Technologies 测序应用的生物信息学工具和资源的安装和使用。
我是windows版本啦,主要是还是相对来讲性价比最高的平台嘛。开始是需要登陆的,但是现在可以以游客方式使用,更方便了。

然后就是配置保存目录啦,防止系统盘过小,一下就整爆了,另外依赖的WSL和docker也是可以选择路径的哦。

配置WSL,必须是官方的版本,还要求最新的,是epime专用的,也不知道密码。。。

下面是详细配置步骤:

相对傻瓜的,毕竟是图形软件,不得不说ONT做得不错。不过这个折腾还是有点时间久的,毕竟要下载一个相当于小系统镜像。

安装完WSL,就是流程的nextflow啦,这个是个应用,更轻松啦就。

完工,开始配置流程,就卡在这了,原因很简单,就是docker hub连接不上,有途径的帅美可以考虑途径解决啦。

推荐内存32G,新测确实,如果文件超过100M,就会报错RAM不足的。

没能解决软件如何配置网络的问题,只能换个思路啦,好在还有命令行的公开,如果网络问题解决,还是很轻松就完成啦!

http://www.xdnf.cn/news/17304.html

相关文章:

  • 数字图像处理基础——opencv库(Python)
  • 我用C++和零拷贝重构了文件服务器,性能飙升3倍,CPU占用降低80%
  • 从“人拉肩扛”到“智能协同”——AGV重构消防智能仓储价值链
  • 记录一次ubuntu20.04 解决gmock not found问题的过程
  • Python如何合并两个Excel文件
  • Web3: DeFi借贷的安全基石, 了解喂价与清算机制的原理与重要性
  • SVN下载及安装(保姆级别)
  • 【华为机试】55. 跳跃游戏
  • SARSA算法详解:从实践到理论的全面解析
  • 小程序难调的组件
  • 疯狂星期四文案网第33天运营日记
  • GDB中thread apply all命令使用指南
  • 数据大集网:重构企业贷获客生态的线上获客新范式​
  • AI赋能品牌出海,特区典范引领未来 第十九届中国品牌节·国际品牌博览会在深开幕
  • FreeRTOS---基础知识5
  • 灰狼算法+四模型对比!GWO-CNN-LSTM-Attention系列四模型多变量时序预测
  • 《汇编语言:基于X86处理器》第12章 浮点数处理与指令编码(2)
  • 支持向量机(SVM)全解析:原理、类别与实践
  • 贪心(set维护)
  • Agent 开发进阶路线:从基础功能到自主决策
  • AcWing 6478. 谁进线下了?III
  • 【深度学习】动手深度学习PyTorch版——安装书本附带的环境和代码(Windows11)
  • 前端后端之争?JavaScript和Java的特性与应用场景解析
  • Spring Boot 结合 CORS 解决前端跨域问题
  • ctfshow_萌新web9-web15-----rce
  • 腾讯前端面试真题
  • svm的一些应用
  • Prometheus 通过读取文件中的配置来监控目标
  • MyBatis流式查询详解
  • 系统构成与 Shell 核心:从零认识操作系统的心脏与外壳