欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

加速3D DNA建模软件系列之一:根据新cprops属性编辑FASTA文件

最编程 2024-07-23 15:41:44
...

说明:通过后续的分析发现,只需要保证输入的fasta是多行形式,而不是单行形式,那么原来的流程的分析 速度并不会受到影响。可以使用 seqkit seq -w 80 input.fasta > output.fasta 的方式来调整输入fasta的格式。

【修改于2022-11-11:这篇文章仅用来记录当年的一些操作,目前不再需要我自己写个脚本来加速,所以项目就被我删了,请注意看上面的说明】

在3d-dna流程中,凡是涉及到edit-fasta-according-to-new-cprops.awk的流程速度都会非常的慢,为了提高它的运行速度,我根据它的代码逻辑用Python进行实现。

首先,我找到了所有用到edit-fasta-according-to-new-cprops.awk的脚本

  • run-asm-pipeline-post-review.sh

  • run-asm-pipeline.sh

  • finalize/remove-N-overhangs-from-asm.sh

然后根据edit-fasta-according-to-new-cprops.awk的代码逻辑,我编写了一个edit-fasta-according-to-new-cprops.py, 实现了相同的功能。经过测试,我的代码输出结果和原来的awk脚本完全一样。

最后,我将所有涉及edit-fasta-according-to-new-cprops.awk的脚本全部修改为我的代码。

项目地址: https://github.com/xuzhougeng/3d-dna