加速3D DNA建模软件系列之一:根据新cprops属性编辑FASTA文件
最编程
2024-07-23 15:41:44
...
说明:通过后续的分析发现,只需要保证输入的fasta是多行形式,而不是单行形式,那么原来的流程的分析 速度并不会受到影响。可以使用 seqkit seq -w 80 input.fasta > output.fasta 的方式来调整输入fasta的格式。
【修改于2022-11-11:这篇文章仅用来记录当年的一些操作,目前不再需要我自己写个脚本来加速,所以项目就被我删了,请注意看上面的说明】
在3d-dna流程中,凡是涉及到edit-fasta-according-to-new-cprops.awk
的流程速度都会非常的慢,为了提高它的运行速度,我根据它的代码逻辑用Python进行实现。
首先,我找到了所有用到edit-fasta-according-to-new-cprops.awk
的脚本
-
run-asm-pipeline-post-review.sh
-
run-asm-pipeline.sh
-
finalize/remove-N-overhangs-from-asm.sh
然后根据edit-fasta-according-to-new-cprops.awk
的代码逻辑,我编写了一个edit-fasta-according-to-new-cprops.py
, 实现了相同的功能。经过测试,我的代码输出结果和原来的awk脚本完全一样。
最后,我将所有涉及edit-fasta-according-to-new-cprops.awk
的脚本全部修改为我的代码。
项目地址: https://github.com/xuzhougeng/3d-dna