欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

介绍用于 lncRNA 组装过程的软件 - transeq

最编程 2024-04-25 18:03:31
...
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程

下面是100个lncRNA组装流程的软件的笔记教程

EMBOOS是一系列处理核酸序列和蛋白质序列的命令行工具的集合. 它包括了序列的提取, 查找, 比对和简单的序列分析等若干小程序. 它们都是独立的命令行工具, 所以用起来小巧而高效, 避免了图形界面程序和R/Python等编程工具的繁琐.

transeq是emboss里的一个工具

功能:把核酸序列翻译为氨基酸序列

官网:http://emboss.sourceforge.net/apps/cvs/emboss/apps/transeq.html

一、软件安装

使用conda安装

conda install emboss

二、transeq的用法

安装完成以后,可以使用transeq -h来查看软件的帮助文档。

2. 常用参数:

-frame=F # To translate a sequence in all three forward frames

-frame=R  # To translate a sequence in all three reverse frames

-trim  # This removes all 'X' and '*' characters from the right end of the translation. 
         The trimming process starts at the end and
         continues until the next character is not a 'X' or a '*'
         
-clean  # This changes all STOP codon positions
         from the '*' character to 'X' (an unknown
         residue). This is useful because some
         programs will not accept protein sequences
         with '*' characters in them.

三、输入文件

fasta格式的核酸序列

### 四、软件运行命令

```sh
transeq ../step3/intersection/filter3_by_noncoding_exon.fa filter4_protein.fa -frame=6

命令参数解读:

 ../step3/intersection/filter3_by_noncoding_exon.fa # 输入核酸序列
 filter4_protein.fa -frame=6 # 输出氨基酸序列
 -frame=6 # To translate a sequence in all six forward and reverse frames

五、输出文件

fasta格式的氨基酸序列