Skip to content

EggNOG


本地安装 EggNOG-mapper

# 安装
$ conda create -n eggnog
$ conda activate eggnog
(eggnog)$ conda install eggnog-mapper
# 我们只关心细菌和病毒的基因组注释,因此只下载这2个数据库
# 各个单独数据库参见 http://beta-eggnogdb.embl.de/download/eggnog_4.5/hmmdb_levels
(eggnog)$ cd PATH/TO/DATA
(eggnog)$ download_eggnog_data.py -yq --data_dir `pwd` bact

使用

emapper 的默认算法是hmm,如果想用diamond来做cluster,需要添加-m diamond参数

# HMM 注释
# 针对细菌基因组数据库,使用40个CPU内核,数据库运行在内存中
(eggnog)$ emapper.py -i mygenome.fa -d bact --data_dir PATH/TO/DATA \
> --cpus 40 --usemem -o mygenome_bact_result
# 针对病毒基因组数据库
(eggnog)$ emapper.py -i mygenome.fa -d viruses --data_dir PATH/TO/DATA -o mygenome_virus_result
# Diamond 注释
(eggnog)$ emapper.py -i mygenome.fa -d bact -m diamond --data_dir PATH/TO/DATA -o mygenome_bact_result

结果

生成的数据文件有:

  • *.emapper.hmm_hits
  • *.emapper.seed_orthologs
  • *.emapper.annotations