Skip to content

Canu and gepard

分享者:bio0013


更新时间:20241030

Canu 专门组装 PacBio 或 Oxford Nanopore 序列。Canu 分为三个阶段:校正、修剪和组装。校正阶段将提高读取中碱基的准确性。修剪阶段将修剪读取到看似高质量序列的部分,删除可疑区域(例如剩余的 SMRTbell 适配器)。组装阶段将把读取排序为重叠群,生成一致序列并创建替代路径图。

对于真核基因组,20 倍以上的覆盖率足以超越当前的混合方法,但建议的最低覆盖率应为 30 倍至 60 倍。更高的覆盖率将允许 Canu 使用更长的读取进行组装,从而实现更好的组装。

输入序列可以是 FASTA 或 FASTQ 格式,未压缩或使用 gzip (.gz)、bzip2 (.bz2) 或 xz (.xz) 压缩。请注意,不支持 zip 文件 (.zip)。

 canu \

\>  -p 1_assembly -d 1_output \

\>  genomeSize=5.2m \

\>  -pacbio-raw 1.subreads.fastq.gz \

\>  useGrid=false maxThreads=16

-- canu 2.2

Canu和gepard 看三代结果是否环形

Canu

conda activate canu

canu   -p 1_assembly -d 1_output   genomeSize=5.2m   -pacbio-raw 1.subreads.fastq.gz   useGrid=false maxThreads=16

Gepard

conda activate gepard

java -cp /platform_data/Software/miniconda3/envs/gepard/share/gepard/dist/Gepard-2.1.jar org.gepard.client.cmdline.CommandLine -seq /platform_data/User/bio0013/tig00000002.fasta /platform_data/User/bio0013/tig00000002.fasta -matrix /platform_data/Software/miniconda3/envs/gepard/share/gepard/resources/matrices/edna.mat -outfile /platform_data/User/bio0013/1tig2_circular_test.png**