separando genoma em arquivos menores (5000 sequências em cada arquivo), no exemplo.

 awk 'BEGIN {n_seq=0;} /^>/ {if(n_seq%5000==0){file=sprintf("myseq%d.fa",n_seq);} print >> file; n_seq++; next;} { print >> file; }' < Athaliana_447_Araport11.protein_primaryTranscriptOnly_renamed.fa

Comentários

Postagens mais visitadas deste blog

Instalar o VMPlayer no Linux Ubuntu

MitoBim results