separando genoma em arquivos menores (5000 sequências em cada arquivo), no exemplo.
awk 'BEGIN {n_seq=0;} /^>/ {if(n_seq%5000==0){file=sprintf("myseq%d.fa",n_seq);} print >> file; n_seq++; next;} { print >> file; }' < Athaliana_447_Araport11.protein_primaryTranscriptOnly_renamed.fa
Comentários
Postar um comentário