Postagens

Mostrando postagens de junho, 2021

separando genoma em arquivos menores (5000 sequências em cada arquivo), no exemplo.

 awk 'BEGIN {n_seq=0;} /^>/ {if(n_seq%5000==0){file=sprintf("myseq%d.fa",n_seq);} print >> file; n_seq++; next;} { print >> file; }' < Athaliana_447_Araport11.protein_primaryTranscriptOnly_renamed.fa

Média da primeira coluna usando awk

 awk '{ total += $1 } END { print total/NR }'