Postagens

Mostrando postagens de 2016

Como filtrar os reads mapeados com o SamTools

retirado de : https://www.biostars.org/p/56246/ Hi, You get a bam (machine readable sam ) file after mapping, and it contains information about mapped and unmapped reads. To get the unmapped reads from a bam file use : samtools view -f 4 file.bam > unmapped.sam , the output will be in sam to get the output in bam use : samtools view -b -f 4 file.bam > unmapped.bam To get only the mapped reads use the parameter 'F', which works like -v of grep and skips the alignments for a specific flag. samtools view -b -F 4 file.bam > mapped.bam From the manual ; there are different int codes you can use with the parameter 'f', based on what you want : -f INT Only output alignments with all bits in INT present in the FLAG field. INT can be in hex in the format of /^0x[0-9A-F]+/ [0] Each bit in the FLAG field is defined as: Flag Chr Description 0x0001 p the read is paired in sequencing 0x0002 P the

FLAGS SAM

https://broadinstitute.github.io/picard/explain-flags.html

Sam format: column information:

Sam format: column information: QNAME: Query name of the read or the read pair FLAG: Bitwise flag (pairing, strand, mate strand, etc.) RNAME: Reference sequence name POS: 1-Based leftmost position of clipped alignment MAPQ: Mapping quality (Phred-scaled) CIGAR: Extended CIGAR string (operations: MIDNSHP) MRNM: Mate reference name (‘=’ if same as RNAME) MPOS: 1-based leftmost mate position ISIZE: Inferred insert size SEQQuery: Sequence on the same strand as the reference QUAL: Query quality (ASCII-33=Phred base quality) FURTHER DETAILS OF SAM FORMAT: http://samtools.sourceforge.net/SAM1.pdf
 https://phylogeneticgeek.wordpress.com/2011/09/16/how-to-run-paup-in-mac-os-x-tiger-under-classic-environment/   How to run PAUP in Mac OS X Tiger (under classic environment) September 16, 2011             1 Vote PAUP * 4.0 (Phylogenetic Analysis Using Parsimony (and Other Methods)) is a popular phylogenetic software.  If you’re in this field of work, you’ve likely have used it or have at least heard of it before.  If you want to use PAUP and you have an Intel Mac, you’ll have to resort to the command line version of the program.  This is because the GUI (Graphical User Interface) version of PAUP only runs in older Macs with PPC processors (i.e. G3, G4, G5). The nice thing about GUI version of PAUP is you can print your trees as a PICT file and you can import it into Word and other Adobe programs to edit it and polish it for a publication.  In the GUI version, it is much easier and faster to set up your phylogenetic analyses compared to

quando nome do arquivo é muito grande

wget -O diamond-linux64.tar.gz " http://github.com/bbuchfink/diamond/releases/download/v0.8.10/diamond-linux64.tar.gz "

Tablet - uso para ver mapeamento

samtools view -b -S myalignment.sam -t myref.fa > myalignment.bam samtools sort myalignment.bam -o myalignment.sorted.bam samtools index myalignment.sorted.bam     myalignment.sorted.bam myalignment.sorted.bam.bai myref.fa

O que é o genoma

Gosto muito do livro de Matt Ridley sobre o "GENOMA" Uma das coisas que mais me chama a atenção nesse livro é como ele consegue transmitir ciência de maneira tão clara e simples! Gostaria muito de aprender a ter essa capacidade! :) Aqui escrevo um trecho sobre o que é o genoma a partir de um exemplo bem simples. Só um comentário: Acabei comprando esse livro em inglês pois essa versão estava mais barata que a em português - é... não está fácil para ninguém ;) -, portanto, vou traduzir e possivelmente erros surgirão ao longo do texto, caso alguém detecte algum erro, peço que me avisem ;) Ai vai: Imaginem que o genoma é um livro: Neste livro há 23 capítulos, chamados cromossomos Cada capítulo contém centenas de histórias chamadas genes Em cada história há parágrafos, chamados exons , que são interrompidos por propagandas chamados íntrons E cada parágrafo é feito de palavras chamadas de códons Cada palavra está escrita em letras chamadas bases Há mais de um bil

Para selecionar a partir de blast2lca

selReadsExcPlants.pl use por exemplo: selReadsExPlant.pl -i nrxUame-Purple_samples.results -k Bacteria | more para somente bacterias ou não use o -k e pegue tudo que não for planta se quiser apenas o nome das reads (este deve ser o caso)  use o "cut -f 1" no lugar do "more" (comando acima) []s
DIAMOND+LCA DIAMOND (version 0.3.9) was run using the following command: diamond blastx –db /ifs/mirror/diamond/nr –query < input.fastq > -v 2 –threads 16 -o < diamond.output.tsv > LCA mapper (from mtools, MEGAN5) was run using: lcamapper.sh -i < diamond.output.tsv > -f Detect -ms 50 -me 0.01 -tp 50 -gt megan/ gi_taxid_prot.bin -o <lca.output> https://nickilottmetagenomics.wordpress.com/2015/01/19/comparing-diamond-lca-against-kraken/

verificar o processo

ps -auxw | grep "programa" | less
apagar tudo até o final da linha a partir do padrão no VIM   : g /{ pattern }/ normal nd$
verificar se um programa esta rodando  ps -auxw | grep "filterMatches.pl" | less - ex "filterMatches.pl" -> programa a ser verificado se esta rodando