COMP364: Manipula0ng Rfam data with Biopython Jrme - - PowerPoint PPT Presentation

comp364 manipula0ng rfam data with biopython
SMART_READER_LITE
LIVE PREVIEW

COMP364: Manipula0ng Rfam data with Biopython Jrme - - PowerPoint PPT Presentation

COMP364: Manipula0ng Rfam data with Biopython Jrme Waldisphl, McGill University Rfam The Rfam database is a collec0on of RNA families, each


slide-1
SLIDE 1

COMP364: ¡Manipula0ng ¡Rfam ¡ data ¡with ¡Biopython ¡

Jérôme ¡Waldispühl, ¡McGill ¡University ¡

slide-2
SLIDE 2

Rfam ¡

The ¡Rfam ¡database ¡is ¡a ¡collec0on ¡of ¡RNA ¡families, ¡each ¡ represented ¡by ¡mul0ple ¡sequence ¡alignments, ¡consensus ¡ secondary ¡structures ¡and ¡covariance ¡models ¡(CMs). ¡ http://rfam.sanger.ac.uk/ Download ¡the ¡seed ¡alignment ¡in ¡Stocholm ¡format ¡of ¡the ¡ 5S ¡ribosomal ¡rRNA ¡(Rfam ¡ID: ¡RF00001). ¡ Using ¡Biopython, ¡read ¡and ¡parse ¡this ¡alignment. ¡Print ¡all ¡ sequences ¡in ¡your ¡terminal ¡with ¡the ¡format: ¡

  • 1. Id ¡
  • 2. Sequence ¡(without ¡gaps!) ¡
  • 3. Length ¡of ¡the ¡sequence ¡

At ¡the ¡end ¡of ¡your ¡program, ¡return ¡the ¡average ¡length. ¡

slide-3
SLIDE 3

SeqU0ls ¡

Visit ¡the ¡documenta0on ¡of ¡the ¡SeqU0ls ¡module ¡of ¡Biopython ¡at: ¡

http://biopython.org/DIST/docs/api/Bio.SeqUtils-module.html

  • Using SeqUtils & matplotlib, plot the molecular weight vs. the

sequence’s length of each sequence in your family (WARNING: ignore sequences with ambiguous nucleotides).

  • Extract one sequence of your alignment and plot its GC skew

with a window size of 20.