comp364 manipula0ng rfam data with biopython
play

COMP364: Manipula0ng Rfam data with Biopython Jrme - PowerPoint PPT Presentation

COMP364: Manipula0ng Rfam data with Biopython Jrme Waldisphl, McGill University Rfam The Rfam database is a collec0on of RNA families, each


  1. COMP364: ¡Manipula0ng ¡Rfam ¡ data ¡with ¡Biopython ¡ Jérôme ¡Waldispühl, ¡McGill ¡University ¡

  2. Rfam ¡ The ¡Rfam ¡database ¡is ¡a ¡collec0on ¡of ¡RNA ¡families, ¡each ¡ represented ¡by ¡mul0ple ¡sequence ¡alignments, ¡consensus ¡ secondary ¡structures ¡and ¡covariance ¡models ¡(CMs). ¡ http://rfam.sanger.ac.uk/ Download ¡the ¡seed ¡alignment ¡in ¡Stocholm ¡format ¡of ¡the ¡ 5S ¡ribosomal ¡rRNA ¡(Rfam ¡ID: ¡RF00001). ¡ Using ¡Biopython, ¡read ¡and ¡parse ¡this ¡alignment. ¡Print ¡all ¡ sequences ¡in ¡your ¡terminal ¡with ¡the ¡format: ¡ 1. Id ¡ 2. Sequence ¡(without ¡gaps!) ¡ 3. Length ¡of ¡the ¡sequence ¡ At ¡the ¡end ¡of ¡your ¡program, ¡return ¡the ¡average ¡length. ¡

  3. SeqU0ls ¡ Visit ¡the ¡documenta0on ¡of ¡the ¡SeqU0ls ¡module ¡of ¡Biopython ¡at: ¡ http://biopython.org/DIST/docs/api/Bio.SeqUtils-module.html • Using SeqUtils & matplotlib, plot the molecular weight vs. the sequence’s length of each sequence in your family (WARNING: ignore sequences with ambiguous nucleotides). • Extract one sequence of your alignment and plot its GC skew with a window size of 20.

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend