Annotations des gnomes Analyse du transcriptome Analyse des voies - PowerPoint PPT Presentation

JGB71E - Bioinformatique appliquée Annotations des génomes Analyse du transcriptome Analyse des voies métaboliques Jacques van Helden Jacques.van-Helden@univ-amu.fr Aix-Marseille Université, France Technological Advances for Genomics and Clinics (TAGC, INSERM Unit U1090) http://jacques.van-helden.perso.luminy.univ-amu.fr/

Annotation des génomes Rappel des prérequis n Structure des gènes et des génomes q Alignements q Homologie q Annotation des génomes n Organisation des génomes q Bases de données génomiques q Localisation des gènes q Annotation de fonction par similarité de séquences q Coupable par association q L'analyse du transcriptome n Détection de gènes exprimés différentiellement q Clustering des gènes q Annotation métabolique n Bases de données métaboliques q Projection métabolique q Enrichissement fonctionnel n Réseaux d'interaction n

Statistiques pour l'analyse du transcriptome Rappels/prérequis n Test de comparaison de moyenne q Choix d'un test en fonction des hypothèses de travail (Student, Welch, Wilcoxon) q Population, échantillon, échantillonnage q Interprétation d'une p-valeur q Sources de variations en analyse du transcriptome n Interprétation de la p-valeur n Ce qu'elle veut dire et ne veut pas dire q Significativité versus effet: volcano plots q Corrections de tests multiples q Contrôles des modèles n Genèse de jeux de contrôle: données artificielles, permutations des valeurs, … q Distributions de p-valeurs q Courbes de ROC q Evaluation de la robustesse par rééchantillonnage q Clustering n Enrichissement fonctionnel n

Quelques rappels

Structure d'un gène eucaryote Dessin au tableau – photo à insérer ici n

Structure d'un gène eucaryote Exon does not mean coding !!! n 3' UTR, 5' UTR q There are non-coding genes (tRNAs, rRNAs, lncRNAs, … ), which may be spliced. q The only valid definition of exon / intro relates to the splicing mechanism !!! n https://en.wikipedia.org/wiki/Exon

Scénarios évolutifs Nous disposons de deux séquences, et nous supposons qu’elles divergent d’un ancêtre commun. n La divergence peut résulter n d’une duplication (dédoublement d'un segment d'ADN menant à la formation de plusieurs copies dans le même q génome) ou d’une spéciation (formation d'espèces séparées à partir d’une espèce unique). q Les flèches violettes indiquent les mutations (substitutions, délétions, insertions) qui s’accumulent au n sein d’une séquence particulière au cours de son histoire évolutive. Ces mutations sont à l’origine de la diversification des séquences, des structures et des fonctions. Duplication Spéciation Temps Temps Séquence Espèce a a ancestrale ancestrale duplication spéciation divergence divergence a1 a2 Maintenant b c Maintenant 7

Représentation détaillée des événements de spéciation / duplication n La figure de droite combine deux niveaux de représentation q Les lignes noires fines représentent les relations évolutives entre molécules (arbre des molécules). q Les ombrages épais représentent l’arbre des espèces. n Les spéciations (Sp) sont représentées par des branchements triangulaires sur l’arbre des espèces q En cas de spéciation, la molécule ancestrale se retrouve dans chacune des espèces dérivées. n Les duplications (Dp) sont représentées par des branchements rectangulaires. q En cas de duplication, on retrouve au sein de la même espèce deux copies de la séquence ancestrale. 8

Définitions des concepts d’après Fitch (2000) n L’article de Fitch (2000) définit les concepts suivants. q Fitch, W. M. (2000). Homology a personal view on some of the problems. Trends Genet 16, 227-31. n Homologie q Owen (1843). « le même organe sous toutes ses variétés de forme et de fonction ». q Fitch (2000). L’homologie est la relation entre toute paire de caractères qui descendent, généralement avec divergence, d’un caractère ancestral commun. • Note: “caractère” peut se référer à un trait phénotypique, un un site d’une séquence, à un gène entier, … q Application moléculaire: deux gènes sont homologues s’ils divergent d’un gène ancestral commun. n Analogie: relation entre deux caractères qui se sont développés de façon convergente à partir d’ancêtres non-apparentés. n Cénancêtre: l’ancêtre commun le plus récent pour les groupes taxonomiques considérés. n Orthologie: relation entre deux caractères homologues dont l’ancêtre commun se trouve chez le cénancêtre des taxa à partir desquels les séquences ont été obtenues. n Paralogie: relation entre deux caractères émanant d’une duplication de gène pour ce caractère. n Xénologie: relation entre deux caractères dont l’histoire, depuis leur dernier ancêtre commun, inclut un transfert entre espèces Analogie (horizontal) du matériel génétique pour au moins l’un de ces Homologie caractères. Paralogie Xénologie ou non (xénologues issus de paralogues) Orthologie Xénologie ou non (xénologues issus d’orthologues) 9

Exercice n Sur base des définitions de Zvelebil & Baum’s (ci-dessous), qualifiez la relation entre chaque paire de gènes dans le schéma de Fitch (ci- contre). q P paralogie q O orthologie q X xenologie q A analogie A1 AB1 B1 B2 C1 C2 C3 A1 AB1 § Paire d’ orthologues: paire de gènes B1 B2 dont le dernier ancêtre commun précède C1 immédiatement un événement de C2 spéciation (ex: a 1 and a 2 ). C3 § Paire de paralogues : paire de gènes dont le dernier ancêtre commun précède immédiatement une duplication génique (ex: b 2 and b 2' ). Source: Zvelebil & Baum, 2000 10

Exercice n Exemple: B1 versus C1 q Les deux séquences (B1 and C1) proviennent respectivement des taxa B and C. q Le cénancêtre ( flèche bleue ) est le taxon qui précède le second événement de spéciation (Sp2). q Le gène ancestral commun ( point vert ) coïncide avec le cénancêtre. n -> B1 et C1 sont orthologues A1 AB1 B1 B2 C1 C2 C3 A1 AB1 § Paire d’ orthologues: paire de gènes B1 B2 dont le dernier ancêtre commun précède C1 O immédiatement un événement de C2 spéciation (ex: a 1 and a 2 ). C3 § Paire de paralogues : paire de gènes dont le dernier ancêtre commun précède immédiatement une duplication génique (ex: b 2 and b 2' ). Source: Zvelebil & Baum, 2000 11

Exercice n Exemple: B1 versus C2 q Les deux séquences (B1 and C2) proviennent respectivement des taxa B and C. q Le dernier gène ancestral commun ( point vert ) est celui qui précède immédiatement la duplication Dp1. q Cet ancêtre commun est bien antérieur à la spéciation qui a séparé les espèces B et C ( flèche bleue ). n -> B1 et C2 sont paralogues A1 AB1 B1 B2 C1 C2 C3 A1 AB1 § Paire d’ orthologues: paire de gènes B1 dont le dernier ancêtre commun précède B2 C1 O immédiatement un événement de C2 P spéciation (ex: a 1 and a 2 ). C3 § Paire de paralogues : paire de gènes dont le dernier ancêtre commun précède immédiatement une duplication génique (ex: b 2 and b 2' ). Source: Zvelebil & Baum, 2000 12

Non-transitivity of the orthology relationship n In the figure time q B and C are orthologs, because their last common A Common ancestor lies just before the speciation ancestor A -> B + C Speciation q B1 and B2 are paralogs because the first event that A -> B + C follows their last common ancestor (B) is the duplication B -> B1 + B2 divergence n Beware ! These definitions are often misunderstood, even in some textbooks. Contrarily to a strong belief, orthology can be a 1 to N relationship. B Duplication B -> B1 + B2 q B1 and C are orthologs , because the first event after their last common ancestor (A) was the speciation A -> B + C divergence q B2 and C are orthologs because the first event after their last common ancestor (A) was the speciation A -> B + C n The orthology relationship is reciprocal but not transitive . now B1 B2 C q C <-[orthologous]-> B1 q C <-[orthologous]-> B2 q B1 <-[paralogous]-> B2 Orthologs are sequences whose last common ancestor occurred immediately before a speciation event. Paralogs are sequences whose last common ancestor occurred immediately before a duplication event. (Fitch, 1970; Zvelebil & Baum, 2000)

Inferring orthology / paralogy by phylogenetic inference To assess whether a pair of homologous genes are orthologs or paralogs, the n most suitable method is to reconcile molecular and species trees. In Ensembl and EnsemblGenomes, orthology/paralogy is inferred by phylogenetic tree q reconciliation. However, this may become complex: When the number of species increases, q computing time increases quadratically or worse. In 2014, EnsemblGenomes contains >10,000 Bacteria, but the orthology/paralogy is q established for 123 of them only.

Annotations des gnomes Analyse du transcriptome Analyse des voies - PowerPoint PPT Presentation

JGB71E - Bioinformatique applique Annotations des gnomes Analyse du transcriptome Analyse des voies mtaboliques Jacques van Helden Jacques.van-Helden@univ-amu.fr Aix-Marseille Universit, France Technological Advances for Genomics and

8 JDT embraces Type Annotations JDT embraces Type Annotations Java 8 ready Stephan Herrmann GK

Global Transcriptome Transcriptome Analysis of Analysis of Global Pseudomonas aeruginosa

Block Ciphers and DES S-DES DES Details DES Design Other Ciphers CSS441: Security and

Data Encryption Standard Simplified-DES Details of DES DES in OpenSSL Cryptography DES in

Data Encryption Standard Simplified-DES Details of DES DES in OpenSSL Cryptography DES in

1 Reflection on code annotations Classification of Code Annotations (1) Code annotations may

From Open Annotations to W3C Web Annotations (and the impact on IIIF Presentation API 3.0)

Introduction to transcriptome analysis using high- throughput sequencing technologies D.

RNA-seq: Analysis options Genome? Biological samples/Library preparation Transcriptome

Applications and issues of large scale transcriptome profiling experiments Outline

La qualit des donnes et des resultats en analyse protomique Pierre-Alain Binz Swiss

Analyse and binary transformation Guillaume Bouffard Analyse and binary transformation Guillaume

5/10/20 L.O To analyse the main reasons for the Greek victory -I can identify certain techniques

Analyse Relationnelle de Concepts: Une approche pour fouiller des ensembles de donnes

Combining Dependent Annotations for Relational Algebra Egor V. Kostylev, Peter Buneman

Using null type annotations in practice Till Brychcy, Mercateo EclipseCon Europe, 2017 What

Andrey Ptitsyn Sidra medical and Research Center Biological pathways: untangling the hairballs

Topological Analysis and Sub-Network Mining of Protein Protein Interactions Daniel Wu, Xiaohua

Abstract: The work reports facile synthesis of novel ten -aminophosphonate derivatives coupled

Pharmacokinetics, tissue distribution, cellular accumulation and relation to activity Kimmo

The Clinical Utility of NextGen Sequencing The Future Is Already Here: Successful Use of Next-

Disclosures Department of Cardiac Sciences and Libin Cardiovascular Institute U of Calgary

SABIO-RK Integration and Curation of Reaction Kinetics Data http://sabio.villa-bosch.de/SABIORK

Circulating tumor cells as liquid biopsy for castration resistant prostate cancer (CRPC) patients

Sambuz

Useful Links

Newsletter

Mail Us