Previous seminars – 2016

(archives from old symbiose site)

 

  • Biodiversity of the gut microbiome at a local scale: influence of diet, parasitism, and host genetics
    Laure SĂ©gurel
    Thursday, December 15, 2016 – 10:30
    Room Aurigny
    Talk abstract: 

    Humans live in close proximity with multiple microbial communities living in/on them, of which the gut microbiome. This intimate relationship has been challenged many times during human evolutionary history, for example at the Neolithic revolution during the transition from a hunter-gatherer to a farming mode of subsistence, and more recently with the industrialization of human societies. It has notably been shown that there is a substantial loss of biodiversity and an important shift in gut microbiome composition in urban industrialized populations when compared to rural non-industrialized populations. However, the relative contribution of factors such as climate, diet, medicine, hygiene practices, host genetics, and parasitism to these patterns is still unclear. Here, we focus on fine-scale comparisons of African rural populations in order to (i) contrast the gut microbiomes of populations that inhabit similar environments but have different traditional diets (hunter-gatherers, farmers, fishers); (ii) evaluate the effect of parasitism on microbiome composition and structure; and (iii) identify host genetic variation that is associated with the microbiota in African populations. To this end, we profiled the gut microbiota, intestinal parasites, and host genetic variation in 64 individuals in Southwest Cameroon. We found that the presence of an intestinal protozoa, Entamoeba, is strongly correlated with microbial composition and diversity, such that an individual’s infection status can be predicted with 79% accuracy based on his/her gut microbiome composition. We also found gut communities to vary significantly with subsistence mode, with some taxa previously shown to be enriched in other hunter-gatherers groups (notably Succinivibrio sp. and Ruminobacter sp.). Our study thus highlights the substantial variability in gut microbiome composition among closely related populations and suggests an important role for eukaryotic gut inhabitants, one that has been largely overlooked in studies of the microbiome to date. 

     

  • Symbiose Non-permanent members Seminar
     
    Tuesday, December 13, 2016 – 09:30
    Room Aurigny
    Talk abstract: 

    SĂ©minaire des CDD Symbiose 

    • 9h30 – Introduction
    • 9h35 – 10h 45 Session I – SĂ©quences nuclĂ©iques
      • Antoine Limasset – Introduction Ă  la bioinformatique des sĂ©quences, graphes et asssemblage
      • SĂ©bastien François – Optimisation combinatoire en gĂ©nomique : Cas pratique du scaffolding
      • SĂ©bastien Letort – Assemblage de novo avec trace RDF Prov-O
      • Laurent Bouri – Introduction au sĂ©quençage de 3ème gĂ©nĂ©ration
      • Camille Marchet – La transcriptomique : le chaĂ®non manquant des -omiques chez GenScale
    • 10h45 – 11h00 Pause cafĂ©
    • 11h00 – 11h35 Session II-  Ecologie et populations
      • Cervin Guyomar – Introduction Ă  la mĂ©tagĂ©nomique : une histoire de symbiotes (du puceron)
      • Marie Chevallier – Vers l’Écologie des Systèmes
    • 11h35 – 12h00 Session III – Outils pour la BioInformatique
      • ChloĂ© Riou – BioMAJ : moteur de workflow pour la gestion de donnĂ©es biologiques
      • Coline Thomas – Système d’information pour le projet Rapsodyn
      • MatĂ©o Boudet – Introduction au cloud GenOuest
    • 12h00 – 12h15 Table ronde
    • 13h45 – 14h30 Suite Session III
      • Patrick Durand – GATB : tutoriel de nouvelle gĂ©nĂ©ration
      • Xavier Garnier – AskOmics, outil d’intĂ©gration et d’interrogation de donnĂ©es biologiques
      • Lucas Bourneuf  – Powergraph : graphes orientĂ©s visualisation
    • 14h30 – 15h50 Session IV – RĂ©seaux mĂ©taboliques
      • Julie Laniau – Introduction aux rĂ©seaux mĂ©taboliques
      • ClĂ©mence Frioux – Allier programmation linĂ©aire et combinatoire pour reconstruire les rĂ©seaux mĂ©taboliques
      • Meziane Aite – Reconstruction et analyse de rĂ©seau mĂ©tabolique avec le workflow Aureme & padmet-toolbox
      • Victorien DelannĂ©e – PrĂ©diction des mĂ©tabolismes des xĂ©nobiotiques
      • Jean Coquet – Analyse des voies de signalisation du TGF-beta
      • Pierre Vignet – ModĂ©lisation de voies de signalisation liĂ©es au TGF-beta
    • 15h50 – Conclusion
    • 16h – Fin du sĂ©minaire et pot de dĂ©part de Laurent

     

  • L’utilitĂ© des codes Fibonacci
    Tomi Klein (Bar Ilan University)
    Thursday, December 8, 2016 – 10:30
    Room Aurigny
    Talk abstract: 

    The talk reviews several properties and applications of Fibonacci codes. These are fixed codeword sets, using binary representations of integers based on the Fibonacci sequence rather than on powers of 2. Applications range from robust data compression, over faster modular exponentiation to boosting the compression performance of rewriting codes for flash memory. No previous knowledge is assumed. 

    • De novo assembly of bacterial genomes from the seed microbiome.
      Matthieu Barret (INRA Angers)
      Thursday, November 24, 2016 – 10:30
      Room Aurigny
      Talk abstract: 

      Seeds are involved in the vertical transmission of microorganisms from one plant generation to another and consequently act as reservoirs for the plant microbiome. However, little is known about the structure of seed-associated microbial assemblages and the regulators of assemblage structure. In this talk, I will present recent data obtained by our research group on the taxonomic and functional composition of the seed microbiome. 

    • Inventaire et diversitĂ© des cibles gĂ©nomiques potentielles des isoformes SETMAR
      Yves Bigot (INRA-CNRS tours)
      Thursday, November 17, 2016 – 10:30
      Room Aurigny
      Talk abstract: 

      Le gène Setmar est un nĂ©ogène dĂ©rivĂ© de la fusion de deux gènes, le premier codant un domaine SET et le second une transposase Hsmar1. Suivant la lignĂ©e de cellule cancĂ©reuse, 11 isoformes protĂ©iques d’une taille variant de 40 Ă  78 kDa sont des produits d’expression de ce gène. Diverses Ă©tudes se sont concentrĂ©es sur les fonctions de la plus grosse isoforme (78 kDa), en particulier sur celles portĂ©es par le domaine SET. Ces Ă©tudes montrent son implication potentielle dans la rĂ©paration de l’ADN, la dĂ©condensation de la chromatine, et la methylation de certains rĂ©sidus lysines de l’histone H3 et du facteur d’Ă©pissage SnRNP70.

      En dehors de ses activitĂ©s de clivage et de transfert de brin, pas (ou peu) de travaux se sont intĂ©ressĂ©s aux fonctions de la partie HSMAR1 de SETMAR in vivo. Pourtant, le domaine de liaison Ă  l’ADN d’HSMAR1 est parfaitement fonctionnel et devrait in vivo au moins ĂŞtre capable de se lier aux ITRs des Ă©lĂ©ments Hsmar1 et de son MITE MADE1 dans les cellules qui expriment des isoformes SETMAR.

      Avant de traiter de la question des modes de liaison de SETMAR in vivo, nous nous avons Ă©tĂ© confrontĂ©s aux dĂ©fauts de qualitĂ© de l’annotation RepeatMasker (RM) pour les Hsmar1 et des MADE1 dans le gĂ©nome humain. Un nouvel inventaire a Ă©tĂ© produit en utilisant trois outils RM, logol, et la dernière version de BLAST et un processus de validation utilisant Ă  la fois une approche bio-informatique et des donnĂ©es de CHIP-seq obtenues Ă  partir de cellules exprimant diffĂ©rentes isoformes Ă  partir du gène Setmar. Les conclusions de notre Ă©tude sont que les isoformes du gène Setmar contenant le domaine HSMAR1 se lient spĂ©cifiquement Ă  l’ADN avec des modalitĂ©s de liaison en partie diffĂ©rentes de celles observĂ©es in vitro.

    • High sensitivity sequence identification in metagenomics. Application to sequence space exploration of viruses in extreme environment.
      Clovis Galiez
      Thursday, November 10, 2016 – 10:30
      Room MĂ©tivier
      Talk abstract: 

      It is now common to deal with millions of protein sequences coming from metagenomic projects. A sizable part of it is usually left unannotated, up to 70% in the case of viruses. High sensitivity sequence search methods for remote homologs (PSI-Blast, HHblits) are not capable to cope with the amount of data generated by metagenomics.
      We will present, in the context of building a catalog of viral protein sequences, new tools that overcome this limitation. Specifically, we clustered the Uniprot down to 30% which allows to generate rich sequence profiles to identify previously unknown sequences. Moreover, the tool used for this clustering, MMseqs2, can search and cluster big sequence databases with high sensitivity at very high speed (speedup of 270x PSI-Blast with the same sensitivity). We will introduce the current method as well as the future improvements for profile-profile comparison and clustering in linear time that will respectively improve the sensitivity and speed up.

    • Sequence similarity networks, a pragmatical tool to explore processes acting on the microbial dark matter
      Lucie Bittner (UniversitĂ© Pierre et Marie Curie – Paris)
      Thursday, October 6, 2016 – 10:30
      Room Minquiers
      Talk abstract: 

      Sequence similarity networks (SSN) are extremely useful for biologists because, in addition to allowing a user-friendly visualization of the genetic diversity from huge high-throughput sequencing data sets, they can be studied analytically and statistically using graph topology metrics. SSN have recently been adapted to address an increasing number of biological questions investigating both patterns and processes: e.g. population structuring; genomes heterogeneity; microbial complexity and evolution; microbiome adaptation or to explore the microbial dark matter. In metagenomic microbial studies, SSN offer indeed an alternative to classical and potentially biased methods, and thus facilitate large-scale analyses and hypotheses generation, while notably including unknown/dark matter sequences in the global analysis. During this seminar, I will present concrete examples of microbial dark matter mining using SSN developed in my research team: (i) population structure of uncultivated microbes in the global ocean, (ii) research of ecological/life-traits biomarkers in massive functionally unannotated datasets.

       

    • The Common Workflow Language v1.0: ready for production, ready for the futur
      Michael R. Crusoe Community Engineer and co-founder, the Common Workflow Language project
      Thursday, September 29, 2016 – 10:30
      Room Markov
      Talk abstract: 

      The Common Workflow Language project produces standards that describe POSIX command line tools and workflows made from them. They also have a reference implementation and a growing community repository of CWL descriptions with an emphasis on bioinformatics. This talk will review the capabilities of the 1.0 release of the CWL standards and sketch out where the speaker sees these standards and community going over the next few years. Topics will include using and propagating metadata, models for community development and maintenance of workflows, and prospects for workflow conversion. The speaker is very interested in learning about related research efforts; time will be allotted for discussion.

       

       

       Common Workflow Language project: http://www.commonwl.org/

    • Problème Ă  frontière libre pour la formation de protrusions Ă  l’échelle de la cellule
      Clair Poignard (Inria Bordeaux)
      Thursday, September 22, 2016 – 10:30
      Room Aurigny
      Talk abstract: 

      Nous prĂ©sentons un modèle Ă  frontière libre Ă  deux phases pour modĂ©liser la formation de protrusions Ă  l’échelle de la cellule. La membrane cellulaire est dĂ©crite Ă  l’aide d’une fonction level-set dont le mouvement est dĂ» au gradient d’un signal chimique. Le modèle consiste en un couplage  Ă  travers la membrane entre une phase interne (le signal chimique) et une phase externe (la dĂ©gradation de la matrice extracellulaire). La vitesse de la frontière libre est proportionnelle au gradient du signal intĂ©rieur, ce qui gĂ©nère des difficultĂ©s Ă  la fois thĂ©oriques et numĂ©riques. Bien que simpliste, notre modĂ©lisation prĂ©sente des avantages par rapport aux modĂ©lisations existantes, notamment car la vitesse de formation de la protrusion n’est pas donnĂ©e a priori mais rĂ©sulte du modèle. Un travail Ă  long terme consisterait Ă  enrichir ce modèle de la cascade de rĂ©actions chimiques intra-cellulaires gĂ©nĂ©rant le signal.

    • TBA
      Marc Cuggia et Guillaume Bouzillé (Université Rennes 1)
      Thursday, September 8, 2016 – 10:30
      Room Aurigny
      Talk abstract: 

      TBA

    • BWT-based indexing structure for metagenomic classification
      Karel Brinda (Université de Marne-la-Vallée)
      Thursday, July 7, 2016 – 10:30
      Room Aurigny
      Talk abstract: 
      Metagenomics is a powerful approach to study genetic content of environmental samples, which has been strongly promoted by NGS technologies. One of the main tasks is the assignment of reads of a metagenome to taxonomic units, and the subsequent abundance estimation. Most of recently developed programs for this task (such as LMAT, KRAKEN, KALLISTO) perform the assignment based on shared k-mers between reads and references. In such an approach, two major algorithmic subproblems can be distinguished: designing a k-mer index for a huge database of reference genomes and a given taxonomic tree, and designing an algorithm for assigning reads to taxonomic units from information on shared k-mers. In this talk, we consider the problem of index design and present a novel data structure that provides a full list of genomes containing a queried k-mer. The structure is based on BWT-index applied to sequences encoding k-mers proper to each node of the taxonomic tree. We analyse the usefulness of this index and evaluate it in terms of speed and memory requirements.
       
       
    • Parallel Shortest-Path Queries in Planar Graphs
      Hristo N. Djidjev (Los Alamos National Laboratory)
      Thursday, June 23, 2016 – 10:30
      Room Aurigny
      Talk abstract: 
      The query version of the shortest path problem allows the user to precompute information in the form of a data structure that would allow subsequently, when given any pair of vertices, to compute the shortest path between them very fast. It has been used in route-planning services such as Google Maps. We develop several parallel algorithms for shortest path queries in planar graphs that use graph partitioning in the preprocessing phase to precompute and store distances between selected pairs of vertices. In the query phase, given a pair of arbitrary vertices v and w, the stored information is used to find the distance between them. The algorithms are implemented and tested on a high performance cluster with upto 256 16-core CPUs and their performances are analyzed and compared.
       
       
    • Modifications du gĂ©nome et de l’épigĂ©nome dans le lymphocyte B et la cellule stromale en rĂ©ponse Ă  l’antigène
      Karin Tarte & Thierry Fest
      Thursday, June 16, 2016 – 10:30
      Room Aurigny
      Talk abstract: 

      • Etude d’un rĂ©seau toxico-gĂ©nomique pondĂ©rĂ© en vue de la prĂ©diction in-silico de la toxicitĂ© des substances chimiques
        Emmanuelle Becker
        Thursday, June 9, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        L’Union Européenne a récemment coordonné une campagne de recensement
        ayant dénombré plus de 100 000 substances dont seulement 3% ont fait
        l’objet d’analyses approfondies pour en évaluer la toxicité et établir
        des liens avec des pathologies humaines et des phénotypes délétères.
        Suite Ă  ce constat, elle a depuis 2007 mis en place le programme
        Registration, Evaluation, Authorization of CHemicals (REACH), qui
        impose aux industriels produisant ou important des produits chimiques
        sur le territoire européen d’évaluer leur toxicité et de démontrer
        l’innocuité de ceux-ci . Parmi les différentes approches qui existent
        pour évaluer la toxicité d’une substance, l’utilisation de modèles
        animaux (in vivo ou ex vivo) reste la plus utilisée. Cependant, cette
        approche n’est pas optimale pour plusieurs raisons : (i) il existe des
        différences entre ces organismes modèles et l’homme; (ii) ces
        techniques sont onéreuses et relativement complexes à mettre en place
        ; et enfin (iii) le nombre d’animaux à sacrifier pour mener à bien ces
        Ă©tudes est extrĂŞmement important.
        La prise en compte simultanĂ©e de l’ampleur du dĂ©fi que reprĂ©sente
        l’investigation toxicologique de milliers de composĂ©s, et de leurs
        potentiels mélanges, ainsi que la complexité et le coût des approches
        in vivo, ex vivo et in vitro existantes, pousse les législateurs et
        scientifiques à considérer les approches prédictives in silico comme
        des compléments pertinents aux approches expérimentales.
        L’objectif serait ici de dĂ©velopper une mĂ©thode permettant une
        caractérisation fine de la toxicité, qui permette de différencier les
        différents types de toxicité (nephrotoxicité, neurotoxicité,
        reprotoxicité…) en se basant sur la signature toxico-génomique du
        composé. La signature toxico-génomique se définit par l’ensemble des
        gènes différentiellement exprimés suite à une exposition. Dans un
        premier temps, nous décrirons les données utilisées ainsi que leur
        traitement en vue d’aboutir à une matrice de signatures
        toxico-génomiques. Nous présenterons ensuite la construction d’un
        réseau pondéré de signatures toxico-génomiques, et étudierons quelques
        propriétés de celui-ci. Enfin, nous nous intéresserons à la modularité
        au sein de ce réseau, avant de tester la pertinence du transfert
        d’annotations de toxicité via les modules de ce réseau.

      • InfĂ©rence et interrogation de rĂ©seaux biologiques
        Mohamed Elati
        Thursday, May 12, 2016 – 10:30
        Room Aurigny
        Talk abstract: 
        InfĂ©rer et interroger (extraire de la connaissance) de rĂ©seaux biologiques, guidĂ©s par des donnĂ©es de type omics, est actuellement un domaine de recherche actif avec de nombreuses applications en biologie systĂ©mique et synthĂ©tique. L’apprentissage automatique avec son large Ă©ventail de techniques joue un rĂ´le majeur, impliquant le dĂ©veloppement des mĂ©thodologies “cas par cas”. 
        Dans cet exposĂ©, je prĂ©senterai des outils pour i) infĂ©rer des rĂ©seaux de rĂ©gulation des gènes, y compris leurs motifs cis-rĂ©gulateurs; ii) estimer l’activitĂ© des facteurs de transcription et iii) extraire de modules fonctionnels. J’illustre mon propos par des exemples de projets en cours dans l’équipe.
      • TBA
        Caroline Baroukh
        Thursday, April 28, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        TBA

      • ContrĂ´le de l’homĂ©ostasie protĂ©ique dans le rĂ©ticulum endoplasmique dans les pathologies inflammatoires et nĂ©oplasiques
        Éric Chevet
        Thursday, April 21, 2016 – 10:30
        Room Aurigny
        Talk abstract: 
        – qu’est ce que l’homĂ©ostasie protĂ©ique

        – qu’est ce que le rĂ©ticulum endoplasmique (RE)

        – les acteurs de l’homĂ©ostasie protĂ©ique dans le RE

        – un exemple avec AGR2, un membre de la famille des protein disulfide isomerases.

        – AGR2 dans le RE, AGR2 sĂ©crĂ©tĂ© – inflammation et cancer.

         
      • Scalable Design Space Exploration via Answer Set Programming Modulo Theory
        Philipp Wanko
        Thursday, March 31, 2016 – 10:30
        Room Aurigny
        Talk abstract: 
        The complexity of multi-core processors increases more and more. In the 
        next generations, networks on chips (NOC) will be utilized which place 
        several possibly heterogeneous processing units in a network that work 
        together to run applications. This poses new design challenges like 
        binding tasks to fitting resources on the network, route messages 
        between the tasks and schedule the tasks to fulfill real-time 
        requirements. Ultimately, the resulting design should also be optimal 
        regarding quality measures like latency, costs and energy consumption. 
        Answer Set Programming (ASP) is well suited to accommodate routing and 
        binding since it is efficient for combinatorial problems and 
        reachability can be easily expressed. Scheduling and optimization of 
        numerical values on the other hand can not be efficiently encoded.
        We propose a system that uses new theory propagation capabilities to 
        combine ASP modulo several background theories to account for binding, 
        routing, scheduling and optimization at the same time. Customizable 
        theory languages allow us to define the complete system specification in 
        a declarative way.
        
      • Theory Solving made easy with Clingo 5
        Torsten Schaub (Uni. Potsdam)
        Thursday, March 24, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        We present the fifth generation of the ASP systems gringo\ and clingo,
        while focusing on their major feature, namely, the easy addition of theory reasoning.
        From the grounder’s perspective, this involves a generic way of specifying theory-specific language
        extensions and the design of an intermediate format accommodating ground theory expressions.
        From the solving view, this is accompanied by a high-level interface for integrating theory propagators
        interpreting these theory expressions.

        (This will be rather a demo than a talk! )

      • Oxford Nanopore Technology : DonnĂ©es et applications.
        Jean Marc Aury (Genoscope)
        Thursday, March 10, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        La société Oxford Nanopore Technology - ONT (https://www.nanoporetech.com/) propose depuis peu un séquenceur 3ème génération, permettant de lire de très grands fragments d'ADN, jusqu'à 100Kb. La technique de séquençage par Nanopore est très différentes des technologies existantes et elle présente de nombreux avantages. L'exposé présentera le fonctionnement du séquenceur MkI de ONT, ainsi que différents jeux de données obtenus sur des bactéries et des eucaryotes. Par le biais de séquençage d'ADN génomique, nous illustrerons l'intérêt du séquenceur MkI pour l'assemblage de novo de génomes et notamment la résolution des régions répétées.
         

      • Applications of the Theory of Formal Languages for the Design of Fast Hardware Implementations of Parallel Multiset Rewriting
        Serghei Verlan (LACL Université Paris Est Créteil Val de Marne )
        Thursday, March 3, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        In this talk we present the design of a fast hardware simulator forparallel multiset rewriting using the field-programmable gate array(FPGA) technology. The simulator is non-deterministic and it uses aconstant time procedure to choose one of the computational paths. Theobtained strategy is equitable and it is based on a pre-computation ofall possible rule applications. This pre-computation is obtained byusing the representation of all possible multisets of rules’applications as context-free languages. Then using the Schutzenbergertechnique for the computation of the generating series for context-freelanguages it is possible to construct the structure representing allpossible rule applications for any configuration.We give a hardware design implementing some concrete examples andpresent the obtained experimental results which feature an importantspeed-up. 

      • Identification et « quantification » des attracteurs dans des dynamiques discrètes asynchrones. Application sur un modèle de cancer de vessie.
        Elisabeth Remy (universitĂ© d’Aix-Marseille)
        Thursday, January 28, 2016 – 10:30
        Room Aurigny
        Talk abstract: 
         
        Le cadre de cet exposĂ© est la modĂ©lisation discrète des rĂ©seaux de rĂ©gulation biologique. 
        La formalisme logique permet de faire une analyse qualitative de la dynamique des processus Ă©tudiĂ©s, et de proposer une explication « mĂ©canistique » des phĂ©nomènes observĂ©s.
        Après une description de ce formalisme et des principaux outils qui permettent d’analyser les propriĂ©tĂ©s du système, nous Ă©tudierons une application de cette modĂ©lisation dans le cadre de la tumorigĂ©nèse du cancer de vessie. Plus prĂ©cisĂ©ment, nous portons notre attention sur les co-occurences ou exclusions mutuelles d’altĂ©rations gĂ©nĂ©tiques qui apparaissent de façon significative. 
        Pour expliquer ces pattern d’altĂ©rations, une exploration plus quantitative de la dynamique s’avère nĂ©cessaire. Ainsi, nous  proposons une mĂ©thode pour quantifier l’atteignabilitĂ© des attracteurs dans des (très) grands graphes.
         
      • Approximating the dynamics of the Hybrid Stochastic-Deterministic Apoptosis pathway
        Sucheendra Palaniappan (Inria Rennes)
        Thursday, January 21, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        Modeling and analysis of the dynamics of biological systems while accounting for single cell fluctuations is important. In particular, there has been recent work on a hybrid stochastic-deterministic (HSD) model of TRAIL induced apoptosis that combines a deterministic signal transduction model and a stochastic model for protein turnover that can explain fractional killing and predict the time dependent evolution of cell resistance to TRAIL. While this model is extremely useful for analyzing TRAIL induced apoptosis by drawing simulations in a single cell setting, it can be limiting in cases when we want to analyse the system in a multi-scale setting (say modeling a spheroid of millions of cells at larger time horizon for clinical trials).In such cases, simulating the original model for repeated analysis tasks can become extremely time consuming due to the scale of the resultant system. Instead, one could directly approximate the dynamics of the underlying system as an intermediate level behavioral model and use this approximation instead. In this talk, we will present results describing a minimalist discrete appromixation (Dynamic Bayesian Networks (DBNs) ) of the dynamics of the HSD model. We will describe how analysis tasks on the original HSD model translates to probabilistic inference tasks on the DBN. 

         

      • L’hĂ©tĂ©rozygotie, problème technique ou objet d’Ă©tude ?
        Jean-François Flot (Evolutionary Biology & Ecology – UniversitĂ© Libre de Bruxelles)
        Thursday, January 14, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        Dans les Ă©tudes de phylogĂ©nie et de gĂ©nomique il est courant de considĂ©rer l’hĂ©tĂ©rozygotie des organismes diploĂŻdes comme un problème nuisible dont on cherche Ă  se dĂ©barrasser afin d’obtenir des donnĂ©es exploitables. Si les sĂ©quences obtenues Ă  partir d’individus hĂ©tĂ©rozygotes sont certes complexes, elles renferment nĂ©anmoins des trĂ©sors d’informations hĂ©las trop peu souvent exploitĂ©es. A partir d’exemples divers (notamment coraux, amphipodes et rotifères), j’illustrerai certaines approches bioinformatiques permettant de tirer partie de l’hĂ©tĂ©rozygotie des organismes pour jeter un regard nouveau sur l’Ă©volution et sur la dynamique de leur gĂ©nome. 

         

      • L’assemblage de grands gĂ©nomes Ă  base des sĂ©quence PacBio vu des donnĂ©es
        Christophe Klopp
        Thursday, January 7, 2016 – 10:30
        Room Aurigny
        Talk abstract: 

        L’assemblage de gĂ©nomes de grande taille est, depuis les dĂ©buts de la gĂ©nomique, un sujet de grand intĂ©rĂŞt pour les biologistes et de recherche pour les informaticiens. Une première gĂ©nĂ©ration d’assembleurs de type OLC (overlap layout consensus) a Ă©tĂ© dĂ©veloppĂ©e pour le traitement des sĂ©quences de première gĂ©nĂ©ration appelĂ©es aussi sĂ©quences Sanger. La stratĂ©gie Ă©tait alors le plus souvent de dĂ©couper le gĂ©nomes en morceaux (fosmides, BAC) et d’assembler les lectures provenant de ces morceaux avant de joindre ces premiers assemblages pour produire des morceaux de chromosomes. La diminution du coĂ»t de sĂ©quençages due Ă  l’apparition des machines de seconde gĂ©nĂ©ration a poussĂ© au dĂ©veloppement de nouveaux algorithmes, souvent basĂ©s sur des graphes de de Bruinj, capables de traiter ces grandes masses de donnĂ©es. La troisième gĂ©nĂ©ration de sĂ©quenceurs est maintenant entrĂ©e dans une phase de maturitĂ© avec la capacitĂ© de produire d’assez grandes quantitĂ©s de sĂ©quences très longues. Ceci remet en selle la première stratĂ©gie d’assemblage et certaines suites logicielles anciennes ayant Ă©tĂ© adaptĂ©es Ă  ces nouvelles donnĂ©es. Les sĂ©quences Ă©tant de très faible qualitĂ©, il a toutefois Ă©tĂ© nĂ©cessaire d’ajouter une Ă©tape de correction en amont de l’assemblage. L’exposĂ© prĂ©sente l’Ă©volution des stratĂ©gies d’assemblage en faisant un focus sur celles utilisant les sĂ©quences de troisième gĂ©nĂ©ration. l’Ă©volution de la qualitĂ© des sĂ©quences aux diffĂ©rentes Ă©tapes de l’assemblage permettra de montrer impact de la correction mais aussi ses limites actuelles. L’exposĂ© comprend des exemples issus d’assemblages de donnĂ©es publiques ou privĂ©es afin d’analyser Ă  chaque Ă©tape la qualitĂ© des donnĂ©es en entrĂ©e et en sortie de manière Ă  aussi trouver de possibles amĂ©liorations du processus.

         

 

see year: 2020201920182017 – 2016 – 2015201420132012