Le groupe GUGGO reprĂ©sente un espace collaboratif pour les scientifiques, biologistes ou bioinformaticiens, intĂ©ressĂ©s par l’analyse de donnĂ©es et la plateforme web Galaxy.

Ce groupe a pour but de faciliter le transfert d’informations au niveau du grand ouest concernant Galaxy en propageant les fondements de cette plateforme web, basĂ©s sur l’accessibilitĂ©, la reproductibilitĂ©et la transparence.

Compte rendu réunion 1 GUGGO

image_print

Groupe de travail des utilisateurs Galaxy du Grand Ouest GUGGO : Galaxy User Group Grand Ouest

RĂ©union : 5 avril 2012 – IRISA

Présents

Site de Rennes (par ordre du tour de table) Olivier Collin, Cyril Monjeaud, Claudia Hériveau, Anthony Bretaudeau, JérÎme Montfort, Fabrice Legeai, Dominique Lavenier, Aurélien Roult, Olivier Sallou, Stéphanie Mottier, Marc Aubry, Thomas Derrien, Nicolas Soriano, Christophe Caron, Yann Audic, Pierre Peterlongo

Site de Nantes(par ordre du tour de table) Audrey Bihouée, Dominique Tessier, Raluca Teusan, Julien Gras, Edouard Hirchaud, Eric Charpentier

Excusé

Gilles Lassalle

Inventaire des actions « Galaxy » en cours dans le Grand Ouest

GenOuest

Une instance expĂ©rimentale a Ă©tĂ© mise en place Ă  l’adresse galaxy.genouest.org. Cette instance accepte les connexions en provenance d’utilisateurs disposant dĂ©jĂ  d’un compte sur les machines de la plate-forme (connexion via LDAP).

Etant donnĂ© le caractĂšre expĂ©rimental, trĂšs peu d’outils ont Ă©tĂ© installĂ©s.

D’autre part, une machine virtuelle basĂ©e sur BioLinux et possĂ©dant une instance Galaxy a Ă©tĂ© créée. Cette image peut ĂȘtre utilisĂ©e sur un poste de travail pour rĂ©aliser des premiers tests et notamment mettre en place des workflows.

La procĂ©dure d’acquisition d’une machine Galaxy avec un espace disque consĂ©quent est en cours (obtention rĂ©cente des devis Dell).

Institut de Génétique et Développement de Rennes

S. Mottier, Yann Audic

Pour pouvoir traiter des données de RNAseq fournies par le Genoscope, une instance Galaxy a été installée sur un poste local avec divers outils de base. Des problÚmes de configuration ont été rencontrés avec les outils Tophat et Cufflinks

Plate-forme de génomique des insectes

F. Legeai

Une instance locale a été mise en place pour des partenaires INRA en France. Des outils de base tels que Bowtie et FastQC ont été installés. Cette instance est en phase de test avec quelques utilisateurs. Il est prévu pour assurer une montée en charge de migrer ensuite vers la plate-forme GenOuest.

ABiMS: Station Biologique de Roscoff

L’environnement Galaxy fait l’objet d’expĂ©rimentations depuis 2010. Un serveur opĂ©rationnel est en place depuis quelques semaines sur une machine dĂ©diĂ©e (64 Go mĂ©moire) et capable de soumettre des travaux sur le gestionnaire de tĂąches SGE.

Les travaux de dĂ©veloppement de pipelines seront focalisĂ©s sur des thĂ©matiques de la plate-forme de mĂ©tabolomique Corsaire. L’environnement Galaxy sera Ă©galement mis Ă  profit pour accompagner les projets Investissement d’Avenir hĂ©bergĂ©s par la Station Biologique de Roscoff.

Pour les utilisateurs extĂ©rieurs Ă  la Station Biologique il est possible de demander de compte pour accĂ©der Ă  la ressource Galaxy. La procĂ©dure est disponible Ă  l’adresse : http://abims.sb-roscoff.fr/

BiRD Nantes

Pas d’expĂ©rience mais la plate-forme est intĂ©ressĂ©e par l’outil pour mise Ă  disposition de certaines ressources NGS.

Retour d’expĂ©rience sur l’utilisation de Galaxy

Institut de Génétique et Développement de Renne

Des instances de Penn State et TĂŒbingen ont Ă©tĂ© utilisĂ©es pour des analyses RNASeq. La question qui se pose, plus que l’environnement de traitement, est de savoir comment efficacement traiter les donnĂ©es. Un Ă©change d’expĂ©rience au sein d’une communautĂ© serait un plus.

BIA Nantes

Utilisation d’une instance publique pour l’analyse de donnĂ©es NGS. Cette instance, bien que limitĂ©e Ă  3Go a permis d’expĂ©rimenter. Une stratĂ©gie originale consiste Ă  payer Ă  un accĂšs Ă  un cloud avec les outils complets afin de bĂ©nĂ©ficier de l’intĂ©gralitĂ© de la richesse de l’offre puis de passer ensuite en local.

INRA Rennes

Durant la discussion on évoque H. Falentin, utilisatrice des outils de Galaxy

SynthĂšse gĂ©nĂ©rale sur l’utilisation

L’outil est trĂšs apprĂ©ciĂ© car il offre un environnement prĂȘt Ă  l’emploi. Les tutoriaux fournis sur le site central sont trĂšs bien faits. Il est possible d’envoyer des rĂ©sultats d’analyse sur des Brower (UCSC) et ainsi visualiser. Cette fonctionnalitĂ© est trĂšs apprĂ©ciĂ© par les scientifiques travaillant sur des gĂ©nomes disponibles et sĂ©quencĂ©s. La situation est diffĂ©rente pour les autres communautĂ©s.

La richesse de l’environnement est Ă  la fois sa richesse et sa faiblesse. Il faut en effet une premiĂšre connaissance des outils. Il y a beaucoup de capsules pas forcĂ©ment faciles Ă  apprĂ©hender.

Pour certaines tĂąches plus complexes, il n’y a pas l’outil dans Galaxy et il faut repasser dans l’environnement Linux. Il est par contre possible de rajouter des outils. Certains participants Ă©voquent des difficultĂ©s pour rajouter des outils (descripteur XML et programme Python).

Rubrique people

Anton Nekrutenko, un des chefs de projet de Galaxy, va faire un sĂ©jour Ă  Lyon en tant que chercheur invitĂ©. http://lbbe.univ-lyon1.fr/-Nekrutenko-Anton-.html On peut envisager la possibilitĂ© de l’inviter Ă  venir donner une confĂ©rence ou un sĂ©minaire sur Galaxy.

Formations

Les formations proposĂ©es sur l’environnement pourraient ĂȘtre de deux types : – journĂ©e gĂ©nĂ©rale sur l’utilisation de l’outil : maĂźtrise de l’environnement et de sa philosophie – ensuite des journĂ©es d’approfondissement sur certains outils.

Plan d’action

La mise en place d’une instance pour la communautĂ© du Grand Ouest. Installation des outils essentiels et des workflows adaptĂ©s.

On pourrait par exemple, envisager des instances dĂ©diĂ©es : mĂ©tagĂ©nomique, NGS, etc. Remarque : Cette solution n’est peut-ĂȘtre pas la plus efficace car elle pourrait obliger l’utilisateur Ă  passer d’une instance Ă  l’autre pour trouver certains outils. Il serait probablement plus efficace d’arriver Ă  une classification claire des diffĂ©rents outils.

Les catégories envisageables :

– gĂ©nomique : polymorphisme

– expression : Ă©pissage

– mĂ©tagĂ©nomique : ADN, ARN

Un plan d’action en plusieurs Ă©tapes est envisageable pour la mise en place d’une ressource commune :

– Mise en place d’un portail Galaxy sur GenOuest et ABiMS

– Mise en place de formations sur l’environnement. Ces formations permettent de rassembler une communautĂ© d’utilisateurs

– Sondage auprĂšs de la communautĂ© d’utilisateurs prĂ©alablement constituĂ©e afin d’établir la liste des logiciels prioritaires

Parallùlement à cette mise en place d’autres actions sont mises en place pour enrichir l’offre :

– RĂ©flexion sur les avantages de l’outil ToolShed pour une communautĂ© Biogenouest avec le partage d’outils entre ABiMS/BiRD et GenOuest. q

– Interfaçage d’outils NGS de l’équipe GenScale

Prochaine réunion du groupe

A l’issue de l’installation de l’instance GenOuest et de la mise en production de l’instance ABiMS pour coordonner les actions de formation.