Le groupe GUGGO reprĂ©sente un espace collaboratif pour les scientifiques, biologistes ou bioinformaticiens, intĂ©ressĂ©s par lâanalyse de donnĂ©es et la plateforme web Galaxy.
Ce groupe a pour but de faciliter le transfert dâinformations au niveau du grand ouest concernant Galaxy en propageant les fondements de cette plateforme web, basĂ©s sur lâaccessibilitĂ©, la reproductibilitĂ©et la transparence.
Compte rendu réunion 1 GUGGO
Groupe de travail des utilisateurs Galaxy du Grand Ouest GUGGO : Galaxy User Group Grand Ouest
RĂ©union : 5 avril 2012 â IRISA
Présents
Site de Rennes (par ordre du tour de table) Olivier Collin, Cyril Monjeaud, Claudia Hériveau, Anthony Bretaudeau, JérÎme Montfort, Fabrice Legeai, Dominique Lavenier, Aurélien Roult, Olivier Sallou, Stéphanie Mottier, Marc Aubry, Thomas Derrien, Nicolas Soriano, Christophe Caron, Yann Audic, Pierre Peterlongo
Site de Nantes(par ordre du tour de table) Audrey Bihouée, Dominique Tessier, Raluca Teusan, Julien Gras, Edouard Hirchaud, Eric Charpentier
Excusé
Gilles Lassalle
Inventaire des actions « Galaxy » en cours dans le Grand Ouest
GenOuest
Une instance expĂ©rimentale a Ă©tĂ© mise en place Ă lâadresse galaxy.genouest.org. Cette instance accepte les connexions en provenance dâutilisateurs disposant dĂ©jĂ dâun compte sur les machines de la plate-forme (connexion via LDAP).
Etant donnĂ© le caractĂšre expĂ©rimental, trĂšs peu dâoutils ont Ă©tĂ© installĂ©s.
Dâautre part, une machine virtuelle basĂ©e sur BioLinux et possĂ©dant une instance Galaxy a Ă©tĂ© créée. Cette image peut ĂȘtre utilisĂ©e sur un poste de travail pour rĂ©aliser des premiers tests et notamment mettre en place des workflows.
La procĂ©dure dâacquisition d’une machine Galaxy avec un espace disque consĂ©quent est en cours (obtention rĂ©cente des devis Dell).
Institut de Génétique et Développement de Rennes
S. Mottier, Yann Audic
Pour pouvoir traiter des données de RNAseq fournies par le Genoscope, une instance Galaxy a été installée sur un poste local avec divers outils de base. Des problÚmes de configuration ont été rencontrés avec les outils Tophat et Cufflinks
Plate-forme de génomique des insectes
F. Legeai
Une instance locale a été mise en place pour des partenaires INRA en France. Des outils de base tels que Bowtie et FastQC ont été installés. Cette instance est en phase de test avec quelques utilisateurs. Il est prévu pour assurer une montée en charge de migrer ensuite vers la plate-forme GenOuest.
ABiMS: Station Biologique de Roscoff
Lâenvironnement Galaxy fait lâobjet dâexpĂ©rimentations depuis 2010. Un serveur opĂ©rationnel est en place depuis quelques semaines sur une machine dĂ©diĂ©e (64 Go mĂ©moire) et capable de soumettre des travaux sur le gestionnaire de tĂąches SGE.
Les travaux de dĂ©veloppement de pipelines seront focalisĂ©s sur des thĂ©matiques de la plate-forme de mĂ©tabolomique Corsaire. Lâenvironnement Galaxy sera Ă©galement mis Ă profit pour accompagner les projets Investissement dâAvenir hĂ©bergĂ©s par la Station Biologique de Roscoff.
Pour les utilisateurs extĂ©rieurs Ă la Station Biologique il est possible de demander de compte pour accĂ©der Ă la ressource Galaxy. La procĂ©dure est disponible Ă lâadresse : http://abims.sb-roscoff.fr/
BiRD Nantes
Pas d’expĂ©rience mais la plate-forme est intĂ©ressĂ©e par lâoutil pour mise Ă disposition de certaines ressources NGS.
Retour dâexpĂ©rience sur lâutilisation de Galaxy
Institut de Génétique et Développement de Renne
Des instances de Penn State et TĂŒbingen ont Ă©tĂ© utilisĂ©es pour des analyses RNASeq. La question qui se pose, plus que lâenvironnement de traitement, est de savoir comment efficacement traiter les donnĂ©es. Un Ă©change dâexpĂ©rience au sein dâune communautĂ© serait un plus.
BIA Nantes
Utilisation d’une instance publique pour lâanalyse de donnĂ©es NGS. Cette instance, bien que limitĂ©e Ă 3Go a permis dâexpĂ©rimenter. Une stratĂ©gie originale consiste Ă payer Ă un accĂšs Ă un cloud avec les outils complets afin de bĂ©nĂ©ficier de lâintĂ©gralitĂ© de la richesse de l’offre puis de passer ensuite en local.
INRA Rennes
Durant la discussion on évoque H. Falentin, utilisatrice des outils de Galaxy
SynthĂšse gĂ©nĂ©rale sur lâutilisation
Lâoutil est trĂšs apprĂ©ciĂ© car il offre un environnement prĂȘt Ă lâemploi. Les tutoriaux fournis sur le site central sont trĂšs bien faits. Il est possible dâenvoyer des rĂ©sultats d’analyse sur des Brower (UCSC) et ainsi visualiser. Cette fonctionnalitĂ© est trĂšs apprĂ©ciĂ© par les scientifiques travaillant sur des gĂ©nomes disponibles et sĂ©quencĂ©s. La situation est diffĂ©rente pour les autres communautĂ©s.
La richesse de lâenvironnement est Ă la fois sa richesse et sa faiblesse. Il faut en effet une premiĂšre connaissance des outils. Il y a beaucoup de capsules pas forcĂ©ment faciles Ă apprĂ©hender.
Pour certaines tĂąches plus complexes, il n’y a pas l’outil dans Galaxy et il faut repasser dans lâenvironnement Linux. Il est par contre possible de rajouter des outils. Certains participants Ă©voquent des difficultĂ©s pour rajouter des outils (descripteur XML et programme Python).
Rubrique people
Anton Nekrutenko, un des chefs de projet de Galaxy, va faire un sĂ©jour Ă Lyon en tant que chercheur invitĂ©. http://lbbe.univ-lyon1.fr/-Nekrutenko-Anton-.html On peut envisager la possibilitĂ© de lâinviter Ă venir donner une confĂ©rence ou un sĂ©minaire sur Galaxy.
Formations
Les formations proposĂ©es sur lâenvironnement pourraient ĂȘtre de deux types : – journĂ©e gĂ©nĂ©rale sur l’utilisation de l’outil : maĂźtrise de lâenvironnement et de sa philosophie – ensuite des journĂ©es dâapprofondissement sur certains outils.
Plan dâaction
La mise en place dâune instance pour la communautĂ© du Grand Ouest. Installation des outils essentiels et des workflows adaptĂ©s.
On pourrait par exemple, envisager des instances dĂ©diĂ©es : mĂ©tagĂ©nomique, NGS, etc. Remarque : Cette solution nâest peut-ĂȘtre pas la plus efficace car elle pourrait obliger lâutilisateur Ă passer dâune instance Ă lâautre pour trouver certains outils. Il serait probablement plus efficace dâarriver Ă une classification claire des diffĂ©rents outils.
Les catégories envisageables :
– gĂ©nomique : polymorphisme
– expression : Ă©pissage
– mĂ©tagĂ©nomique : ADN, ARN
Un plan dâaction en plusieurs Ă©tapes est envisageable pour la mise en place dâune ressource commune :
– Mise en place dâun portail Galaxy sur GenOuest et ABiMS
– Mise en place de formations sur lâenvironnement. Ces formations permettent de rassembler une communautĂ© dâutilisateurs
– Sondage auprĂšs de la communautĂ© dâutilisateurs prĂ©alablement constituĂ©e afin dâĂ©tablir la liste des logiciels prioritaires
ParallĂšlement Ă cette mise en place dâautres actions sont mises en place pour enrichir lâoffre :
– RĂ©flexion sur les avantages de lâoutil ToolShed pour une communautĂ© Biogenouest avec le partage dâoutils entre ABiMS/BiRD et GenOuest. q
– Interfaçage dâoutils NGS de lâĂ©quipe GenScale
Prochaine réunion du groupe
A lâissue de lâinstallation de lâinstance GenOuest et de la mise en production de lâinstance ABiMS pour coordonner les actions de formation.