Yann Ponty

Directeur de recherche CNRS · Responsable de l'équipe AMIBio
Membre du LIX, Laboratoire d'Informatique de l'École Polytechnique

Bureau 2005 · LIX/Bat. Turing · 1 rue Estienne d'Orves · 91120 Palaiseau · France
+33 1 77 57 80 95 · No Javascript = no email

Je suis chercheur au CNRS, basé au laboratoire d'informatique de l'École Polytechnique (Institut Polytechnique de Paris). Je conçois des méthodes Bioinformatiques à forte composante algorithmique, principalement dédiées à mieux comprendre et exploiter le potentiel des Acides RiboNucléiques (ARN).

Certains de mes centres d'intérêt :

Prédiction du repliement, design et évolution de l'ARN
Interactions ARN/ARN, ARN/Protéines, et Protéines/Protéines
Génération aléatoire et combinatoire énumérative
Algorithmique Discrète (Programmation dynamique !)
Visualisation de l'ARN

News

Bertrand Marchand a soutenu sa thèse (Oct 2023), et sera bientôt suivi par Taher Yacoub (pas de pression ... ;))

Bienvenue à Théo Boury et Alain Azede démarrent leur thèse sous ma co-direction à l'Automne 2023

Je co-dirige le comité de programme (proceedings chair) d'ISMB 2024

Je préside sur la période 2022-2025 le comité du prix de thèse SIF/Gilles Kahn

Recherche

Sur un plan scientifique, mes principaux centres d'intérêts se situent à l'interface entre Informatique, Mathématiques et Biologie Moléculaire. La finalité de mes travaux est principalement la conception d'approches analytiques, d'algorithmes efficaces et d'outils finalisés en direction de la biologie des Acides RiboNucléiques (ARN).
Quelques unes des questions soulevées sont les suivantes :

Comment prédire la structure de l'ARN en présence de pseudonoeuds ?
Quelle est la prévalence des phénomènes cinétiques à l'oeuvre au cours du repliement de l'ARN ?
Quelle relation entre la structure et l'évolution des ARN ?
En quoi l'évolution des séquences d'ARN nous renseigne-t-elle sur leur structure ?
En quoi la connaissance de la structure d'un ARN est susceptible d'aider à l'analyse des données expérimentales ?
À l'inverse, comment tirer parti de données experimentales gros grain pour prédire la structure secondaire d'un ARN ?
Comment concevoir une séquence d'ARN réalisant une fonction souhaitée in vivo ?

Certaines de ces questions ont trait à des propriétés universelles des biopolymères, et ne requièrent la prise en compte ni d'une séquence précise d'ARN, ni d'un modèle énergétique sophistiqué. En supposant qu'elles puissent être réexprimées à tel un niveau abstrait sans en sacrifier l'essence, j'utilise les outils issus de la combinatoire énumérative et de la combinatoire analytique pour obtenir des réponses quantitatives (asymptotiquement) exactes.

Des questions plus complexes exigent parfois une analyse spécifique de chaque séquence, tout en autorisant la mise en oeuvre d'algorithmes, souvent issus de la programmation dynamique, de complexité temps/mémoire polynomiales. Les concepts et principes sous-jacents à ces algorithmes sont alors parfois d'un niveau de généralité suffisant pour autoriser leur transposition à d'autres domaines. Par exemple, j'exporte en direction de la génomique comparative des méthodes ensemblistes introduites dans le contexte de la thermodynamique, entre autres afin de tester la robustesse des prédictions obtenues selon un principe de parcimonie.

Il arrive cependant que les problèmes considérés soient d'une difficulté algorithmique démontrable au sens de la théorie de la complexité. Dans une tel cas, j'essaye d'établir l'origine de la difficulté du problème afin d'envisager des stratégies de contournement. Par exemple, on pourra envisager la conception d'un algorithme de complexité paramétrée, ou encore une simplification du modèle réalisant un compromis acceptable entre expressivité and calculabilité en temps raisonnable.

Enfin, dans les cas extrêmes où le problème est difficile à appréhender, ou encore, de façon croissante, comme une approche préliminaire pour tester des hypothèses et me familiariser avec un problème, j'adopte une approche probabiliste, basée sur la génération aléatoire contrainte dans des distributions adéquates, telle la distribution uniforme, ou encore la distribution de Boltzmann.

Publications

Filtrage des publications

Par type
Par thème
Texte

Cette liste est générée automatiquement à partir de HAL, et formattée via bibtex-js.
En cas de difficultés avec Javascript: Visitez cette version statique

Logiciels

Bioinformatique des ARN

VARNA

Dessin et annotation des structures secondaires d'ARN. Accepte de nombreuses options documentées, et permet l'exportation du dessin dans de nombreux formats.

Collab.: A. Denise@Paris-Saclay Univ.

VARNA

RNANR

Génération aléatoire non-redondante de structures secondaires. Permet à la fois la production de statistiques plus fiables, et la génération des structures localement optimales, essentielles à l'analyse cinétique.

Collab.: H. Touzet@Univ. Lille

RNANR

SPARCS

SPARCS analyse des régions structurées (ou pas) dans les séquences codantes d'ARN. Il évalue la significativité de la structuration dans un modéle nul qui préserve la séquence protéique, et le contenu en dinucléotides.

Collab.: J. Waldispühl@Univ. McGill

SPARCS

Design d'ARN

IncaRNAtion

Design de séquences d'ARN se repliant en une structure secondaire unique, sous contrainte de composition en nucléotides, grâce à une technique originale de génération aléatoire.

Collab.: J. Waldispühl@Univ. McGill

IncaRNAtion

RNARedPrint

Design d'ARN adoptant des conformations multiples (design positif). Utilise une algorithmique paramétrée par programmation dynamique pour la génération sequences richement contraintes (énergie, composition...).

Collab.: S. Will@TBI Vienna

RNARedPrint

IncaRNAfbInv

Design de séquence d'ARN basé sur une décomposition en fragments, de taille variables. Combine une génération aléatoire contrainte avec une optimisation par recherche locale flexible.

Collab.: J. Waldispühl@Univ. McGill

· D. Barash@Ben Gurion Univ.

IncaRNAfbInv

Analyse de séquences

GenRGenS

Bibliothèque pour la génération aléatoire de séquences génomiques structurées. Accepte plusieurs classes de modèles: grammaires pondérées, modèles de Markov (dont HMM), ProSITE patterns, expressions régulières ...

Collab.: A. Denise@Paris-Saclay Univ.

GenRGenS

RNAPyro

Correction d'erreurs dans les données de séquençage d'ARN utilisant la structure secondaire d'ARN.

Collab.: J. Waldispühl@Univ. McGill

RNAPyro

Bioinformatique Structurale

DIAL

Comparaison et de recherche de motifs dans des modèles 3D d'ARN. Critère de similarité expressif, tenant compte des séquence et structure secondaire, mais aussi de la géométrie locale (angles dièdres)

Collab.: P. Clote@Boston College

DIAL

LocalMove

LocalMove discrétise la conformation des macromolécules 3D. Il attribue des points d'une grille (hexagonale, cubique...) aux positions du squelette linéaire, basée sur une recherche locale MCMC utilisant des movements locaux.

Collab.: P. Clote@Boston College

LocalMove

Parcours

LIX · Ecole Polytechnique · France

Directeur de Recherche CNRS

Bioinformatique des ARN· Génération Aléatoire · Combinatoire analytique appliquée

Octobre 2020 - Actuellement

HDR en Informatique

Bioinformatique des ARN · Programmation Dynamique · Génération aléatoire · Combinatoire analytique

Mai 2020

LIX · Ecole Polytechnique · France

Responsable équipe AMIBio

Bioinformatique de l'ARN· Génération Aléatoire · Combinatoire analytique appliquée

Janvier 2016 - Actuellement

UMI PIMS/Maths Dept · Simon Fraser University · Canada

Chercheur CNRS

Génomique Comparative · Bioinformatique de l'ARN · Génération Aléatoire

Principales collaborations locales avec Cédric Chauve et Marni Mishna

Septembre 2013 - Septembre 2015

LIX · Ecole Polytechnique · France

Chercheur CNRS

Design d'ARN · Génération Aléatoire · Bioinformatique de l'ARN

Membre de l'équipe AMIBio

Novembre 2009 - Septembre 2020

IRIF · Université Paris Diderot · France

Postdoc ANR

Génération Aléatoire · Combinatoire Énumérative · Combinatoire Analytique

Co-encadré par Dominique Rossin et Michèle Soria (LIP6)

Novembre 2008 - Octobre 2009

LIP6 · Sorbonne université · France

Postdoc Decrypthon

Bioinformatique Structurale · Interactions Protéines-Protéines

Encadré par Alessandra Carbone (lIP6)

Avril 2008 - Novembre 2008

Biology Department · Boston College · USA

Postdoc NSF

Bioinformatique de l'ARN · Bioinformatique Structurale

Encadré par Peter Clote

Octobre 2006 - Avril 2008

LRI · Université Paris-Saclay · France

Doctorat en Informatique

Bioinformatique · Combinatoire énumérative · Analyse d'Algorithmes

Équipe Bioinfo du LRI · Encadré par Alain Denise · Rapporteurs de la thèse : Philippe Flajolet et Eric Rivals · Monitorat à l'IUT d'Orsay

Octobre 2003 - Octobre 2006

School of Computer Science · Université Paris-Saclay · France

Master (Maîtrise d'Informatique · DEA Algorithmique)

Informatique Théorique · Combinatoire Énumérative · Analyse et Conception d'Algorithmes

Octobre 2000 - Juillet 2003

Université Paris-Saclay · France

Licence (DEUG Maths/Info · Licence d'Informatique)

Informatique · Mathématiques · Physique

Octobre 1997 - Juillet 2000

Administration, animation et service

Quelques unes de mes activités extra-scientifiques :

Responsable de l'équipe AMIBio@LIX · Depuis 2016
Animateur (avec F. Cazals) du groupe de travail MASIM du Groupe de Recherche en Bioinformatique Moléculaire (GdR BIM) · Depuis 2014
Membre élu (2016-2020) du conseil de laboratoire du LIX
Membre du conseil scientifique pour les bases RNACentral et RFAM, maintenues à l'EMBL-EBI · Depuis 2019
Membre du comité Gilles Kahn/SIF pour la meilleure thèse française en Informatique · Depuis 2018
Membre du conseil scientifique du DIM RFSI · Depuis 2019

Dans le passé, j'ai aussi consacré mes moments perdus à diverses entités :

Membre élu du comité national du CNRS en Informatique (Section 6) et Approches interdisciplinaires pour l'analyse du vivant (CID 51)

Activités éditoriales et relectures

Éditeur associé pour la revue Bioinformatics, publiée par Oxford University Press · Depuis 2019
Direction de comité de programme (ou track/area) pour
- CMSR'14
- ISMB/ECCB'21
Membre du comité de programme de
- RECOMB-CG'21
- SeqBIM'20
- ISMB'20
- RECOMB-CG'20
- APBC'20
- ISMB/ECCB'19
- ACM-BCB'19
- BICOB'19
- RECOMB'19
- APBC'19
- SeqBio'18
- GIW'18
- ISMB'18
- RECOMB'18
- BICOB'18
- ISMB/ECCB'17
- RECOMB'17
- BICOB'17
- SeqBio'16
- ECCB'16
- BioVis'16
- ISMB'16
- BICOB'16
- SeqBio'15
- WABI'15
- BioVis'15
- ISMB/ECCB'15
- BICOB'15
- ECCB'14
- BioVis'14
- ISMB'14
- BICOB'14
- ISMB/ECCB'13
- JOBIM'13
- BICOB'13
- BICOB'12
- JOBIM'12
- WRSBS'12
- JOBIM'11
Relecteur régulier pour les revues
Organisateur d'évènements scientifiques :

Enseignements

Bien que je consacre l'essentiel de mon activité à la recherche scientifique, j'interviens régulièrement au sein de cours de Master et, plus rarement, à un niveau licence.

Université Paris-Saclay · Palaiseau, France

Master AMI2B · M2

Optimisation Combinatoire · Bioinformatique de l'ARN

Depuis 2009

Infos et pointeurs sur l'année académique en cours:

Cours 1 - Alignements [pdf]
Cours 3 - Graphes et assemblage [pdf]
Enoncé TP - Chemins Euleriens et assemblage de k-mers [pdf]
Cours 2 - Structure de l'ARN [pdf]
Enoncé TP - Parsing, comptage et repliement de l'ARN [pdf]
Liste des articles proposés pour présentation
1. Alkan C, Karakoç E, Nadeau JH, Sahinalp SC and Zhang K (2006), "RNA–RNA Interaction Prediction and Antisense RNA Target Search", Journal of Computational Biology., mar 2006. Vol. 13(2), pp. 267-282. Mary Ann Liebert Inc. DOI
2. Chikhi R, Limasset A, Jackman S, Simpson JT and Medvedev P (2015), "On the Representation of de Bruijn Graphs", Journal of Computational Biology., may 2015. Vol. 22(5), pp. 336-352. Mary Ann Liebert Inc. DOI
3. Dondi R, Lafond M and Scornavacca C (2019), "Reconciling multiple genes trees via segmental duplications and losses", Algorithms for Molecular Biology., mar, 2019. Vol. 14(1) Springer Science and Business Media LLC. DOI
4. Ferragina P and Manzini G (2005), "Indexing compressed text", Journal of the ACM., Jul 2005. Vol. 52(4), pp. 552-581. Association for Computing Machinery. DOI
5. Hammer S, Wang W, Will S and Ponty Y (2019), "Fixed-parameter tractable sampling for RNA design with multiple target structures.", BMC bioinformatics., April 2019. Vol. 20, pp. 209. DOI
6. Hoffmann S, Otto C, Kurtz S, Sharma CM, Khaitovich P, Vogel J, Stadler PF and Hackermifmmodeuelseüﬁller J (2009), "Fast mapping of short sequences with mismatches, insertions and deletions using index structures", PLoS Computational Biology., Sep 2009. Vol. 5(9), pp. e1000502. DOI
7. Limasset A, Cazaux B, Rivals E and Peterlongo P (2016), "Read mapping on de Bruijn graphs", BMC Bioinformatics., jun 2016. Vol. 17(1) Springer Science and Business Media LLC. DOI
8. Medvedev P, Pham S, Chaisson M, Tesler G and Pevzner P (2011), "Paired de Bruijn Graphs: A Novel Approach for Incorporating Mate Pair Information into Genome Assemblers", Journal of Computational Biology., Nov 2011. Vol. 18(11), pp. 1625-1634. Journal of Computational Biology. DOI
9. Miklos I, Meyer I and Nagy B (2005), "Moments of the Boltzmann distribution for RNA secondary structures", Bulletin of Mathematical Biology., sep 2005. Vol. 67(5), pp. 1031-1047. Springer Science and Business Media LLC. DOI
10. Myers G (2013), "What's Behind Blast", In Models and Algorithms for Genome Evolution. , pp. 3-15. Springer London. DOI
11. Reidys CM, Huang FWD, Andersen JE, Penner RC, Stadler PF and Nebel ME (2011), "Topology and prediction of RNA pseudoknots", Bioinformatics., feb 2011. Vol. 27(8), pp. 1076-1085. Oxford University Press (OUP). DOI
12. Strothmann D (2007), "The affix array data structure and its applications to RNA secondary structure analysis", Theoretical Computer Science., dec 2007. Vol. 389(1-2), pp. 278-294. Elsevier BV. DOI
13. Xu J and Berger B (2006), "Fast and Accurate Algorithms for Protein Side-Chain Packing", J. ACM. New York, NY, USA, jul 2006. Vol. 53(4), pp. 533–557. Association for Computing Machinery. DOI

Sorbonne Université · France

Master BIM · M2

Bioinformatique de l'ARN · Bioinformatique Structurale

Depuis 2009

Infos et pointeurs sur l'année académique en cours:

Ecole Polytechnique · France

Cycle Ingénieur · L2/M1

Algorithmique et Programmation

2009-2015

Fun stuffs* and ramblings

*Disclaimer: Acquired taste

Neil Gaiman's best tips for survival in an artistic academic career

Even though there are some difference between art and the academia, it is quite striking how some of Neil Gaiman's advise to young artists mirror what I would tell my students (with at least one notable exception... :) ).

The secret to keeping fruitful collaborations [skip to quote]

You get work however you get work, but people keep working [..] because their work is good, and because they're easy to get along with, and because they deliver the work on time. And you don't even need all three... two out of three is fine!

People will tolerate how unpleasant you are if the work is good and you deliver it on time.
People will forgive the lateness of your work if it's good and they like you.
And you don't have to be as good as everyone else if you're on time and it's always a pleasure to hear from you.