Learning from structured data

UE : Learning from structured data – Apprentissage à partir de données structurées
Responsable(s), établissement(s) Florence d’Alché-Buc, UEVE
Adresse(s) mail florence.dalche@ibisc.fr
Autres intervenants et établissements Marie Szafranski, ENSIIEmarie.szafranski@ensiie.fr
Lieu principal d’enseignement Plateau de Saclay
ECTS 2.5
Nombre d’heures total 21
Cours 18
TD
TP 3
Objectifs Se familiariser avec les méthodes d’apprentissage statistique dédiées aux données structurées : graphes, arbres, séquences, objets composites qu’on retrouve dans de nombreux domaines : signal, image, vidéo, texte, web, genome, biomédical. Seront abordés des problèmes de classification et de régression structurées, parmi lesquels la régression multi-tâches et la modélisation/prédiction de données structurées.
Prérequis Bonnes notions de probabilités, de statistiques, de théorie de l’information et d’optimisation. Notions de base d’apprentissage statistique.
Syllabus Données structurées en entrée
Applications : selection de caractéristiques, brain computer interface, classification de documents, études d’association sur génome entier

  • RKHS pour méthodes à noyaux
  • Noyaux pour les données structurées (noyaux sur arbres, sur graphes, etc.)
  • Parcimonie structurée : des descripteurs aux noyaux, des groupes aux hiérarchies

Données structurées en sortie (et en entrée)
Applications : apprentissage multi-labels, régression multi-tâches, prédiction de liens/inférence de réseaux, traduction automatique…

  • Méthodes à vastes marges pour la prédiction structurée
  • Inferential (theory of generalization, sampling, statistical testing)
  • Maximum d’entropie et champs aléatoires conditionnels pour la prédiction structurée
  • Méthodes à noyaux à valeur opérateur