General requirements

For first and second year, internship topics are to be validated by Marie-Paule Cani and Erwan Scornet by sending an email mentioning the subject of the internship, the duration, the supervisor and the location of the internship. Once the internship topic is validated, you can put Erwan Scornet as the “Enseignant référent” at Ecole Polytechnique.

First-year internship

Period: from the beginning of April to the end of August (at least 4 months)

Defence: First week of September

An internship either in a private company or in a public lab. The research component of the internship is not mandatory but strongly encouraged. Students are requested to choose a topic related to the curriculum of their graduate degree program ie. involving either machine learning or visual computing, ideally both (see the first and second-year courses for details). This work can be theoretical (comprehension of a theorem and extension to a new setting), applied (developing and implementing a new solution) or mix theory and application.

The report must be at least 20 pages long. It must contain a general presentation of the topic and describe state-of-the-art methods in this field. The contributions of the student must be clearly identified and explained in details. There is no need for an exhaustive description of all codes produced during the internship. However, algorithms highlighting the challenging tasks solved by the student must be presented and explained in the report (if needed, relevant parts of the code can be included as well in an appendix).

Second-year internship

Period: from the beginning of April to the end of September (at least 5 months)

Defence: First week of September (the internship can be pursued after the defence).

A research internship either in the R&D department of a company or in a public research lab. The student must produce original work related to machine learning and/or to visual computing, ideally involving several different topics studied during the whole curriculum. This work can be theoretical or applied as soon as it contains novel ideas developed and validated by the student.

The report must be at least 30 pages long. It must contain a general presentation and motivation for the topic, point-out the related  challenges, and describe state-of-the-art methods in this field. The contributions of the student must be clearly highlighted and explained in details. There is no need for an exhaustive description of all codes produced during the internship. However, algorithms highlighting the challenging tasks solved by the student must be presented and explained in the report (if needed, relevant parts of the code can be included as well in an appendix).

Master 1 internships (4 to 5 months)

Automatic landmark detection on 3D meshes using convolutional neural networks. Anatoscope.

Context : One mission of Anatoscope is to offer solutions to automatically transform medical imaging to complete 3D digital twins of the patients, with the objective of helping diagnostics and improving treatment. One method to construct personalized anatomical avatar is to combine a canonical avatar (3D model) with medical images of the person (CT, MRI, 3D scans…) by registration. Landmark detection is an essential early process in a typical pipeline of establishing registration. It refers to the localization of fiducial key points of the related object. The detected landmarks can be used to initialize parameters of the 3D morphable model. They can also be used directly to determine correspondences between the canonical model and the 2D image or 3D scan. In this work we focus on the case of automatic landmark detection on 3D scan. In practice, the captured 3D scans are often noisy and incomplete, which increases the difficulty of the landmark detection task. (see full proposal)

Link to the full proposal.

Mappiiing - Artificial Intelligence

Link to the full proposal

IDEMIA

See Link to the full proposal

sc.io*

Sujet 1: sc.io, startup spécialisée dans l’extraction automatique de données recherche un(e) stagiaire pour son équipe de “Data Science and Engineering”.

Nous combinons une approche traditionnelle de Deep Learning avec des techniques directement issues de la recherche de type weak supervision qui nous permettent de pratiquement nous affranchir du processus de préparation (labelling) de training sets.

Nous recherchons des stagiaires passionné(e)s par les possibilités du Machine Learning et intéressées par la reconnaissance d’images, le traitement du langage naturel (NLP), la calibration et le deploiement d’algorithmes de RNN et les mathématiques appliquées en général afin d'améliorer l‘approche existante et d’en étendre le champ d’action.

Nos stagiaires ont la possibilité de travailler directement sur (i) les algorithmes utilisés par nos clients et (ii) des résultats de recherche récente publiée lors de conférences de premier plan telles que NIPS par ex.

Ce stage est d'une durée minimale de 4 mois à partir de mars.

Responsabilités: Effectuer des recherches visant à intégrer des techniques de reconnaissance d’image au traitement de documents afin d’en ameliorer la comprehension par nos algorithmes. Validation des résultats a partir d’une base de données publiques ou à construire. Intégrer et collaborer sur des projets de recherche appliquée pour un déploiement chez nos clients.

Qualifications minimales: Expérience à résoudre des problèmes d’analyse à l’aide d’approches quantitatives. Capacité à manipuler et à analyser des données à partir de sources variées. Connaissance dans un langage de programmation de type Python, C# et / ou Java. Formation en ingenierie, mathematiques, informatique ou similaire.

Qualifications souhaitées: Expérience concrete des techniques de Machine Learning. Utilisation de TensorFlow ou Keras

Master 1 or master 2 internship

Ynsect Internship in image recognition and machine learning Ÿnsect is a pioneer and leading company in insect industrial technologies. We develop insect farms. This technology consists, on the one hand, of rearing insects at large scale. On the other hand, it consists of processing insects into proteins and lipids for pet food and fish feed.

R&D USP department is looking for an apprentice in image recognition and machine learning in order to develop methods and tools to contribute to the quality control of industrial insect rearing.

Link to the full proposal

Master 2 internships (5 to 6 months)

Apprentissage Profond pour le suivi systématique de cellules d’embryons vivants imagées par microscopie (LIRRM et CRBM, Montpellier).

L'apprentissage automatique et plus particulièrement l'apprentissage profond (Deep Learning) donnent des résultats très prometteurs dans divers domaines de la recherche en biologie. Le but du stage est d'appliquer l'apprentissage profond au domaine de l'imagerie biologique, et plus particulièrement à la segmentation cellulaire 4D (3D plus temps), la reconnaissance et le suivi de chaque cellule dans des embryons vivants en développement. L’apprentissage se fera sur une base de données préexistante de plus de 10 embryons entièrement segmentés (> 10000 cellules suivies). L’objectif est de créer un suivi des cellules basé uniquement sur l’apprentissage en profondeur. Durant ce stage, en fonction du profil et des intérêts du stagiaire, nous pourrons :
- Implémenter et adapter à notre base de données les méthodes d'apprentissage en profondeur basées sur l'identification d'objets individuels (instance segmentation).
- Explorer les aspects théoriques du concept de mémoire dans les réseaux neuronaux récurrents (LSTM) et les adapter au suivi cellulaire dans des images 3D + temps.
- Utiliser l'apprentissage en profondeur pour prédire et définir les règles de la division cellulaire au cours de l'embryogenèse.

Ce stage de 5 à 6 mois peut déboucher sur un projet de thèse, combinant potentiellement des approches informatiques avec la validation expérimentale des prédictions.

PROFIL ET COMPÉTENCES DE RECHERCHE :

Le stage est principalement destiné aux étudiants ayant une formation initiale en mathématiques et en informatique et un intérêt pour la biologie, mais aussi à des biologistes ayant de très bonnes compétences en programmation informatique et en analyse statistique. Esprit d'équipe, autonomie, dynamisme et créativité seraient appréciés. La maîtrise de l'anglais ou du français technique doit être suffisante pour rédiger la documentation technique et interagir verbalement quotidiennement.

Langage de programmation requis : python L'étudiant sélectionné aura des connaissances de base sur au moins l'un des sujets suivants : la théorie de l'apprentissage automatique, le traitement d'image, le calcul haute performance ou l'utilisation de bibliothèques d'apprentissage en profondeur (par exemple Keras).

Contact : Le stage sera co-encadré par un informaticien (Emmanuel Faure, LIRRM, Montpellier, emmanuel.faure@irit.fr) et un biologiste (Patrick Lemaire, CRBM, Montpellier, patrick.lemaire@crbm.cnrs.fr).

Two internship proposals KAIST, South Korea, contact Jean-Charles Bazin bazinjc@kaist.ac.kr

  • Artificial Intelligence (Deep Learning) Approach for Automatic Editing of Actor’s Facial Performance Videos and Movie Special Effects Link to project proposal
  • Deep Learning Approach for Automatic Capture and Editing of Drone Videos. Link to project proposal

Automatic landmark detection on 3D meshes using convolutional neural networks . Anatoscope.

Context : One mission of Anatoscope is to offer solutions to automatically transform medical imaging to complete 3D digital twins of the patients, with the objective of helping diagnostics and improving treatment. One method to construct personalized anatomical avatar is to combine a canonical avatar (3D model) with medical images of the person (CT, MRI, 3D scans…) by registration. Landmark detection is an essential early process in a typical pipeline of establishing registration. It refers to the localization of fiducial key points of the related object. The detected landmarks can be used to initialize parameters of the 3D morphable model. They can also be used directly to determine correspondences between the canonical model and the 2D image or 3D scan. In this work we focus on the case of automatic landmark detection on 3D scan. In practice, the captured 3D scans are often noisy and incomplete, which increases the difficulty of the landmark detection task. (see full proposal)

Link to the full proposal.

Reconnaissance automatique de la parole (Airbus Elancourt).

See Link to the full proposal

Contact: mohamed.bouaziz@airbus.com

Text-Mining et population de bases de connaissances (Airbus Elancourt).

See Link to the full proposal

Contact: mohamed.bouaziz@airbus.com

Exploring deep learning for Virtual Reality (Immersion, Bordeaux)

En charge de la recherche pour la société Immersion (leader Européen en réalité virtuelle), je recherche des candidats potentiels pour un stage orienté IA. Le stage consistera à élaborer une stratégie d’exploration des potentiels du deep learning dans notre contexte de développement. Il s’agira également de soutenir les développements actuels sur le sujet afin d’aboutir à des prototypes démonstratifs.

Contact: Julien Castet julien.castet@immersion.fr

Start-up FeetMe

-Envie de découvrir une véritable MedTech? qui développe son propre dispositif médical connecté, leader dans son domaine qui intègre à une plateforme centralisée des données de santé.

-Envie de travailler au développement de biomarqueurs digitaux de demain liés à la mobilité sur des données collectées avec les meilleurs centres experts.

Si tu souhaites découvrir l'environnement d'une startup en pleine croissance, avec une véritable ADN tech et avec des solutions technologiques de rupture, tu trouveras plus de détail dans nos offres de stage:

Link to the full proposal

IDEMIA

See Link to the full proposal

Laboratoire de météorologie dynamique: The power of deep learning applied to oceanic eddy detection

See Link to the full proposal

CRITEO

See Link to the full proposal

THALES

If you are interested by one of these internships, please contact Iwona Piskulska iwona.piskulska@thalesgroup.com or Frederic Barbaresco frederic.barbaresco@thalesgroup.com.

2019_stage_deeplearning_optimisation.pdf

2019_stage_denoising.pdf

descriptif_de_projet_masterx_thalesatm_beatricepesquetpopescu.pdf

stage_etude_intelligence_artificielle_pour_systeme_de_defense_multi-agents.pdf

SAFRAN

Deep Learning in the field of numerical experiments

offre_stageia_safrantech.pdf

EDF

Apprentissage par renforcement. Contact SCHMITT Damien damien.schmitt@edf.fr

stage_apprentissage_renforcement_2019_acceleration.doc

stage_apprentissage_renforcement_2019_interpretabilite.docx

stage_apprentissage_renforcement_2019_es.doc

stage_apprentissage_renforcement_2019_contraintes.doc

PhD thesis proposals

Automatiser une chaine de renseignement militaire (THALES, apprenti ou thèse sur 3 ans).

L’observation est permanente. On traite plus de 10 000 interceptions par jour soit plusieurs dizaines ou centaines de millions d’impulsions radar élémentaires. Le traitement est automatique mais il peut y avoir par exemple 1% d’échec ce qui représente entre 100 ou 1000 interceptions ou plus. Le traitement fait un diagnostic de chaque interception sur chaque paramètre pour savoir si il y a correspondance avec un signal cible. Le traitement analyse pour cela plus de 100 paramètres, avec une hiérarchie sur les types d’erreur rencontrés. Il peut être aussi amené à déclencher des actions pour compléter les faits à disposition. Les diagnostics élémentaires sont tous automatisés.

Quand tout ne « match » pas, il faut déterminer si c’est un signal inconnu ou une variante d’un mode d’émission connu. Et faire l’analyse des causes.Et compléter en conséquence la base de données. Tant qu’on a pas « légiférer » sur le type de problème rencontré, c’est un opérateur expert qui décide. On dispose donc d’une pseudo-réalité terrain.

Pour traiter automatiquement ces situations d’échec on envisage l’utilisation :

- D’un apprentissage d’arbres de décisions pour retrouver automatiquement le bon diagnostic. A ce niveau l’explication (retour aux causes) est indispensable.

- De régles locales définies par l’expert sur les noeuds terminaux.

Pour l’apprentissage, nous envisageons d’utiliser :

- une technique rapide ne donnant pas forcément d’explication pour approcher la performance décisionelle que nous pourions atteindre

- Une technique à base d’arbres de décision pour avoir la possibilité d’expliquer le raisonement (et à terme de le compléter)

Nous avons réalisé il y a 20 ans un procédé type CART avec apprentissage local de densités de probabilités par Kernel. Dans le cadre d’une thèse nous aimerions approfondir la pertinence de ce type de technique avec les forets aléatoires. Il faudra aussi compléter (voir plus loin).

Dans le cadre de l’apprenti, nous voulons réaliser un véritable prototype travaillant sur données réelles (d’où une nécessité d’habilitabilité de celui-ci au niveau confidentiel requis). Et mettant en œuvre les techniques que nous trouvons sur étagère, puis les techniques plus raffinées extraites de la thèse.

Sur les nœuds terminaux de l’arbre, il pourrait être nécessaire d’améliorer le traitement en lançant des diagnostics partiels plus élaborés, répetoriés ou construis adhoc à la premiere fois ou le cas serait rencontré. Pour cela des régles simples de déclenchement d’action et de décision semblent idéales. Se posera alors le problème du maintien en cohérence des systèmes locaux de régles et les problèmes de généralisation et spécialisation.

Contact : Jean-Francois Grandin jean-francois.grandin@fr.thalesgroup.com

THALES

See propositiondethese_tlasome_lip6.pdf