Laboratoire d'informatique de l'École polytechnique

Events

Optimizing Big Data Computations: Queries and Algebra in a Single Framework

Speaker: Ioana Manolescu (équipe CEDAR)
Location: https://cisco.webex.com/cisco/j.php?MTID=me3bf13b6e414da654a0266fd6b9a7d2f
Date: Thu, 21 Jan 2021, 13:00-14:00

The database management industry is worth $55 bn according to a recent Gartner report, and its importance is growing in particular as more platforms specialize in very large scale data management in cloud platforms. At the core of database management systems (DBMS)’s success lie declarativeness and its twin, automatic performance-oriented optimization. This has enabled users to specify what computation they want executed over the data, not how to execute it. Instead, a dedicated DBMS module called query optimizer enumerates alternative evaluation methods and, with a help of a computational cost model, selects the one estimated to be the more efficient.

For data stored in relational tables, optimizers have, since 1970, helped launch a booming industry, whose products are at work several times in the average day of everyone in a modern society. More recently, novel systems, in particular the so-called NoSQL stores, were developed, each with specific performance advantages, and going beyond tabular data to XML or JSON documents, key-value stores etc. In parallel, the developing interest in machine learning on Big Data has lead to hybrid workloads, which mix database-style queries (fundamentally, logical formulas) and ML-specific operations (complex matrix computations). These developments have complexified the landscape of modern Big Data management and the life of developers, since computations split across systems are often executed “as-such” and do not benefit from automatic optimization.

I will describe Estocada, a project started in 2016 with the purpose of providing a unified optimization framework (a) for queries specified across a large variety of data models, and (b) for workloads mixing queries with ML computations. At the heart of Estocada lies an old powerful tool in database research, namely the chase. I will explain Estocada’s approach for uniformly modeling heterogeneous data models, including numerical matrices, in a relational model with constraints, and how it leverages a modern variant of the chase to automatically rewrite computations spanning across heterogeneous data models and across systems such as Spark, SystemML, TensorFlow and SparkSQL, as well as relational databases an document stores such as MongoDB.

This is joint work with: Rana Al-Otaibi (UCSD), Damian Bursztyn (Inria), Bogdan Cautis (U. Paris-Saclay), Alin Deutsch (UCSD), Stamatis Zampetakis (Inria).

Exposé par Jean Fromentin : «Expérimentations sur les séries génératrices des groupes des tresses»

Speaker: Jean Fromentin
Location: BBB
Date: Jeu. 14 janv. 2021, 14h00-15h00

Le séminaire commun LIX-LRI-IRIF reprend son format habituel cette semaine, et il aura lieu jeudi 14 janvier à 14h. Nous écouterons Jean Fromentin, de Calais, qui parlera des séries génératrices pour compter des tresses, avec une approche algorithmique.

L’exposé aura lieu sur BigBlueButton. Lien de connexion : https://bbb.lri.fr/b/jer-k22-eqk

Résumé : Dans cet exposé, je présenterai de nouveaux outils algorithmiques pour étudier les séries génératrices sphériques et géodésiques des groupes des tresses relativement aux générateurs d’Artin ou de Birman-Ko-Lee. Je finirai par une présentation des résultats obtenus et par la formulation de conjectures pour les groupes des tresses à 3 et 4 brins relativement aux générateurs de Birman-Ko-Lee.

Soutenance de thèse de Thomas Buffet: «Field based approaches for the collision-free animation of layered and dynamic clothing»

Speaker: Thomas Buffet
Location: Zoom
Date: Mer. 13 janv. 2021, 15h00-17h00

Thomas Buffet, de l’équipe GeoViC, soutiendra sa thèse intitulée Field based approaches for the collision-free animation of layered and dynamic clothing le Mercredi 13 janvier à partir de 15h.

La soutenance aura lieu via Zoom : https://ecolepolytechnique.zoom.us/j/81148077723?pwd=T29zZUlHTVVDY2k2VHJWL2Rpb0dMZz09

Résumé : Gérer de manière robuste et efficace les collisions entre des surfaces 3D déformables en animation reste un challenge, d’autant plus lorsque ces surfaces sont potentiellement en contact sur de larges zones, comme c’est le cas pour les vêtements. Par conséquent, les avatars virtuels ne portent souvent qu’une seule couche, ce qui nuit à la modélisation de phénomènes comme la friction entre les vêtements, et limite aussi les possibilités créatives. Nous proposons deux approches alternatives à la détection et la gestion de collisions classique, basé maillage, en nous basant sur l’utilisation de champ volumiques. Plus précisément, nous présentons deux méthodes, la première utilisant une représentation par surface implicite des couches de vêtements pour gérer d’éventuelles intersections statiques, et la seconde plongeant les vêtements dans un champ de vecteur modélisant leur vitesse.

Premièrement, nous présentons une méthode de démêlement statique de vêtement. Cette méthode se base sur une réprésentation intermédiaire des vêtements en tant que surfaces implicites -iso-niveau d’un champ scalaire- ouvertes. Pour N couches de vêtements, les N surfaces implicites associées sont combinés à l’aide d’opérateur N-aire que nous avons créé pour ce problème. Nous obtenons N nouvelles surfaces, telles que les intersections entre les surfaces initiales ont été remplacés par des zones decontact.

Deuxièmement, nous proposons une méthode utilisant un champ de vecteur pour l’animation sans collisions d’un nombre quelconque de couches devêtements. A chaque pas de temps et après simulation, la vitesse des vêtements est convertie en unchamp de vecteurs discret, dont nous contraignons localement la divergence pour éviter les collisions entre des surfaces advectés par ce champ.