Deux nouveaux sujets M2 pour un stage chez MLstate. Pour plus de détails, cf. le billet qui introduisait les sujets de stage précédents.
Sujet : Bases de données
Toute application web dépend d’une base de données pour le stockage des informations à long terme. Si la fiabilité du stockage lui-même, est un problème largement étudié, la fiabilité des entrées-sorties soulève de nombreuses questions qui restent à explorer. En particulier, que faut-il faire si des données manquent, si le format des données a changé, si les données ont été (re)réparties selon des critères différents des critères attendus.
Dans le cadre de ce travail, l’étudiant prendra part à la recherche et au développement de MLstate sur les questions d’interaction entre stockage et application web, notamment les notions de partage de données entre applications web et de mise-à-jour du format des données.
Ce travail sera dirigé par Louis Gesbert et impliquera de la programmation en OCaml et en OPA.
Sujet : Interaction entre bases de données relationnelles et bases de données structurées
Toute application web dépend d’une base de données pour le stockage des informations à long terme. Le paradigme de stockage employé par la majorité des applications à ce jour est une extension du modèle relationnel, au sens où les informations sont stockées dans des tables (ou “relations”), tables prévues pour être manipulées par un être humain et liées par des clés explicites. À l’inverse, un autre paradigme de bases de données, parfois appelé “structuré”, “algébrique” ou “objet”, stocke les informations sous la forme de structures de données, prévues pour être manipulées par un programme et liées par des références implicites.
Dans le cadre de ce travail, l’étudiant prendra part à la recherche et au développement de MLstate sur l’unification des modèles relationnels et structurés. En particulier, l’étudiant devra concevoir et implanter des techniques permettant d’exploiter des bases de données relationnelles et des données préexistantes dans le cadre d’un paradigme structuré, ainsi que de porter au modèle structuré les outils de consultation traditionnellement exploités dans le modèle relationnel.
Ce travail sera dirigé par Louis Gesbert et impliquera de la programmation en OCaml, en OPA et dans divers dialectes de SQL.