Pré-requis
  • DATA832
  • INFO831
 
Descriptif

Ce module s'inscrit dans la continuité des modules DATA832 et INFO831 dans lesquels le B.A.-ba de la science des données a été présenté à travers les différents paradigmes de l'apprentissage automatique et de la statistique exploratoire et expérimenté avec la machinerie algorithmique de base, mettant en évidence les limites des outils basiques de modélisation. Un ensemble de méthodes avancées, étendant les fondamentaux de l'apprentissage, est présenté dans ce module. Chacune des approches permet d'améliorer le processus d'apprentissage en se focalisant sur un aspect particulier, par exemple la réduction de la variance des décisions, le traitement de problèmes non linéaires, ou encore l'apprentissage à partir d'un très grand nombre d'exemples et l'extraction automatique de caractéristiques. A une présentation conceptuelle des différentes méthodes, sera associée une réflexion sur leur implémentation et une expérimentation basée sur des cas concrets de recherche et développement.

 

  

Contents
  • ensemble methods (bagging, random forests, boosting)
  • vector support machines, kernel methods
  • deep learning
  • renforcement methods
  • time series, sequential patterns

Pré-requis
Tous les modules de la formation
 
Descriptif
L'objectif de ce module est de donner les bases méthodologiques
  1. d'une recherche documentaire
  2. d'une synthèse bibliographique, c'est-à-dire le compte rendu et l'analyse critique d'un ensemble de documents portant sur un même thème, à partir de critères explicites
 
  

Pré-requis
  • Systèmes distribués à large échelle (INFO 833)
  • Bases de données distribuées (INFO 834)
 
Descriptif

Les précédents projets (PROJ 631, 831, 931) visaient un développement et une exploitation sur un ordinateur personnel. Dans ce projet, il s'agira de dépasser les limites d'une unique machine et de considérer une approche Big Data et ses 3V : Volume, Vitesse et Variété. Sur ce projet, les étudiants devront fournir un système clé en main (par l'intermédiaire d'une machine virtuelle ou d'un conteneur Docker) répondant au problème posé. Ils devront donc trouver l'architecture nécessaire à mettre en place, les outils à utiliser ou créer et les bases de données à définir, tout cela dans le cadre d'un Cloud.