Programme du parcours EQUADE

STATISTIQUES ET INTELLIGENCE ARTIFICIELLE

Cette UE vise à donner aux étudiants les bases fondamentales de techniques classiques en modélisation statistique tout en présentant une ouverture vers des thématiques de recherche contemporaines. Elle prévoit deux parties. Une première partie porte sur une introduction aux séries temporelles, les modèles de régression pénalisée et l’analyse de sensibilité. Pour la deuxième partie, l’accent est mis sur les bases méthodologiques de l’apprentissage statistique. Parmi les thèmes abordés nous retrouvons le model-based clustering, les arbres de décision et forêts, les réseaux de neurones, les réseaux bayesians, les techniques de re-échantillonnage et validation croisée, le bootstrap, le boosting.

INFORMATIQUE

Le but de cet UE est de prolonger l'apprentissage du langage python en abordant des nouveaux pans des possibilités offertes par ce langage (interaction avec les BDD, scraping, parallélisation de code...) et de renforcer les méthodes de développement et bonnes pratiques de programmation via notamment les tests et le versionning du code.

DATA MINING, TEXT MINING ET VISUALISATION

Cet enseignement sera développé autour de trois axes :
- Un axe prolongeant l’enseignement d’analyse de données et de segmentation en abordant des techniques d’analyse sortant du cadre de l’analyse exploratoire et permettant de construire des modèles prédictifs : arbres de segmentation, de régression, réseaux de neurones…
- Un axe dédié au développement de connaissances autour des techniques de Text Mining.
Après une présentation des outils permettant de collecter et reformater de l’information textuelle, des méthodes et des synthèses d’information classiques dans ce type d’analyse, quelques exemples d’applications seront présentés.
- Un axe développant les compétences autour des outils adéquats à la construction de représentations graphiques à la fois adaptées aux méthodes présentées et à la nature des données analysées et offrant des possibilités d’interactivité lorsque cela présente un intérêt pour l’utilisateur.

DATA MINING AVANCE

Cet enseignement vient renforcer les connaissances acquises au cours du programme de «Data Mining, Text Mining et Data visualisation » et les approfondir. Il offre également une ouverture sur les outils pouvant intervenir dans un contexte lié au phénomène du big Data. Les méthodes d’aide à la décision multicritère seront également présentées.
L’approfondissement des connaissances passera par la présentation de nouvelles méthodes permettant de construire des modèles prédictifs: forêts d’arbres aléatoires, algorithmes génétiques, clustering flou...
Les méthodes seront expérimentées dans une démarche de recherche de performance. elles seront également considérées dans le contexte d’une volumétrie de données importante et les adaptations envisageables dans ce contexte seront explorées et appliquées : optimisation de code, parallélisation des calculs en mémoire partagée ou distribuée.

SONDAGE ET MANIPULATION DE LA DONNEE

Sondage
Le cours aborde différentes méthodes de sondages, leurs caractéristiques statistiques, ainsi que les situations dans lesquelles elles peuvent se révéler pertinentes :
- sondages simples,
- sondages stratifiés, sondages à deux degrés,
- post-stratification et autres techniques de redressement.

SAS
L’objectif de cet enseignement est de former à la mise en application des différentes méthodes d’analyses statistiques sur des problématiques d’études réelles à l’aide du logiciel SAS. Différents points seront abordés pour cela :
- Création de librairie SAS
- Data management : Création de tables, de variables, mise en forme des variables (format, label, renommage), concaténation et fusion de tables, transposition de tables, concaténation de variables;
- Statistiques descriptives pour des données quantitatives et des données qualitatives, représentations graphiques , recherche de points atypiques;
- Tests statistiques : Tests paramétriques et non paramétriques sur la comparaison de deux moyennes, test de corrélation et comparaison de proportions, test des prérequis pour l’utilisation de tests paramétriques (test de normalité et comparaison de deux variances);
- Modélisation : régression linéaire, modèle logistique (données binomiales, multinomiales et ordinales), comparaison de 3 moyennes ou plus à l’aide de modèle mixte (données indépendantes et données répétées), test des prérequis pour la validation des modèles mixtes (test de normalité et comparaison de trois variances ou plus);
- Analyses multivariées : ACP, méthodes de classification et analyse discriminante;
- Création de rapports.

TECHNIQUES ECONOMETRIQUES POUR L'EVALUATION

Ce cours présente les principales méthodes quantitatives d'évaluation d'impact des politiques dans les domaines économiques, médicaux, et sociaux. Le but est d'avoir des outils afin d'évaluer l’efficacité de différents programmes. Après avoir défini les problèmes d’effet causal, de participation endogène et de biais de sélection rendant complexes de telles évaluations, les méthodes expérimentales seront présentées (randomisation, expériences de terrain (field experiments)). Les méthodes quasi-expérimentales et contrefactuelles seront ensuite développées : méthodes d’appariement (score de propension, extension kernel matching estimator, pondérations), méthodes par variables instrumentales, méthodes par doubles différences, discontinuité de régression (RD et RKD). Les techniques présentées seront systématiquement illustrées par des exemples sur données réelles et elles seront mises en oeuvre sous différents logiciels.

ECONOMETRIE ET MICROECONOMIE APPLIQUEE

Ce cours consiste à enrichir les connaissances économétriques des étudiants en leur présentant les modèles de durée (Kaplan Meier, Cox,modèles à durée de vie accélérée) et de comptage et leurs applications dans différents domaines (économie industrielle, assurance, éducation, économie de la santé et du travail, etc.). La mise en œuvre de l’estimation de ces modèles via le logiciel STATA sera présentée. Une partie du cours est consacrée à la mise en situation des étudiants aux tâches de chargés d’études statistiques et de chercheurs autour de problématiques de microéconomie appliquée. Des thématiques seront proposées aux étudiants afin de les faire réfléchir sur les méthodes économétriques et statistiques à privilégier en fonction de différents scénarios de données disponibles. L’idée est de discuter des avantages et des inconvénients des méthodologies acquises tout au long de leur cursus et de les mettre en concurrence. Des modèles en marge de ceux déjà vus (certains modèles à équations simultanées, modèles de switching, modèles à variables qualitatives pour panel, analyse multiniveau) seront aussi abordés.

DECISION ECONOMIQUE APPLIQUEE

Cette UE de décision économique appliquée sera composée de 3 enseigements sur les thématiques suivantes : économie du travail, économie des comportements et évaluation des politiques de santé.
L'enseignement d'économie du travail vise à décrire et expliquer les faits stylisés majeurs du fonctionnement contemporain du marché du travail dans les pays industrialisés. Il aborde les principales théories explicatives des comportements individuels (demande et offre de travail) et analyse les problèmes de coordination qui conditionnent les situations d’équilibre ou de déséquilibre (chômage) sur le marché du travail. L’enchainement des chapitres traités suit le processus d’insertion professionnelle des offreurs, pour aborder successivement les décisions d’investissement éducatif, de participation, de recherche d’emploi et de recrutement, jusqu’à l’analyse des mécanismes d’incitation et de promotion. Chaque chapitre s’articule en trois étapes. L’observation de faits stylisés par référence aux statistiques nationales ou internationales sert de point d’ancrage à la présentation d’une théorie explicative dans une deuxième étape. La troisième étape offre des illustrations de tentatives de réfutation soit économétriques, soit expérimentales des modèles explicatifs présentés.
L'enseignement en économie des comportements présente les principales avan­cées de l'analyse comportementale appliquée aux domaines de l'assurance, de la finance et de l'économie en général : comportement des consommateurs et du maketing à partir du point de vue de la théorie des perspectives, effet de cadrage (biais de statu quo, comptabilité mentale, excès de confiance, incohérence temporelle (actualisation et projection temporelle et point de référence, engagement et pro­crastination), préférences sociales (équi­té, réciprocité, confiance, altruisme et envie). Ainsi, il expose des modèles fondés sur la psy­chologie sociale capable d’expliquer les anomalies du marché telles que des bulles spéculatives, et met en lumière comment la structure de l’information et les caractéristiques idio­syncrasiques des acteurs influencent t les décisions individuelles, ainsi que les résultats du marché.
Le troisième enseignement permet de former des spécialistes de l’évaluation des programmes et des politiques dans le domaine de la santé et de l’action sociale, même si des exemples concernant d’autre champs disciplinaires seront étudiés (économie des transport, de l’environnement, etc). Les étudiants appréhendent les problématiques relatives à l’évaluation socio-économique des politiques publiques et se familiarisent avec les différentes phases des projets, qu’il s’agisse du contexte économique (objet principal ou secondaire), de la méthodologie (critères économiques, critères d'efficacité, approches quantitatives) ou de l’évaluation des résultats. L’objectif est de développer des compétences dans la conduite opérationnelle de projets et de maîtriser les approches quantitatives d’évaluation (la minimisation des coûts, le calcul coût-efficacité et coût utilité, l’évaluation du bien-être collectif global).

ANGLAIS

L’évaluation du cours se fait en contrôle continu chaque semaine sur les activités en classe et le travail demandé à domicile. Les étudiants sont évalués sur leur motivation, leur questionnement, la participation et la communication en anglais pendant le cours.
Les notes porteront sur les 4 critères suivants représentant chacun ¼ de la note : écrit, oral, présentation et compréhension orale.
L’évaluation finale correspond à la moyenne de l’ensemble des notes obtenues et sera abaissée de 10% par absence injustifiée dans le semestre.