Programme du parcours DRM

STATISTIQUES ET INTELLIGENCE ARTIFICIELLE

Cette UE vise à donner aux étudiants les bases fondamentales de techniques classiques en modélisation statistique tout en présentant une ouverture vers des thématiques de recherche contemporaines. Elle prévoit deux parties. Une première partie porte sur une introduction aux séries temporelles, les modèles de régression pénalisée et l’analyse de sensibilité. Pour la deuxième partie, l’accent est mis sur les bases méthodologiques de l’apprentissage statistique. Parmi les thèmes abordés nous retrouvons le model-based clustering, les arbres de décision et forêts, les réseaux de neurones, les réseaux bayesians, les techniques de re-échantillonnage et validation croisée, le bootstrap, le boosting.

GESTION DES RISQUES EN ENTREPRISES

Processus de risque en entreprises
Manipuler le risque dans l’entreprise, cela consiste à le définir, l’évaluer, le prévenir, le couvrir, le garantir et le gérer. Sous un angle financier et opérationnel, les étudiants appréhenderont le traitement du risque (Risk Management) à travers :
• L’évolution de la réglementation (les accords de bâle, solvency),
• Le cadre normatif (les normes isO),
• L’utilisation des statistiques,
• La gestion de projet,
• La diffusion de la culture du risque
• Les risques informatiques,
• Le plan de continuité d’activité (PCA).
Les étudiants seront amenés à participer activement à travers des exercices pratiques, des revues de presse, des interventions de professionnels de la gestion du risque ou encore la visite d’une entreprise.

Introduction à l'ERM
Dans ce cours, les bases de l’enterprise Risk Management sont abordées, du processus à l’implémentation sur des études de cas concrètes. La quantification des risques est abordée succinctement, tout comme les modèles de capital économique pour les compagnies d’assurance et les banques.

DATA MINING AVANCE

Cet enseignement vient renforcer les connaissances acquises au cours du programme de «Data Mining, Text Mining et Data visualisation » et les approfondir. Il offre également une ouverture sur les outils pouvant intervenir dans un contexte lié au phénomène du big Data. Les méthodes d’aide à la décision multicritère seront également présentées.
L’approfondissement des connaissances passera par la présentation de nouvelles méthodes permettant de construire des modèles prédictifs: forêts d’arbres aléatoires, algorithmes génétiques, clustering flou...
Les méthodes seront expérimentées dans une démarche de recherche de performance. elles seront également considérées dans le contexte d’une volumétrie de données importante et les adaptations envisageables dans ce contexte seront explorées et appliquées : optimisation de code, parallélisation des calculs en mémoire partagée ou distribuée.
Prérequis : enseignement d’analyse de données et de clustering, de Data Mining (arbres de classification…), notions avancées de langage R.

RISQUES TECHNIQUES ET FINANCIERS

Risque de marché
Cet enseignement est destiné à :
- Comprendre et construire une courbe zéro coupon à partir de données de marché standards (FRa, futures, Taux de swap etc …),
- Comprendre le fonctionnement des instruments dérivés de taux et de change,
- Modéliser et pricer certains produits dérivés (swap de taux, Options de change, change à terme etc …).
Tous les cas pratiques s’appuient sur le logiciel excel ainsi qu’une bonne assise en mathématiques financières (Capitalisation, actualisation, calcul de taux forward, loi normale standard, etc …) des étudiants.

Aspects comptables et Finance d'entreprise
Introduction à la finance d’entreprise à travers la présentation et l’analyse des documents comptables (9hCM, 12hTD, MCC : CT)
- Introduction aux notion comptables :de la construction des documents comptables à leur lecture,
- Présentation de la gestion du risque client : analyse de documents comptables produits par les entreprises,
- Présentation des indicateurs de risques financiers des entreprises (liquidité, solvabilité, ...) : détermination et analyse.

Mesure de risques financiers
La modélisation des risques pour donner du sens et permettre des prévisions rationnelles tant sur l’apparition des risques que sur leur couts financiers.
la partie de l’UE consacrée à cette problématique traitera d’une part des outils de modélisation des risques, incluant les copules pour la modélisation des dépendances, les ordres stochastiques pour la comparaison des risques.
D’autre part, on présentera les mesures de risques classiques (VaR, TVaR et CTE
notamment), leurs propriétés et les méthodes de calculs et d’estimation.

INFORMATIQUE

Le but de cet UE est de prolonger l'apprentissage du langage python en abordant des nouveaux pans des possibilités offertes par ce langage (interaction avec les BDD, scraping, parallélisation de code...) et de renforcer les méthodes de développement et bonnes pratiques de programmation via notamment les tests et le versionning du code.

DATA MINING, TEXT MINING ET VISUALISATION

Cet enseignement sera développé autour de trois axes :
- Un axe prolongeant l’enseignement d’analyse de données et de segmentation en abordant des techniques d’analyse sortant du cadre de l’analyse exploratoire et permettant de construire des modèles prédictifs : arbres de segmentation, de régression, réseaux de neurones…
- Un axe dédié au développement de connaissances autour des techniques de Text Mining.
Après une présentation des outils permettant de collecter et reformater de l’information textuelle, des méthodes et des synthèses d’information classiques dans ce type d’analyse, quelques exemples d’applications seront présentés.
- Un axe développant les compétences autour des outils adéquats à la construction de représentations graphiques à la fois adaptées aux méthodes présentées et à la nature des données analysées et offrant des possibilités d’interactivité lorsque cela présente un intérêt pour l’utilisateur.

METHODES DE GESTION DES RISQUES AVANCEES

Les banques, assurances ou autres entreprises financières, dont les sociétés des services, se basent sur l’IA, dont le Machine Learning fait partie, pour interpréter les données et réduire les risques de fraude ; mais également sur les techniques de simulation pour envisager les impacts et la sensibilité des processus. Cela requière une manipulation avancée des données dans la gestion des risques :

  • La préparation des données : nettoyage et mise en production;
  • Les algorithmes de bases et avancés qui permettent l’identification d’opportunité dans le temps pour investir au meilleur moment, mais également de détecter les clients présentant des risques ou d’identifier les signaux révélateurs de fraude avec une modélisation de systèmes interdépendants;
  • Les méthodes de régression (Linéaire, PLS, logistique) pour l'évaluation des impacts;
  • Les méthodes de simulation de données : méthodes de tirages aléatoires (tirage aléatoire simple avec et sans remise, tirage aléatoire simple avec strate ou méthode des quotas, tirage pseudo-aléatoire (tirage par grappes, tirage systématique, tirage selon probabilité proportionnelle à une taille)), rééchantillonage par méthode bootstrap, estimation d’intervalle de confiances;
  • Le processus d’automatisation et itératif qui permet le passage en production des modèles et expériences acquises par les algorithmes;
  • L’évolutivité pour envisager une récurrence dans la performance des algorithmes avec l’introduction de nouvelles étiquettes au cours du temps.

Cette UE prévoit deux cours : Système d’auto-apprentissage des risques par IA et Analyse d’impact et de sensibilité.

SONDAGE ET MANIPULATION DE LA DONNEE

Sondage
Le cours aborde différentes méthodes de sondages, leurs caractéristiques statistiques, ainsi que les situations dans lesquelles elles peuvent se révéler pertinentes :
- sondages simples,
- sondages stratifiés, sondages à deux degrés,
- post-stratification et autres techniques de redressement.

SAS
L’objectif de cet enseignement est de former à la mise en application des différentes méthodes d’analyses statistiques sur des problématiques d’études réelles à l’aide du logiciel SAS. Différents points seront abordés pour cela :
- Création de librairie SAS
- Data management : Création de tables, de variables, mise en forme des variables (format, label, renommage), concaténation et fusion de tables, transposition de tables, concaténation de variables;
- Statistiques descriptives pour des données quantitatives et des données qualitatives, représentations graphiques , recherche de points atypiques;
- Tests statistiques : Tests paramétriques et non paramétriques sur la comparaison de deux moyennes, test de corrélation et comparaison de proportions, test des prérequis pour l’utilisation de tests paramétriques (test de normalité et comparaison de deux variances);
- Modélisation : régression linéaire, modèle logistique (données binomiales, multinomiales et ordinales), comparaison de 3 moyennes ou plus à l’aide de modèle mixte (données indépendantes et données répétées), test des prérequis pour la validation des modèles mixtes (test de normalité et comparaison de trois variances ou plus);
- Analyses multivariées : ACP, méthodes de classification et analyse discriminante;
- Création de rapports.

ANGLAIS

L’évaluation du cours se fait en contrôle continu chaque semaine sur les activités en classe et le travail demandé à domicile. Les étudiants sont évalués sur leur motivation, leur questionnement, la participation et la communication en anglais pendant le cours.
Les notes porteront sur les 4 critères suivants représentant chacun ¼ de la note : écrit, oral, présentation et compréhension orale.
L’évaluatioSn finale correspond à la moyenne de l’ensemble des notes obtenues et sera abaissée de 10% par absence injustifiée dans le semestre.