Pouvez-vous nous parler de votre formation ?
Très intéressé par les mathématiques et la p
hysique, j’ai commencé mes études supérieures en classe préparatoires scientifiques, puis à l’Université, où, envisageant d’abord la carrière d’enseignant, j’ai préparé l’agrégation. Suite à cela, après avoir pris conseil auprès de ma famille et de mes professeurs, j’ai décidé de poursuivre mes études par un Master 2 de recherche, en mathématiques appliquées (ce qui n’allait pas de soi, étant donné que l’agrégation forme presque exclusivement aux mathématiques fondamentales), ce domaine offrant aujourd’hui plus de débouchés. Ma thèse a ensuite porté sur une analyse théorique de l’apprentissage des réseaux de neurones, ce qui m’a permis d’enrichir et d’appliquer mes connaissances en théorie des probabilités à une méthode très concrète d’analyse de données.
Comment êtes-vous arrivé jusqu'à l'enseignement ?
Comme je l’ai dit précédemment, l’enseignement m’a toujours intéressé et j’ai d’abord suivi une formation d’enseignant. Je suis très attaché à ce lien entre enseignement et recherche : bien souvent, en préparant un cours sur une notion, en réfléchissant aux formulations les mieux adaptées au socle de connaissance de l’auditoire, et en s’imaginant toutes les questions que ce dernier pourrait se poser, on acquiert un nouveau regard sur cette notion, on la comprend mieux, on la voit « de plus haut », intégrée et reliée aux autres notions scientifiques qui lui sont connexes.
Dans quel(s) domaine(s) vous êtes-vous spécialisé ?
Je me suis spécialisé dans les probabilités et les statistiques, et plus particulièrement dans leur applications aux méthodes d’apprentissage automatique. Durant ma thèse, j’ai appliqué des méthodes probabilistes provenant de la physique statistique à l’étude des réseaux de neurones à une couche cachée ayant un grand nombre de neurones. Durant mon postdoctorat, j’ai travaillé sur l’apprentissage fédéré et la confidentialité différentielle.
Quel cours allez-vous donner à l'ISFA ?
Je donnerai des cours d’analyse, de probabilités et de statistiques. En particulier, je donnerai à des élèves de master un cours sur les méthodes de simulation informatique de phénomènes aléatoires, ainsi qu’un cours de modélisation des événements rares, très utile en assurances.
Pouvez-vous nous parler d'une de vos recherches en particulier qui vous aurait marqué ?
La confidentialité différentielle (differential privacy) est une manière probabiliste de quantifier la perte de confidentialité lorsqu’on utilise un algorithme entraîné sur des données personnelles. Cette notion fait l’hypothèse que l’attaquant (la personne malveillante cherchant à inférer des informations sur vos données à partir de l’observation des paramètres d’un algorithme d’IA entraîné sur ces données) connaît déjà une grosse partie de vos données (la quasi totalité, en fait).
D’autres domaines de recherche comme la cryptographie s’intéressent aussi à la protection des données personnelles, mais sous un point de vue plus informatique que probabiliste. Or, dans ce domaine-là, on fait plutôt l’hypothèse d’un attaquant moins fort que dans le cas de la confidentialité différentielle, au sens où l’on suppose qu’il a accès à moins d’information. Dans un travail réalisé durant mon postdoctorat, j’ai étudié une nouvelle notion de confidentialité différentielle qui fait des hypothèses plus faibles sur l’attaquant, permettant ainsi de relier plus facilement différentes notions de confidentialité. J’ai été très marqué par le fait que certains domaines de recherche évoluent de manière assez disjointes, alors qu’ils se proposent de répondre peu ou prou au même problème. Cela est dû pour beaucoup à la difficulté de communiquer entre personnes de différentes communautés, chacune ayant ses propres formulations des choses, qui sont souvent difficiles à lire (et donc à traduire) dans le langage d’une autre discipline. J’y vois une nouvelle illustration de l’importance de la transmission, que nous évoquions dans la deuxième question.