DAVWA BLOG

Par Allan Jerolon


Bienvenue sur DAVWA BLOG : Causalité, Marketing Mix modeling, Machine Learning sont les principaux thèmes qui y sont abordés. Vous y trouverez, en autres, des articles théoriques, de vulgarisation et des tutoriels pratiques avec les langages R et Python.

En plus des articles de DAVWA Blog vous retrouverez mes publications scientifiques dans la section Articles Publiés.

Articles


MMM avec Robyn (R)

Publié par Allan Jerolon le 29 novembre 2023

Dans cet article je présente le package R Robyn développé par Facebook (Meta Marketing Science) au travers d'une application web shiny que j'ai développé. Robyn permet de réaliser une analyse de Marketing Mix Modeling.

Marketing Mix Modeling

Publié par Allan Jerolon le 20 avril 2023

Je m'intéresse depuis peu au domaine du Marketing Mix Modeling mais mon expérience dans l’enseignement m’a montré qu’on comprend bien mieux un sujet quand on est capable d’en faire une synthèse et d’en expliquer les subtilités. Cet article réunit les connaissances et les explications que j'aurai aimé trouver en m'intéressant à ce sujet et cela en français. Il s'adresse à tout le monde mais certains aspects mathématiques théoriques retiendront surtout l'attention des data scientists et data analysts. Chers lecteurs novices ou confirmés en Marketing Mix Modeling, je vous souhaite une bonne lecture.

Marketing Mix Modeling: Étude de cas avec LightweightMMM (Python)

Par Allan Jerolon

Deuxième article de la série sur une étude de cas de Marketing Mix Modeling. Dans cet article j'utilise le package Python Lightweight (Bayesian) Marketing Mix Modeling développé par Google (de façon non officielle).

Articles Publiés


Causal mediation for uncausally related mediators in the context of survival analysis

Par A Domingo-Relloso, A. Jerolon, M. Tellez-Plaza,Jose D Bermudez
Publié dans medRxiv [Pre-print] en Février 2024 .

The study of the potential intermediate effect of several variables on the association between an exposure and a time-to-event outcome is a question of interest in epidemiologic research. However, to our knowledge, no tools have been developed for the evaluation of multiple correlated mediators in a survival setting. In this work, we extended the multimediate algorithm, which conducts mediation analysis in the context of multiple uncausally correlated mediators, to a time-to-event setting using the semiparametric additive hazards model. We theoretically demonstrated that, under certain assumptions, indirect, direct and total effects can be calculated using the counterfactual framework with collapsible survival models. We also adapted the algorithm to accommodate exposure-mediator interactions. Using simulations, we demonstrated that our algorithm performs better than the product of coefficients method, even for uncorrelated mediators. The additive hazards model quantifies the effects as rate differences, which constitute a measure of impact, with applications that can be highly informative for public health. Our algorithm can be found in the R package multimediate, which is available in Github.

Smoking, blood DNA methylation sites and lung cancer risk

Par A. Domingo-Relloso, R. Joehanes, Z. Rodriguez-Hernandez, L. Lahousse, K. Haack, M. Daniele Fallin, M. Herreros-Martinez,J. G. Umans, L. Best, T. Huan, C. Liu, J. Ma, C. Yao, A. Jerolon, S. A. Cole, D. Rhoades, D. Levy, A. Navas-Acien and M. Tellez-Plaza,
Publié dans Environmental Pollution en Juillet 2023 .

Altered DNA methylation (DNAm) might be a biological intermediary in the pathway from smoking to lung cancer. In this study, we investigated the contribution of differential blood DNAm to explain the association between smoking and lung cancer incidence. Blood DNAm was measured in 2321 Strong Heart Study (SHS) participants. Incident lung cancer was assessed as time to event diagnoses. We conducted mediation analysis, including validation with DNAm and paired gene expression data from the Framingham Heart Study (FHS). In the SHS, current versus never smoking and pack-years single-mediator models showed, respectively, 29 and 21 differentially methylated positions (DMPs) for lung cancer with statistically significant mediated effects (14 of 20 available, and five of 14 available, positions, replicated, respectively, in FHS). In FHS, replicated DMPs showed gene expression downregulation largely in trans, and were related to biological pathways in cancer. The multimediator model identified that DMPs annotated to the genes AHRR and IER3 jointly explained a substantial proportion of lung cancer. Thus, the association of smoking with lung cancer was partly explained by differences in baseline blood DNAm at few relevant sites. Experimental studies are needed to confirm the biological role of identified eQTMs and to evaluate potential implications for early detection and control of lung cancer.

Mediation models of anxiety and depression between temperament and drive for thinness and body dissatisfaction in anorexia nervosa.

Par A. Jerolon, V. Perduca, N. Delsedimeb, G. Abbate-Dagab, E. Marzola
Publié dans Eating and Weight Disorders - Studies on Anorexia, Bulimia and Obesity en Avril 2022 .

Anorexia nervosa (AN) is a life-threatening condition in which temperament, anxiety, depression, and core AN body-related psychopathology (drive for thinness, DT, and body dissatisfaction, BD) are intertwined. This relationship has not been to date disentangled; therefore, we performed a multiple mediation analysis aiming to quantify the effect of each component. An innovative multiple mediation statistical method has been applied to data from 184 inpatients with AN completing: Temperament Evaluation of Memphis, Pisa, Paris, and San Diego Autoquestionnaire, Eating Disorders Inventory-2, State-Trait Anxiety Inventory, and Beck Depression Inventory.

Le rôle médiateur du stress et de la fatigue, et le turnover à l'hôpital.

Par Oumou Salama DAOUDA, Allan JEROLON, Vittorio PERDUCA, Mounia N.HOCINE
Publié dans Manuscrit de thèse de Oumou Salama DAOUDA (CNAM) en Février 2022 .

Nous avons utilisé la méthode d'analyse causale multiple de [Jerolon et al, 2020] pour comprendre l'effet médiateur du stress et de la fatigue dans la relation entre les facteurs organisationnels (soutien de la hiérarchie et des collègues, et surinvestissement au travail) et l'intention de turnover des agents de santé. En effet, plusieurs études dans la littérature ont montré l’impact négatif du manque de soutien social des collègues et de la hiérarchie sur le turnover des personnels soignants. Le surinvestissement au travail quant à lui, augmente le risque d’intention de turnover du personnel. Cependant, le rôle indirect du stress et de la fatigue sur la relation entre ces facteurs et l’intention de turnover chez les personnels de santé n’a pas encore été abordé dans littérature. Une meilleure compréhension des différents chemins causaux entre les facteurs organisationnels et l’intention de rotation pourrait aider à concevoir des programmes efficaces pour réduire ce phénomène. Nous avons analysé les données d'une enquête menée dans quatre hôpitaux de la région parisienne en 2018, auprès de 729 professionnels de santé. Selon chaque exposition, trois modèles de médiation multiples ont été considérés, avec le stress et la fatigue comme médiateurs potentiels. Trois variables de confusion ont été prises en compte au niveau individuel (sexe, âge, nombre d'enfants) et deux au niveau du service (nombre de lits et horaires du service). En considérant le surinvestissement au travail ou le soutien de la hiérarchie comme exposition, nous avons constaté des effets indirects significatifs à travers le stress et la fatigue avec des proportions médiatisées élevées (jusqu'à 100 % pour le surinvestissement au travail). En conclusion, pour maximiser la prévention du turnover parmi les travailleurs de la santé, les interventions pourraient cibler le surinvestissement au travail et le soutien hiérarchique pour réduire directement le stress et la fatigue.

Association between menopausal hormone therapy, mammographic density and breast cancer risk: results from the E3N cohort study.

Par M. Fornili, V. Perduca, A. Fournier, A. Jerolon, M.C. Boutron-Ruault, G. Maskarinec, G. Severi, L. Baglietto
Publié dans Breast Cancer Research en Avril 2021 .

Menopausal hormone therapy (MHT) is a risk factor for breast cancer (BC). Evidence suggests that its effect on BC risk could be partly mediated by mammographic density. The aim of this study was to investigate the relationship between MHT, mammographic density and BC risk using data from a prospective study. We used data from a case-control study nested within the French cohort E3N including 453 cases and 453 matched controls. Measures of mammographic density, history of MHT use during follow-up and information on potential confounders were available for all women. The association between MHT and mammographic density was evaluated by linear regression models. We applied mediation modelling techniques to estimate, under the hypothesis of a causal model, the proportion of the effect of MHT on BC risk mediated by percent mammographic density (PMD) for BC overall and by hormone receptor status.

Analyse causale multiple de médiation et applications.

Par Allan Jerolon
Publié dans HAL theses en Décembre 2020 .

Est contrefactuel ce qui aurait pu être si . . . , mais qui n’est pas. La notion de contrefactuel est lié à la notion de cause à effet. Une variable contrefactuelle est "l’état" dans lequel serait une variable si sa cause était dans un "état" différent. On peut aussi utiliser les termes "variables potentielles" pour parler de "variables contrefactuelles". Pour illustrer ces propos, considérons un traitement binaire T et une variable de réponse binaire Y , comme c’est souvent le cas en épidémiologie :

Causal mediation analysis in presence of multiple mediators uncausally related.

Par A. Jerolon, L. Baglietto, E. Birmelé, V. Perduca and F. Alarcon
Publié dans The International Journal of Biostatistics en Septembre 2020 .

Mediation analysis aims at disentangling the effects of a treatment on an outcome through alternative causal mechanisms and has become a popular practice in biomedical and social science applications. The causal framework based on counterfactuals is currently the standard approach to mediation, with important methodological advances introduced in the literature in the last decade, especially for simple mediation, that is with one mediator at the time. Among a variety of alternative approaches, Imai et al. showed theoretical results and developed an R package to deal with simple mediation as well as with multiple mediation involving multiple mediators conditionally independent given the treatment and baseline covariates. This approach does not allow to consider the often encountered situation in which an unobserved common cause induces a spurious correlation between the mediators. In this context, which we refer to as mediation with uncausally related mediators, we show that, under appropriate hypothesis, the natural direct and joint indirect effects are non-parametrically identifiable.

Selection of mediators with high dimentional data.

Par A. Jerolon, E. Birmelé, V. Perduca and F. Alarcon,

À propos


Diplômé d'un doctorat en Mathématiques Appliquées de l’Université Paris Cité, je m’intéresse, entre autres, à la causalité, au machine learning et à la programmation R et Python. J’ai réalisé des applications dans le domaine de la santé lors de ma thèse et je continue d’affuter mes compétences (tout domaine d’application confondu). Actuellement jeune docteur, j’ai créé l’auto-entreprise DAVWA JEROLON EI pour travailler en tant que data scientist freelance et utiliser mes compétences d’analyse de données, de visualisation de données et d’intelligence artificiel.

Que siginifie "DAVWA" ?


logo DAVWA

      

Je pourrais dire que DAVWA est l'acronyme de Data Analysis, Visualisation and Wise Advice mais en fait il signifie "PARCE QUE" en créole. En effet l'un des objectifs des statistiques et en particulier de la causalité est d'expliquer le pourquoi des choses ( The Book of Why par Judea Pearl). C'est ce que je tiens à faire à l'aide de mes compétences.

Contact:

Revenir en haut de la page