Development and validation of risk scores in vascular diseases - Cohorte prospective des patients hospitalisés pour un événement thromboembolique (étude internationale multicentrique) Accéder directement au contenu
Thèse Année : 2021

Development and validation of risk scores in vascular diseases

Développement et validation de scores de risque dans les maladies vasculaires

Résumé

Multivariate statistical models are widely used in medicine. Descriptive models capture the association between dependent and independent variables, explanatory models test a causal hypothesis between an exposition and an outcome, and predictive models predict a diagnosis or an outcome for a given patient. Multivariate statistical models are mainly derived from cohort studies. For their development, the choice of the type of model, variable selection for the final model, and the evaluation of its performance (internal and external validation) are of particular importance. Missing data can lead to biased estimates of parameters and incorrect significance tests, and limit the multivariate analysis to the complete cases; multiple imputation is a technique for handling missing data. In this work, these different steps were applied to two cohorts of vascular diseases. Survival analyses were used: Cox regression model, and Fine and Gray model, which handles competitive risks. The COPART (cohorte de patients artériopathes) cohort is an ongoing French, multicenter, observational, cohort study, prospectively collecting data on patients hospitalized for symptomatic lower extremity artery disease. Two explanatory models were derived: one to evaluate the relationship between diabetes and major adverse cardiovascular events, and one to assess the relationship between angiotensin-receptor blockers and mortality. A descriptive model was also derived to identify factors associated with lower limb major amputation. Background knowledge and a directed acyclic graph were used for the variable selection for explanatory models, instead of data-driven methods. Backward elimination variable selection algorithm starting was used for the descriptive model. Finally, external validity, especially transportability, of two randomized controlled trials was studied in COPART. The RIETE cohort (Registro Informatizado de la Enfermedad ThromboEmbolica venosa) is an ongoing, international, multicenter, prospective cohort study of patients diagnosed with symptomatic acute deep vein thrombosis or pulmonary embolism. Patients with cancer-associated thrombosis were studied. A multiple imputation by chained equations was performed on missing values. The factors associated with recurrence after a time-limited anticoagulant therapy of at least 3 months were identified with a two-tier predictor selection process: the first tier included variables chosen based on knowledge regarding their relationship with recurrence regardless the unadjusted analyses, and the variables of the second tiers were identified by multivariate Cox model with backward stepwise elimination. With these results, a multivariable prognostic model for the risk of recurrence after anticoagulant discontinuation was developed. The model performance was estimated directly from the data set with multiple imputation of missing data, also used to develop the prediction model. Then, a bootstrap internal validation approach was performed, with the computation of the optimism for the performance measures (slope of the calibration plot, Royston and Sauerbrei's D statistic for discrimination, and Royston and Sauerbrei's R_D^2 for explained variation). These optimisms were subtracted from the apparent performance measures obtained from the original data set, taking into account the multiple imputation of missing data.
Les modèles statistiques multivariés ont des applications variées en médecine. Ils peuvent être descriptifs, capturant l'association entre une variable dépendante et des variables indépendantes, explicatifs, testant une hypothèse causale entre une exposition et un évènement d'intérêt, ou prédictifs, calculant pour un individu la probabilité d'un diagnostic ou de la survenue d'un évènement. Ces modèles sont majoritairement dérivés d'études de cohortes. Pour leur développement, le choix du type de modèle, la sélection des variables pour le modèle final et l'évaluation de sa performance (validation interne et externe) ont une importance particulière. Les données manquantes causent un biais dans l'estimation des paramètres et les tests de significativité, et limitent le nombre de patients pour l'analyse multivariée ; des méthodes d'imputation existent. Dans ce travail, ces différentes étapes ont été appliquées à deux cohortes de maladies vasculaires. Des modèles de survie ont été utilisés : le modèle de Cox, et le modèle de Fine et Gray, qui prend en compte les risques compétitifs. La cohorte COPART (cohorte de patients artériopathes) est une cohorte nationale multicentrique prospective s'intéressant aux patients hospitalisés pour la prise en charge d'une artériopathie athéromateuse des membres inférieurs symptomatique. Deux modèles explicatifs ont été dérivés : un premier évaluant l'impact du diabète sur le risque de décès de cause cardiovasculaire, d'infarctus du myocarde et d'accident vasculaire cérébral ischémique, et un second évaluant l'impact des antagonistes des récepteurs de l'angiotensine de type 2 sur le risque de décès. Un troisième modèle, descriptif, a été constitué, pour identifier les facteurs associés au risque d'amputation majeure du membre inférieur. La sélection des variables pour les modèles explicatifs a été réalisée sur les données de la littérature, indépendamment des données de la cohorte, avec une représentation des liens de causalité entre variables par un graphe acyclique dirigé, guidant ensuite la sélection. Les variables du modèle descriptif ont été sélectionnées sur les données de la cohorte, à l'aide d'un algorithme de sélection descendante. Enfin, la validité externe, notamment la transposabilité, de deux études contrôlées randomisées a été évaluée dans COPART. La cohorte RIETE (registro informatizado de la enfermedad thromboembolica venosa) est une cohorte internationale multicentrique prospective incluant les patients présentant une embolie pulmonaire ou une thrombose veineuse profonde. Le sous-groupe des patients présentant un évènement thromboembolique veineux associé à un cancer a fait l'objet de ce travail. Une imputation multiple des données manquantes par équations chaînées a été réalisée. Les facteurs associés à la récidive à l'arrêt d'un traitement anticoagulant d'une durée d'au moins 3 mois ont ensuite été identifiés, à l'aide d'une méthode mixte : dans la 1ère étape, les variables connues dans la littérature pour leur association au risque de récidive ont été sélectionnées indépendamment des résultats dans la cohorte, puis dans la 2ème étape, une sélection descendante a été appliquée à partir du modèle plein, en forçant dans le modèle descriptif final les variables sélectionnées dans la 1ère étape.[...]
Fichier principal
Vignette du fichier
2021TOU30200a.pdf (3.43 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03663091 , version 1 (09-05-2022)

Identifiants

  • HAL Id : tel-03663091 , version 1

Citer

François-Xavier Lapebie. Development and validation of risk scores in vascular diseases. Human health and pathology. Université Paul Sabatier - Toulouse III, 2021. English. ⟨NNT : 2021TOU30200⟩. ⟨tel-03663091⟩
91 Consultations
131 Téléchargements

Partager

Gmail Facebook X LinkedIn More