Académique Documents
Professionnel Documents
Culture Documents
Exercise 2
Introduction :
La maladie cardiovasculaire est une des principales causes de mortalité à l'échelle
mondiale, entraînant environ 18 millions de décès chaque année. Elle regroupe
diverses maladies affectant le cœur et les vaisseaux sanguins, telles que l'insuffisance
cardiaque, les maladies coronariennes, l'angine de poitrine, l'hypertension artérielle,
les accidents vasculaires cérébraux, entre autres. Bien que cette maladie puisse
toucher des personnes de tout âge, elle est plus fréquente chez les personnes âgées
et chez celles ayant des antécédents familiaux de la maladie. Les facteurs de risque
incluent l'hypertension artérielle, le tabagisme, l'obésité, la sédentarité, le diabète,
l'hypercholestérolémie, la consommation excessive d'alcool et le stress.
L'identification précoce des personnes à risque est essentielle pour prévenir et traiter
la maladie cardiovasculaire. Les bases de données de santé sont donc une source
précieuse d'informations pour la recherche en santé publique, notamment pour la
prévention et la prédiction de la maladie. Ces bases de données recueillent des
informations sur les antécédents médicaux, les habitudes de vie et les facteurs de
risque des patients atteints de la maladie cardiovasculaire.
Dans cette étude, nous avons utilisé une base de données contenant des
informations sur la maladie cardiovasculaire pour développer un modèle de
prédiction basé sur une régression logistique. Ce modèle permettra d'identifier les
facteurs de risque les plus importants pour la maladie cardiovasculaire, ce qui aidera
les professionnels de la santé à identifier les personnes à risque et à mettre en place
des stratégies de prévention adéquates.
Nous décrirons dans la suite de ce rapport les méthodes utilisées pour la collecte des
données, le développement du modèle de régression logistique et l'évaluation de ses
performances. Nous présenterons ensuite les résultats obtenus et discuterons de
leurs implications pour la prédiction et la prévention de la maladie cardiovasculaire.
Procédure :
Dans le cadre de cette étude, nous avons travaillé avec une base de données
contenant des informations sur 609 patients, y compris leur âge, leur niveau de
catécholamine, leur taux de cholestérol et leur statut tabagique. Pour évaluer la
performance du modèle, nous avons divisé cette base de données en deux ensembles
: un ensemble d'apprentissage et un ensemble de test. En utilisant une approche de
régression logistique, nous avons créé un modèle qui prédit si un individu est atteint
de maladie cardiovasculaire ou non, en fonction des variables de la base de données.
Pour identifier les variables les plus importantes pour le modèle, nous avons utilisé
une approche descendante stepwise.
Code :
1- Importation :
Pour commencer une analyse de données avec le langage R, il est essentiel
d'importer les librairies nécessaires pour effectuer les différentes analyses. Pour cela,
la fonction library() est utilisée pour charger les packages dans R. Voici une liste des
librairies utilisées pour l'analyse de données en R :
library(readr)
library(MASS)
library(questionr)
library(broom)
library(tidyverse)
library(effects)
library(margins)
4-Conclusion :