Vous êtes sur la page 1sur 6

Atelier Recap

Les objectifs métier :


● Améliorer la prévention des maladies afin de réduire le
taux de réadmission
● Améliorer la fidélisation des patients

Des objectifs en matière d'analyse de données


médicales :
● Segmentation des patients selon le risque d’avoir une
hypoglycémie.
● Extraire des connaissances sur les patients et leurs
maladies.

Data understanding :
importation des données :
donnees <-
read_csv(“C:/Users/marie/OneDrive/Bureau/framingham.csv”)
● nombre de lignes : nrow (donnees) : 4240
● nombre de colonnes : ncol(donnees): 16
Data preparation:
Nettoyage des données :
na.omit(donnees)
Statistiques descriptives :
summary(donnees)
Visualisation des données:
Relation entre l'âge et le diabète:
library(ggplot2)

ggplot(patient_data, aes(x = age, y = diabetes)) +


geom_point() +
labs(title = "Relation entre l'âge et le diabète",
x = "Âge",
y = "Diabète")
Analyse en Composantes Principales (ACP):
library(FactoMineR)
acp <- PCA(donnees[, c("age", "totChol", "sysBP", "diaBP", "BMI",
"glucose")], graph = TRUE)
K-MEANS:
Segmentation des patients selon le risque d’avoir une
hypoglycémie:
set.seed(123)
subset_data <- donnees[donnees$diabete == 1, ]
donnees_clean <- na.omit(donnees[, c("glucose", "age")])
kmeans_clusters <- kmeans(donnees_clean, centers = 3)
print(kmeans_clusters)

Vous aimerez peut-être aussi