Académique Documents
Professionnel Documents
Culture Documents
Consignes :
L’étudiant fournira son projet sous format zip contenant :
1. Un rapport en pdf ou html issu de R markdown
2. Le code R et la base des données permettant la reproduction des résultats
contenus dans le rapport R
La date limite du dépôt est fixée le 03 mars 2024 à 23h59
Objectif :
On souhaite expliquer la nocivité des cigarettes CO à partir de ses caractéristiques (TAR,
NICOTINE et WEIGHT).
8. Affichez le champ de l’objet. Quel est le type de cet objet ? Quelles sont ses dimensions ?
9. Affichez les écarts-type des coefficients estimés.
12. Réalisez la droite de Henry pour vérifier la compatibilité des résidus avec l’hypothèse de
normalité. Que constatez-vous ?
13. Calculer le coefficient d’asymétrie g1, puis le coefficient d’aplatissement g2. Calculez alors
la statistique de Jarque-Bera. Est-ce que les résidus sont compatibles avec l’hypothèse de
normalité ?
4. Sélection de variables
14. Testez la significativité simultanée des coefficients de NICOTINE et WEIGHT en opposant
les R² des régressions CO = f(TAR, NICOTINE, WEIGHT) et CO = f(TAR)
15. Réalisez une sélection de variables « backward » optimisant le critère AIC (stepAIC).
Quelles sont les variables finalement pertinentes pour l’explication du taux de CO des cigarettes
? Est-ce que ce résultat confirme la réponse obtenue dans la question précédente ?
Cette base de données permet d'analyser les caractéristiques des cigarettes en fonction de leur
composition et de leur impact potentiel sur la santé. Les colonnes TAR, NICOTINE,
WEIGHT, et CO offrent des mesures quantitatives.