Académique Documents
Professionnel Documents
Culture Documents
Comprendre et réaliser
Millot
les tests statistiques à l’aide de R
Manuel de biostatistique
Comprendre et réaliser
les tests statistiques à l’aide de R
à l’aide de R
test à partir de ses propres données. Il décrit 35 tests statis- Gaël MILLOT, Docteur en Génétique Humaine, Maître
tiques sous forme de fiches, dont 24 non paramétriques, de Conférence en Génétique et Biostatistique à l’Univer-
ce qui couvre la plupart des tests à une ou deux variables sité Pierre et Marie Curie (Paris VI), responsable du pôle
observées. Il traite de toutes les subtilités des tests, comme Statistique de la plateforme Hub-C3BI de l’Institut Pasteur.
les corrections de continuité, les corrections de Welch pour
le test t et l’anova, ou les corrections de p value lors des L’auteur reverse la moitié de ses droits d’auteur à différents
comparaisons multiples. Il propose un exemple d’application organismes de recherche sur les maladies génétiques.
ISBN : 978-2-8073-0291-4
9 782807 302914
Comprendre et réaliser
les tests statistiques à l’aide de R
Manuel de biostatistique
4e édition
Dépôt légal:
Bibliothèque nationale, Paris: janvier 2018
Bibliothèque royale de Belgique, Bruxelles : 2018/13647/002 ISBN 978-2-8073-0291-4
4ème édition
1.7.3. Exporter des données au format texte, csv, etc. ............................................................................... 79
1.7.4. Sauvegarder et réimporter des objets de données au format R ........................................................ 81
2.7. Les paramètres de statistique descriptive les plus employés .................................................................. 221
2.7.1. La moyenne et la médiane ............................................................................................................. 221
2.7.2. Les quantiles .................................................................................................................................. 223
2.7.3. La variance, l'écart type et le coefficient de variation .................................................................... 223
2.7.4. La covariance ................................................................................................................................. 224
2.7.5. Le coefficient de corrélation linéaire de Pearson ........................................................................... 227
4.6. Conclusion d'un test statistique et les deux risques d'erreurs associés .................................................. 321
4.6.1. Conclure, c'est deux vérités, deux décisions soit quatre probabilités ............................................. 321
4.6.2. L'hypothèse H0 et le risque D : définitions ..................................................................................... 323
4.6.3. La correction de la p value ou du seuil de rejet D .......................................................................... 325
4.6.3.1. Le problème soulevé ........................................................................................................ 325
4.6.3.2. La technique de Bonferroni ............................................................................................. 328
4.6.3.3. La technique séquentielle (Holm) .................................................................................... 329
4.6.3.4. La méthode de Benjamini & Hochberg (BH) .................................................................. 331
4.6.3.5. Quand appliquer la correction ? ....................................................................................... 332
4.6.3.6. Comment choisir la méthode de correction à appliquer ? ................................................ 335
4.6.4. L'hypothèse H1 et son influence sur le risque D ............................................................................. 335
4.6.4.1 Le problème de l'hypothèse H1 ......................................................................................... 335
4.6.4.2. Test bilatéral et unilatéral ................................................................................................ 336
4.6.4.3. Obtenir la p value en test bilatéral et unilatéral ............................................................... 339
4.6.4.4. Placer les seuils D de rejet en test bilatéral et unilatéral .................................................. 342
4.6.4.5. Comment choisir entre test bilatéral et unilatéral ?.......................................................... 347
4.6.5. Le risque E et la puissance 1-E du test ........................................................................................... 348
4.6.5.1. Retour sur les définitions du risque E et de la puissance 1-E ........................................... 349
4.6.5.2. Variations de E et 1-E suivant la distribution de probabilité de la VT sous H1................ 349
4.6.6. D et E en termes de faux positifs et faux négatifs .......................................................................... 355
4.6.7. Propriétés de la puissance 1-E........................................................................................................ 357
4.6.7.1 A lire avant de se lancer dans ce paragraphe .................................................................... 357
4.6.7.2. La puissance d'un test diminue quand décroît le Dseuil ..................................................... 357
4.6.7.3. La puissance d'un test croît quand augmente l'effectif n de l'échantillon ........................ 359
4.6.7.4. La puissance d'un test augmente avec l'écart entre les paramètres testés......................... 365
4.6.8. Le danger de considérer la p value comme un indicateur de forte ou faible significativité ........... 367
5.8. Comparaison d'une proportion observée à une proportion théorique .................................................. 491
5.8.1. Méthode ......................................................................................................................................... 491
5.8.2. Exemples avec R ............................................................................................................................ 494
5.10. Comparaison de deux proportions en séries appariées (test de Mac Nemar) ..................................... 514
5.10.1. Méthode ....................................................................................................................................... 514
5.10.2. Exemples avec R .......................................................................................................................... 519
5.15. Comparaison d'une médiane observée à une valeur théorique (test des signes de Wilcoxon) .......... 591
5.15.1. Méthode ....................................................................................................................................... 591
5.15.2. Exemples avec R .......................................................................................................................... 597
5.17. Comparaison de deux médianes observées en séries appariées (test des signes de Wilcoxon) .......... 623
5.17.1. Méthode ....................................................................................................................................... 623
5.17.2. Exemples avec R .......................................................................................................................... 632
5.26. Ajustement d'une distribution observée à une distribution théorique ................................................ 747
5.26.1. Introduction.................................................................................................................................. 747
5.26.2. Test de F2 de conformité .............................................................................................................. 748
5.26.2.1. Méthode ......................................................................................................................... 748
5.26.2.2. Exemple avec R ............................................................................................................. 751
5.26.3. Test de Kolmogorov-Smirnov ..................................................................................................... 756
5.26.3.1. Méthode ......................................................................................................................... 756
5.26.3.2. Exemple avec R ............................................................................................................. 762
5.26.4. Test de Shapiro-Wilk ................................................................................................................... 769
5.26.4.1. Méthode ......................................................................................................................... 769
5.26.4.2. Exemple avec R ............................................................................................................. 774
INDEX................................................................................................................................................................ 945
Seuls sont répertoriés ici les abréviations et symboles qui ne sont pas systématiquement
définis au-dessous des formules statistiques. Ils proviennent généralement du chapitre 4.
D risque de rejeter l'hypothèse H0 alors que H0 est vraie (risque de 1ère espèce)
Dseuil seuil de rejet de l'hypothèse H0
E risque de conserver l'hypothèse H0 alors que H0 est fausse (risque de 2ème espèce)
1-E puissance d'un test
J risque de 3ème espèce
'réel écart réel entre deux paramètres
'seuil limite de pertinence pour l'écart entre deux paramètres
P moyenne au niveau d'une population
Pf moyenne de la taille des femmes dans la population du Guateverde
Ph moyenne de la taille des hommes dans la population du Guateverde
V écart type au niveau d'une population
V2 variance au niveau d'une population
Vf écart type de la taille des femmes dans la population du Guateverde
Vh écart type de la taille des hommes dans la population du Guateverde
infini
§n·
Cnk combinaison d'ordre k des n éléments, s'écrit également ¨¨ ¸¸
©k ¹
k
¦ i 1
somme des i éléments, i prenant les valeurs 1, 2, ..., k
1.1. Introduction
R a été créé par deux membres du département de statistique de l'université d'Auckland : Ross
Ihaka et Robert Gentleman, également dénommés R & R (Ihaka and Gentleman, 1996). Il n'a
depuis cessé d'évoluer et aujourd'hui son développement est assuré par la fondation R (The R
Foundation) et par la contribution de personnes du monde entier (contributors).
R est un logiciel qui utilise son propre langage, dérivé du langage informatique S,
spécialement développé pour la statistique (Becker et al., 1988; Chambers and Hastie, 1992).
On parle donc de logiciel R, de langage R ou d'environnement R. Son succès provient du fait
que : (1) il est gratuit, (2) il est compatible avec les systèmes d'exploitation les plus utilisés
(Windows, macOS, Linux), (3) des documentations sont disponibles en ligne, (4) il est intégré
dans un nombre grandissant de logiciels ou d'environnements de programmation et (5) il est
très puissant. La plupart des fonctions statistiques de calcul et de graphique sont disponibles
dans la version de base. Si ce n'est pas le cas, vous pouvez trouver des fonctions
supplémentaires dans des packages élaborés par des statisticiens et disponibles sur le net. En
dernier recours, pour ceux qui exigent des fonctions particulièrement pointues, vous pouvez
modifier des programmes à partir des codes disponibles ou bien en écrire vous-même en
langage R afin de réaliser ce que vous souhaitez (voir le paragraphe 1.11 et Genolini, 2010).
Dans cet ouvrage, nous présenterons toutes les informations nécessaires à l'utilisation de R, au
travers de deux interfaces : la version classique de R et celle de RStudio. Le terme "interface
R classique" (et parfois plus simplement "interface R") sera employé lorsqu'il sera nécessaire
de distinguer l'interface classique de l'interface RStudio. Sinon, le simple terme "R" désignera
l'environnement R d'une manière générale, sans distinguer les deux interfaces.
Le logiciel R est téléchargeable sur le site http://www.r-project.org/. Il faut ensuite cliquer sur
Download, CRAN, CRAN signifiant Comprehensive R Archive Network (Réseau d'archives de
R globales). Choisissez un site miroir en France, les téléchargements seront probablement
plus rapides. Vous trouverez ensuite un encadrement légendé Download and install R.
Il est préférable, dans un premier temps, d'utiliser la version 3.3.3 de R, soit celle employée
dans cet ouvrage. Lorsque vous aurez pris l'habitude de R, vous pourrez vous reporter vers la
version la plus récente.
Pour Windows, cliquez sur Download R for Windows, ensuite sur base, puis sur
Previous releases, sur R 3.3.3 et enfin sur Download R 3.3.3 for Windows (71
megabytes, 32/64 bit). Le programme d'installation est alors téléchargé sur votre
ordinateur. Il suffit de cliquer dessus et de suivre les instructions. Un dossier portant le
nom de la version de R téléchargée est créé (R-3.3.3 dans notre cas). Il est situé, à partir
du disque dur C:, dans la série de dossiers suivante : Programmes / R (l'adresse de
localisation étant C:\Program Files\R). Dans ce dossier se trouve le dossier library qui
comprend les packages de base de R (nous y reviendrons dans le paragraphe 1.2.2). Un
autre élément utile doit être localisé : le fichier .Rdata. Celui-ci n'est pas apparent au
début. Il contiendra tous les objets que vous créerez et sauvegarderez dans R. Sur mon
ordinateur, il apparaîtra, à partir du disque dur C:, dans la série de dossiers suivante :
Utilisateurs / Gael / Mes documents (l'adresse de localisation étant
C:\Users\Gael\Documents). Un autre fichier peut apparaître au même endroit que le
fichier .RData, c'est le fichier .Rhistory. Il contient les dernières instructions exécutées
dans la console, mais il présente peu d'intérêt lorsqu'on se sert d'un éditeur de code (voir
le paragraphe 1.2.4).
Pour macOS, cliquez sur Dowload R for (Mac) OS X, puis sur old (en bas de page) et
enfin sur R-3.3.3.pkg. Le programme d'installation est alors téléchargé sur votre
ordinateur. Il suffit de cliquer dessus et de suivre les instructions pour que R soit
installé. Les deux éléments library et .Rdata décrits dans la version R de Windows sont
également installés dans la version R de macOS. Attention : .Rdata sera présent dans le
répertoire racine de l'utilisateur (l'icône "Maison" sur la gauche de la fenêtre
d'exploration, ou touches Shift + cmd + h) mais il sera caché. Il est alors plus simple
d'utiliser le terminal de macOS pour manipuler ce fichier. Quant au dossier library, il se
trouve en cliquant, à partir du disque dur, dans la série de dossiers suivante :
Bibliothèque / Frameworks / R.framework / Versions / 3.3 / Resources (l'adresse de
localisation étant /Library/Frameworks/R.framework/Versions/3.3/ Resources).
Un package est une compilation d'outils qui ne se trouve pas dans l'installation de base du
logiciel R. Pour en disposer, il faut le télécharger. Ceci peut s'effectuer soit
"automatiquement", c'est-à-dire directement depuis l'interface R, soit "manuellement", c'est-à-
dire depuis le site internet de R. Commençons par la première technique. Lorsque l'interface R
est démarrée, une barre de menus apparaît dans la partie supérieure de la fenêtre.
Pour Windows, cliquez sur le menu Packages puis sur Installer le(s) package(s) :
Dans la fenêtre ouverte, sélectionnez un site français. Dans la fenêtre suivante ouverte,
sélectionnez le ou les packages que vous souhaitez installer. Ceux-ci sont alors placés
dans le dossier library décrit dans le paragraphe 1.2.1 précédent.
Pour macOS, cliquez sur le menu Packages & Données puis sur Installateur de
Package :
Dans le haut de la fenêtre ouverte, sélectionnez CRAN (binaries) puis cliquez sur
Acquérir Liste. Sélectionnez un site français puis le ou les packages que vous souhaitez
installer, et cliquez sur Installer/Mettre à Jour. Ceux-ci sont alors placés dans le dossier
library décrit dans le paragraphe 1.2.1 précédent.
Si l'interface R présente des difficultés à reconnaître les paramètres proxy utilisés par votre
ordinateur pour accéder à internet, ou si vous n'êtes pas administrateur de l'ordinateur, il est
possible de récupérer "manuellement" des packages depuis le site internet de R.
Pour être activé, un package doit être chargé dans l'environnement de travail de R. Si le
package coin est dans le dossier library, écrire la commande suivante dans la console :
> library("coin")
Si le package est situé ailleurs dans l'ordinateur, employer plutôt la commande suivante :
> library(coin, lib.loc = "C:/Users/Gael/Desktop/") # la zone en grisé correspond
au chemin absolu du dossier coin. Cette notion de chemin, reliée à la position
du dossier coin dans l'ordinateur, sera abordée dans le paragraphe 1.6.1.2
Les packages dont vous aurez besoin dans ce livre sont : coin, dichromat, ellipse, gdata,
ggplot2, ggrepel, gplots, gtools, lubridate, MASS, pROC, RColorBrewer, scatterplot3d,
splines, survival, et tcltk. Commencez par vérifier s'ils sont présents dans votre dossier
library, et récupérez-les si besoin. Ces packages requièrent souvent d'autres packages, qui
sont automatiquement installés, sauf si l'installation est "manuelle", mais dans ce cas, R
précisera quels sont les packages manquants.
Dans la page d'accueil de R, au lieu de cliquer sur Download, CRAN, cliquez sur
Documentation Manuals, ce qui vous donne accès à la documentation officielle de R, ainsi
qu'au lien contributed documentation. Avec ce lien, vous trouverez la documentation de
collaborateurs, dont certaines en français.
1.2.4. Découverte
Lorsque R est démarré, une fenêtre appelée console apparaît. Exemple pour Windows :
Et pour macOS :
C'est dans cette fenêtre que nous lançons des instructions : création ou modification de
données, exécution de fonctions, tests statistiques sur nos données, etc. En bas se trouve le
symbole ">", appelé le prompt. A sa droite se trouve le curseur. Au-dessus de la fenêtre se
trouve une série d'icônes et encore au-dessus le menu.
Pour Windows, cliquez sur le menu Aide puis Console. Une fenêtre apparaît donnant les
raccourcis clavier pratiques. Notez que des raccourcis classiques (Ctrl+c, Ctrl+v, etc.)
sont compatibles dans R. Cliquez sur le menu Fichier et Sauver l'environnement de
travail pour sauvegarder les objets, que vous venez de créer, dans un fichier .Rdata
(voir le paragraphe 1.7.4). Vous pouvez arrêter un calcul qui dure trop longtemps avec
l'icône "STOP" ou appuyer sur la touche "Echappe" du clavier.
Pour macOS, notez que la plupart des raccourcis classiques (cmd+c, cmd+v, etc.) sont
compatibles dans R. Cliquez sur le menu Espace de Travail et Enregistrer l'Espace de
Travail pour sauvegarder les objets, que vous venez de créer, dans un fichier .Rdata
(voir le paragraphe 1.7.4). Vous pouvez arrêter un calcul qui dure trop longtemps avec
l'icône "STOP" ou appuyer sur la touche "Echappe" du clavier.
Conseil important aux débutants : écrivez votre code dans un éditeur de code, plutôt que
directement dans la console, puis exécutez le code à l'aide des commandes dédiées (voir le
paragraphe 1.3 concernant l'éditeur de RStudio) ou bien copiez-collez vos lignes de code dans
la console pour l'exécution. Et s'il y a des erreurs, corrigez-les dans l'éditeur puis
recommencez la procédure d'exécution. Trois avantages à cela : (1) un gain de temps
important car vous évitez de ressaisir des lignes qui ont déjà été notées, (2) si vous avez
beaucoup d'instructions, elles seront plus facile à lire, à manipuler et à modifier dans un
éditeur (par exemple, vous pouvez facilement rechercher une ligne de commande avec un mot
clé) et (3) Il n'existe pas d'alerte dans R sauf lorsqu'on quitte le logiciel. Ce dernier point est
important à savoir. Vous pouvez modifier ou perdre des données sans vous en rendre compte.
Ainsi, si vous n'avez pas sauvegardé votre code (procédure expliquée dans le paragraphe
1.7.1), le seul moyen de récupérer l'erreur est de recommencer l'écriture du code.
L'interface R propose un éditeur, très rudimentaire sous Windows (menu Fichier et Nouveau
script), et plutôt bien fait sous macOS (menu Fichier et Nouveau Document). Il existe
également des logiciels qui sont des éditeurs de code spécifiquement développés pour le
langage R, avec de nombreuses fonctionnalités facilitant l'écriture, la correction et la
visualisation post-exécution du code (voir la liste complète sur la page R anglaise de
Wikipédia). L'un d'eux, RStudio, a rapidement acquis une place de choix parmi les utilisateurs
du langage R et, à ce titre, il sera introduit dans le paragraphe 1.3 suivant.
Dans des cas très particuliers (par exemple la présentation d'un code et de ses résultats), vous
pouvez vous servir de logiciel de traitements de texte pour écrire votre code. Microsoft Word
peut éventuellement convenir puisque la plupart des mises en forme du texte n'affecte pas
l'exécution du code lors du copier-coller. Attention néanmoins avec les traitements de texte :
il est indispensable de désactiver toutes les mises en forme automatique du texte (pas de
changement des guillemets anglophones "" en guillemets français «» par exemple). Pour les
utilisateurs avancés, il est préférable d'employer R Markdown, en installant le package
rmarkdown sous RStudio (voir le site http://rmarkdown.rstudio.com/lesson-1.html).
Pour finir sur l'écriture du code, nous verrons dans le paragraphe 1.7.1 comment sauvegarder
des lignes de code, et comment réimporter ces lignes dans R.
RStudio est un environnement, dit de développement intégré (IDE en anglais pour integrated
development environment). Il a été développé par Joseph J. Allaire, qui dirige la compagnie
RStudio inc (voir le site http://rstudio.com). En plus de la console classique de R, cet
environnement présente plusieurs panneaux, formant une interface conviviale qui facilite
grandement les manipulations dans R. On le rappelle, le terme "interface R classique" sera
employé lorsqu'il sera nécessaire de distinguer l'interface R classique de l'interface RStudio.
Le simple terme "R" désignera l'environnement R d'une manière générale, sans distinguer les
deux interfaces. Il s'adressera donc aussi bien à l'interface R classique qu'à RStudio.
1.3.1. Installation
Le logiciel R doit être installé en priorité (voir le paragraphe 1.2). La dernière version de
RStudio est disponible à cette adresse : https://www.rstudio.com/products/rstudio/download/.
Si besoin, certaines versions antérieures de RStudio sont également mises à disposition (tester
l'adresse : https://support.rstudio.com/hc/en-us/articles/206569407-Older-Versions-of-
RStudio ou l'adresse https://support.rstudio.com/hc/en-us/articles/200716783-RStudio-
Release-History pour comparer les versions). Il suffit ensuite de suivre les instructions
d'installation affichées par votre ordinateur. Attention : la version de RStudio décrite dans cet
ouvrage est la version 1.0.136.
La fenêtre de RStudio est plus elaborée que celle de l'interface R classique. Elle présente un
menu et une barre d'icônes, dans la partie supérieure de la fenêtre, ainsi que quatre panneaux,
dont trois composés d'onglets :
Le panneau principal de RStudio est la console, située par défaut dans le coin inférieur gauche
de la fenêtre. Souvent, la console occupe toute la partie gauche. Cliquez dans ce cas sur
l'icône "Dossier" en haut à droite de la console :
Session / Set Working Directory / Choose Directory (voir également les fonctions getwd() et
setwd() dans l'annexe 26). Enfin, une icône "STOP" apparaît, en haut à droite du panneau,
quand du code est exécuté. Cliquez dessus si besoin pour arrêter une exécution trop longue.
Le panneau supérieur gauche est le panneau d'édition. Voir le paragraphe 1.3.2 si ce panneau
n'est pas apparent. Comme expliqué dans le paragraphe 1.2.4, il est important d'écrire et de
corriger son code dans cet éditeur, plutôt que dans la console, puis d'exécuter le code depuis
cet éditeur. Noter que les raccourcis classiques de Windows (Ctrl+c, Ctrl+v, Ctrl+z, Ctrl+a,
Ctrl+f, etc.) ou de macOS (cmd+c, cmd+v, cmd+z, cmd+a, cmd+f, etc.) sont compatibles
dans le panneau, ce qui signifie que le code de cet ouvrage, disponible sur le site
https://c3bi.pasteur.fr/gael-millot-livres/, peut être copié-collé dans l'éditeur de RStudio. Le
menu File / New File / R Script ouvre un nouvel onglet d'édition :
Exécute la
Rechercher / Réexécute la
ligne sur le
remplacer précédente
curseur ou le
Change exécution
Enregistre code
d'onglet le code Outils sélectionné
Sauve le
Sort l'onglet du Exécute le code dans le
panneau et code quand fichier caché
l'affiche en il est Compilation .active-
nouvelle enregistré R Markdown rstudio-
fenêtre document
temporaire et
Nombre total de Fonctions créées exécute le
lignes de code et dans le code code
position du
curseur Format du code
écrit
Cliquer sur le coin inferieur droit du panneau ouvre un menu. La sélection d'un thème ("R
Script" sur l'exemple ci-dessus) ne modifie pas le code mais simplement le système de
visualisation en couleur, la mise en forme et l'aide à l'écriture de ce code.
Pour exécuter un code écrit dans le panneau d'édition, sélectionnez le code et cliquez sur
l'icône "Run". Le code est alors exécuté dans la console.
L'onglet Environment permet de gérer les objets inclus dans les différents environnements de
R. La notion d'environnement est développée dans le paragraphe 1.11, et la gestion des objets
(import et export) dans le paragraphe 1.7.4. L'icône "Import Dataset" facilite l'import de
fichiers de données dans RStudio (voir le paragraphe 1.6.1.2).
L'onglet History gère l'historique des commandes exécutées dans la console, ce qui présente
peu d'intérêt si le code est systématiquement écrit et géré dans le panneau d'édition.
Colle les
lignes
Enregistre sélectionnées
l'historique de l'historique
dans un dans le Efface
fichier panneau l'historique
.Rhistory d'édition
Le panneau inférieur droit présente 5 onglets : Files, Plots, Packages, Help et Viewer.
Cet onglet permet de naviguer dans les répertoires de l'ordinateur. Les icônes situées dans la
partie supérieure de l'onglet regroupent les fonctions classiques de gestion des fichiers et
dossiers. Noter qu'en cliquant sur l'icône "More", il est possible de gérer le répertoire de
travail (voir le paragraphe 1.3.2) :
Cet onglet affiche les résultats graphiques de R. Ce n'est pas tout à fait l'équivalent de la
fenêtre graphique de l'interface classique de R. C'est une version plus élaborée au sens où
l'onglet Plots propose un historique des graphiques affichés. Nous y reviendrons dans le
paragraphe 1.10.1.
Historique Efface le
des graphique
graphiques affiché
Affichage
dans une Supprime
Exporte le
nouvelle l'historique
graphique
fenêtre des
graphiques
Cet onglet affiche et gère l'ensemble des packages disponibles sur l'ordinateur.
Rechercher Rafraichit
Recherche la liste des
des mises packages
à jour des
packages
Installe installés Supprime le
des
package de
packages
l'ordinateur
Active le
package dans
l'environnement
de travail
Un package est une compilation d'outils qui ne se trouve pas dans l'installation de base du
logiciel R. Pour obtenir un package depuis internet, cliquez sur l'icône "Install" et spécifiez le
nom du package que vous souhaitez dans la nouvelle fenêtre :
Le package est installé par défaut dans le dossier library du logiciel R (voir le paragraphe
1.2.1) et il apparaît dans la liste de l'onglet Packages de RStudio.Un package a parfois besoin
d'outils se trouvant dans d'autres packages. Cliquer sur Install dependencies pour télécharger
ces packages additionnels. Si cette méthode ne fonctionne pas (en particulier si vous n'êtes
pas administrateur de l'ordinateur), une alternative est de récupérer "manuellement" les
packages, comme expliqué dans le paragraphe 1.2.2.
Pour être activé, un package doit être chargé dans l'environnement de travail de RStudio. Par
exemple, si le package coin est dans le dossier library, écrire la commande suivante dans la
console :
> library("coin")
Si le package est situé ailleurs dans l'ordinateur, employer plutôt la commande suivante :
> library(coin, lib.loc = "C:/Users/Gael/Desktop/") # la zone en grisé correspond
au chemin absolu du dossier coin. Cette notion de chemin, reliée à la position
du dossier coin dans l'ordinateur, sera abordée dans le paragraphe 1.6.1.2
Les packages dont vous aurez besoin dans ce livre sont indiqués dans le paragraphe 1.2.2.
Millot
les tests statistiques à l’aide de R
Manuel de biostatistique
Comprendre et réaliser
les tests statistiques à l’aide de R
à l’aide de R
test à partir de ses propres données. Il décrit 35 tests statis- Gaël MILLOT, Docteur en Génétique Humaine, Maître
tiques sous forme de fiches, dont 24 non paramétriques, de Conférence en Génétique et Biostatistique à l’Univer-
ce qui couvre la plupart des tests à une ou deux variables sité Pierre et Marie Curie (Paris VI), responsable du pôle
observées. Il traite de toutes les subtilités des tests, comme Statistique de la plateforme Hub-C3BI de l’Institut Pasteur.
les corrections de continuité, les corrections de Welch pour
le test t et l’anova, ou les corrections de p value lors des L’auteur reverse la moitié de ses droits d’auteur à différents
comparaisons multiples. Il propose un exemple d’application organismes de recherche sur les maladies génétiques.
ISBN : 978-2-8073-0291-4
9 782807 302914