Vous êtes sur la page 1sur 4

Fiche technique : Analyse de rsultats

I. Statistiques
a. Les fonctions des statistiques : Fonction de description (statistiques descriptives) : moyenne, cart-type, mdiane, quartiles Aide la dcision (statistiques infrentielles) sur les effets des traitements = tests sur des diffrences de moyennes, diffrences de dispersions ou de proportions sur les relations entre variables = tests sur les mesures de corrlation, de concordance Un test permet de faire une infrence sur la population do est tir lchantillon tudi. Linfrence statistique consiste tirer des conclusions concernant les caractristiques d'une population partir des rsultats observs sur un chantillon alatoire obtenu de cette mme population. Par exemple, on peut vouloir tudier la fermet (caractristique) dun nouveau lot de gteaux (population). La fermet dun chantillon de gteaux est mesure et les donnes recueillies permettront de conclure sur la fermet de lensemble, i.e. du lot de gteaux. Linfrence statistique est effectue partir de tests statistiques. b. Taille de lchantillon - POPULATION : lensemble, la totalit des sujets - ECHANTILLON : une partie extraite alatoirement dune population pour obtenir une valuation de lensemble. Les tests statistiques permettent de faire les hypothses relativement aux populations dont sont issus les chantillons - INDIVIDU : lments indpendants les uns des autres composant la population Si lon possde toute la population, on na pas besoin de tests statistiques ! Plus lchantillon est de taille proche de celle de la population et moins on a de chances de se tromper en extrapolant la population entire les effets observs sur lchantillon. Quelle est la bonne taille dchantillon ? Dans la pratique, la taille des chantillons est trs souvent dcide en fonction de considrations budgtaires, de quantit de travail ou de temps, de disponibilit de matriel Cette pratique comporte des inconvnients majeurs en cas dchantillon trop petits : le risque de passer ct dun effet qui existe et le risque dtre entirement biais par un facteur alatoire pendant les mesures. On parlera dun : trs petit chantillon pour de 5 10 individus petit chantillon pour de 10 30 individus chantillon de taille moyenne pour quelques dizaines dindividus

II. Distribution normale


La distribution normale est une distribution symtrique en forme de cloche qui est modlise mathmatiquement. Elle est intressante parce que la trs grande majorit des phnomnes naturels tendent vers cette distribution quand on prend un grand nombre de mesures. Le centre de cette cloche correspond la moyenne. La courbe de probabilit est gonfle au centre, autour de la moyenne, mais baisse rapidement pour s'approcher de zro, sans toutefois l'atteindre. En sciences humaines, il est frquent de considrer que les valeurs se rpartissent selon une courbe de Gauss (courbe en forme de cloche).

III. Reprsentation des paramtres dun chantillon


La recherche en biologie se pratique en gnral sur un chantillon. Le 1er travail de tout chercheur sera de proposer un rsum de chacune des variables qui constituent cet chantillon. Ces indices calculs, sont des estimations de la vraie valeur de lindice, que lon obtiendrait si lon mesurait la variable dintrt sur lensemble de la population. A. Les mesures de la tendance centrale Elles sont, gnralement, les premires analyses statistiques que l'on fait. Elles nous donnent une direction pour les futures analyses. a. Paramtre de tendance centrale : la moyenne (mean en anglais) La moyenne marque le point dquilibre, le centre de gravit, d'une srie. C'est la mesure la plus connue et la plus couramment utilise. Cest la somme des valeurs numriques de la srie divise par le nombre de valeurs de la srie. Il y a toujours une unit une moyenne ! , moyenne arithmtique; xi, valeurs des observations de la variable X; n, nombre d'observations. Dans l'exemple ci-dessous, les trois populations gaussiennes (rpartition selon une courbe en cloche) ont le mme cart-type, mais des moyennes diffrentes. La forme des distributions ne change pas, la distribution se dplace simplement sur l'axe.

b. Paramtre de tendance centrale : la mdiane (median en anglais) Dans le cas de petits chantillons, lutilisation de la moyenne nest pas prudente car une valeur hors norme aura une forte influence. On prfrera alors la mdiane. La mdiane est une mesure de tendance centrale qui donne la valeur qui occupe la position centrale dans une srie; elle divise la srie en deux blocs gaux. Aprs tri des observations en ordre

croissant, la mdiane prend la valeur de lobservation de rang (n+1)/2, o n reprsente le nombre dobservation. 90 100 115 120 125 117,5 129,2 mdiane moyenne Remarque : Mdiane et Moyenne ne sont pas interchangeables ! La moyenne est trs sensible aux valeurs extrmes, et cela dautant plus que leffectif est petit. La moyenne est un indice valide que si la variable est distribue selon une loi normale. Dans ce cas, moyenne et mdiane sont confondues. B. valuer la dispersion La troisime tape consiste valuer la dispersion des donnes de vos variables. Les valeurs les plus courantes sont l'cart-type et les quartiles. a. Paramtres de dispersion : variance et cart-type (standard deviation en anglais) L'cart-type sert mesurer la dispersion d'un ensemble de donnes autour de la moyenne. Plus il est lev, plus les mesures sont disperses et plus la courbe s'aplatit. Lutilisation de lcarttype prend tout son sens pour dcrire une variable de distribution normale. Lutiliser en faisant implicitement lhypothse de normalit dans le cas dune variable qui ne lest pas peut conduire des rsultats absurdes. La figure ci-dessous illustre trois courbes aillant la mme moyenne et des carts types diffrents. La surface sous la courbe de distribution normale doit rester constante et gale 1, c'est pourquoi un aplatissement du sommet rsulte en un gonflement du reste de la courbe. 225

Variance = carr de lcart-type Lorsque la variable tudie est gaussienne (rpartition selon une courbe en cloche), la donne de la moyenne et l'cart-type fournit une base fondamentale pour interprter les donnes en termes de probabilit. Si la moyenne est m et l'cart type est , on trouve 95 % de la population dans l'intervalle [m 2;m + 2] et on trouve 68 % de la population dans l'intervalle [m ;m + ]. m-2 m- m m+ m+2

b. Erreur type (standard error of the mean) Soit une srie de mesures dans un chantillon : pour rsumer cette srie on utilise moyenne et cart-type. Si nous nous intressons maintenant non plus des individus, mais des sries dchantillons de plusieurs individus, chacun caractris par sa moyenne, on peut calculer la moyenne des moyennes obtenues sur les diffrents chantillons. Lerreur type se calcule trs simplement en divisant lcart-type de lchantillon par n, o n est leffectif. Par consquent, lcart-type de la moyenne est dautant plus petit que lcart-type de la variable est grand. Beaucoup dinvestigateurs le choisissent de manire errone car il est plus flatteur ! c. Paramtres de dispersion : les quartiles Lorsque la distribution ne peut pas normale, la dispersion nest plus estime de la mme manire : variance et cart-type ne sont plus fiables car il est impossible de sassurer de la symtrie de la distribution. On utilise alors les quartiles : Ecarts interquartiles = Q1 et Q3 = valeurs laissant : pour Q1 : 25% des valeurs au dessous et 75% au dessus pour Q3 : 75% des valeurs au dessous et 25% au dessus Remarque : on note que ces valeurs ne sont pas affectes par une valeur anormalement grande.

IV Exprimer les rsultats graphiquement


* *
valeurs trs extrmes QHigh = Q3 + 1,5(Q3-Q1)

Q3 Q2 = mdiane

Q1

Une bonne manire de communiquer vos rsultats est de les prsenter de manire visuelle. La prsentation par graphique permet de comprendre d'un coup d'il tout ce que reprsente une variable. Les graphiques sont trs utiles dans les analyses nous permettant de reprer les anomalies dans la distribution des donnes et les relations entre les variables. Reprsentation graphique dun petit chantillon : la bote moustaches (boxplot)

QLow = Q1 1,5(Q3-Q1)

V. Tests statistiques
Nous conduisons une recherche de faon dterminer l'acceptabilit d'hypothses dcoulant de nos connaissances (thories). Aprs avoir slectionn une hypothse, qui nous parat importante, nous rcoltons des donnes empiriques qui devraient nous apporter des informations directes sur l'acceptabilit de cette hypothse. Notre dcision concernant la signification des donnes nous conduit soit retenir, soit rviser ou soit rejeter l'hypothse et la thorie qui en est la source. Pour atteindre une dcision objective concernant une hypothse particulire, nous devons suivre une procdure objective (mthodes publiques et rptables par d'autres chercheurs) permettant soit d'accepter soit de rejeter cette hypothse. Cela consiste formuler, en termes probabilistes, un jugement sur une hypothse relative une population, partir des rsultats observs sur un chantillon extrait au hasard de cette population. Cette procdure suit les tapes suivantes : 1- tablir l'hypothse nulle (H0) [considrer l'hypothse alternative H1]. 2- choisir le test statistique appropri pour tester H0, 3- spcifier un niveau de signification (alpha) et la taille de l'chantillon (N), 4- trouver la distribution d'chantillonnage du test statistique sous H0, 5- sur la base de 2, 3, 4, dfinir la rgion de rejet, 6- calculer la valeur du test statistique l'aide des donnes de l'chantillon.