Académique Documents
Professionnel Documents
Culture Documents
Abstract : In this article, we present some statistical notions initially introduced by R.Gras and then developped
by different researchers in order to deal with the following problem : « Does knowledge a imply knowledge b?» :
implication between binary, modal and numerical variables and classes of such variables. We also present some
applications of this «mplicative analysis» to different didactical contexts : identification of students'conceptions
with respect to conditional probability, of students'proving strategies, of different effects of «obsolescence» and of
teachers'representations about mathematics teaching.
Introduction
Le didacticien, le psychologue, le méthodologue, tout chercheur intéressé par le
problème de l'ordonnancement de variables - par exemple, des comportements - s'interroge et
interroge fréquemment et indirectement ses données de la façon suivante:«Étant donné les
variables binaires a et b, dans quelle mesure puis-je assurer que dans une population, toute
observation de a s'accompagne nécessairement de celle de b?». En fait, ce regard non symétrique
sur le couple (a,b) s'exprime, de façon lapidaire par la question : «Est-il vrai que si a alors b?».
En général, la réponse stricte n'est pas possible et le chercheur doit se contenter d'une
implication «presque» vraie. Nous proposons, au moyen de l'implication statistique, un concept
et une méthode qui permettent de mesurer le degré de validité d'une proposition implicative
entre des variables binaires ou non. Cette méthode d'analyse de données permet, en outre, de
représenter , au sein d'une famille de variables, l'ordre (ou le préordre) partiel qui le structure
ainsi que celui qui sous-tend un ensemble de sous-familles de variables déjà ordonnées.
Rappelons que ces outils d'analyse doivent leur élaboration à des questions posées par la
didactique des mathématiques.
§1 La théorie
1.1 Modélisation du cas binaire
Dans le cas binaire (0 ou 1) , la situation générique est la suivante. Croisant une
population E et un ensemble de variables V, du fait de l'observation exceptionnelle de
l'implication de la variable a sur la variable b, on veut cependant donner un sens statistique à
une implication non stricte:a ¶ b. En termes ensemblistes, A et B représentant les sous-
populations respectives où les variables a et b prennent la valeur 1 (ou «vraie») , il y a
équivalence à mesurer l'inclusion non stricte de A dans B.
Intuitivement et qualitativement, nous pouvons dire que a ¶ b est admissible à l'issue
d'une expérience si le nombre d'individus la contredisant (individus de A\s\up11(_),
vérifiant a^\s\up11(_dans l'expérience, est invraisemblablement petit par rapport au nombre
d'individus attendu dans l'hypothèse d'absence de lien a priori entre a et b (ou A et B)
Si nous probabilisons une telle expression, nous sommes amenés à considérer 2 parties
aléatoires X et Y dans E, de mêmes cardinaux respectifs que A et B. Supposant l'indépendance a
priori de X et Y, nous admettrons l'implication au niveau 1-å (en général 95%) si et seulement si
la probabilité que X\s\up11(_soit plus «petit» que A\s\up11(_est elle-même plus
petite que å (soit en général 5%). L'indicateur de la qualité de l'implication, appelée intensité
d'implication, s'exprime alors de façon plus formelle par :
ƒ(a, \s\up11(_) = 1-Prob[card(X\s\up11(_)≤card(A\s\up11(_)]. On
dira :
[a¶ b acceptable au seuil ƒ(a, \s\up11(_)=1-å ]<=> Prob[card(X\s\up11(_)≤card(A\
s\up11(_)]≤å
Connaissant la loi (de Poisson) de card(X\s\up11(_) et donc l'approximation
gaussienne de la variable réduite , il suffit alors, dans les cas courants, de consulter la table de la
1
loi normale pour mesurer la qualité d'une implication. Par exemple, si 100 élèves sont en jeu
(cardE=100) et peuvent faire apparaître 2 comportements a et b avec les effectifs suivants:
cardA= 6, cardB =15, card(A\s\up11(_) =1,
On remarque que le nombre d'élèves (ici 1) contredisant l'implication : a¶b est invrai-
semblablement petit dans l'hypothèse où a et b ne seraient pas liés. En effet : ƒ(a,b;\s\
up11(_)=0,965, soit un niveau de confiance de 96,5% pour l'implication, car la probabilité que
card(X\s\up11(_) soit plus petit que 1 est 0,035.
Dans [Larher A. 1991], nous étendons la notion d'implication statistique à:
- des variables modales, susceptibles de représenter les nuances d'appréciation que ne peuvent
restituer des variables binaires. Par exemple, à un «peut-être», on pourra associer un nombre de
l'échelle ]0,1[;
- des variables numériques, susceptibles de représenter les occurences de la survenue d'un même
événement chez le même sujet.
1.2 Graphe de la relation d'ordre partiel induite par l'intensité d'implication
Mais un grand intérêt de l'implication statistique, qualifiée comme ci-dessus par
l'intensité d'implication, consiste à embrasser l'ensemble des variables selon lesquelles une même
population est considérée. C'est le cas des tests ou des questionnaires auxquels est soumis un
ensemble d'élèves. A chaque couple (a,b) de variables, on peut associer une mesure du degré
d'implication de a sur b et, par suite, un arc pondéré par cette intensité. Dans le cas d'égalité des
cardinaux de A et de B, on retient l'arc double. De plus, si l'on fixe une condition de transitivité
de l'implication (en général 0.5), il est alors possible de construire un graphe transitif, image de
l'ordre (ou du préordre) partiel qui découle de l'intensité et des cardinaux des ensembles qui
représentent les variables.Par exemple, supposons un ensemble de 5 variables observées, dont
les intensités d'implication supérieures à 0.5 sont données par le tableau suivant:
Références
AG ALMOULOUD, S.(1992 a), «Aide logicielle à la résolution de problèmes avec preuve : des
séquences didactiques pour l'enseignement de la démonstration», RDM, 12/2.3, pp.271-318.
AG ALMOULOUD, S.(1992 b), «L'ordinateur, outil d'aide à l'apprentissage de la démonstration
et traitement de données didactiques», Thèse de doctorat de l'Université de Rennes I.
BONNEVILLE, J.F - COMITI, C.- GRENIER, D.- LAPIERRE, G.(1991), «Une étude des
représentations d'enseignants de mathématiques». Séminaire de Didactique des Maths et de
l'Informatique, LSD2-IMAG, Grenoble.
GRAS, R.(1992), «L'analyse des données : une méthodologie de traitement de questions
didactiques». RDM, 12/1.
GRAS, R.&LARHER, A.(1993), «L'implication statistique, une nouvelle méthode d'analyse des
données». Revue «Mathématiques, Informatique et Sciences Humaines« n°120, pp.5-31.
GRAS, R.& TOTOHASINA, A.(1993), «Conceptions d'élèves sur la notion de probabilité
conditionnelle révélées par une méthode d'analyse de données : implication-similarité-
corrélation». Prépublication 93-05, Université de Rennes I.
HOC, J.M.(1987), «Psychologie cognitive de la planification». P.U. de Grenoble.
Larher, A.(1991), «Implication statistique et applications à l'analyse des démarches de preuve
mathématique». Thèse de doctorat de l'Université de Rennes I.
RATSIMBA-RAJOHN H.(1981), «Étude de deux méthodes de mesures rationnelles, la
commensuration et le fractionnement de l'unité, en vue de l'élaboration de situations
didactiques». Thèse 3è cycle, Université de Bordeaux I.
RATSIMBA-RAJOHN H.(1982), «Éléments d'étude de deux méthodes de mesures rationnelles».
RDM, 3/1, pp.65-113.
RATSIMBA-RAJOHN H.(1992), «Contribution à l'étude de la hiérarchie implicative. Application
à l'analyse de la gestion didactique des phénomènes d'ostension et de contradictions». Thèse de
doctorat de l'Université de Rennes I.
ROBERT, A. -ROBINET, J.(1989), «Représentations des enseignants de mathématiques sur les
mathématiques et leur enseignement». Cahier de Didirem n°1, Paris VII.
TOTOHASINA, A.(1992), «Conceptions causaliste ou chronologiste de la notion de probabilité
conditionnelle». Cahiers de Didactique des Mathématiques, Département de mathématique de
l'Institut Français de Tessalonique, 9, 127-154.
TOTOHASINA, A.(1992), «Méthode implicative en analyse de données et application à l'analyse
de conceptions d'étudiants sur la notion de probabilité conditionnelle». Thèse de doctorat de
l'Université de Rennes I.