Vous êtes sur la page 1sur 30

Imprécision phonémique et altération des processus de

parole : repères en lien avec la prise en charge


orthophonique
Etienne Sicard, Anne Menin-Sicard

To cite this version:


Etienne Sicard, Anne Menin-Sicard. Imprécision phonémique et altération des processus de parole :
repères en lien avec la prise en charge orthophonique. 2022. �hal-03648514�

HAL Id: hal-03648514


https://hal.science/hal-03648514
Submitted on 21 Apr 2022

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est


archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents
entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non,
lished or not. The documents may come from émanant des établissements d’enseignement et de
teaching and research institutions in France or recherche français ou étrangers, des laboratoires
abroad, or from public or private research centers. publics ou privés.
Imprécision phonémique et altération des
processus de parole : repères en lien avec
la prise en charge orthophonique
Etienne Sicard (1,2), Anne Menin-Sicard (2)
INSA-GEI, 135 Avenue de Rangueil, 31077 Toulouse (1)
Laboratoire LURCO, UNADREO www.lurco.unadreo.org (2)

Résumé :

L’âge d’acquisition des phonèmes de la langue Anglaise est bien documenté dans la littérature
scientifique ainsi que dans les protocoles à destination des orthophonistes. Bien qu’une adaptation au
Français Québécois soit aussi disponible, nous avons souhaité synthétiser les travaux sur l’âge
d’acquisition et de maîtrise des voyelles, des consonnes, ainsi que les clusters de consonnes et
diphtongues de la langue Française, afin de disposer de repères pouvant donner des indices d’un
éventuel retard ou trouble de la parole. Nous avons prolongé cette analyse en explorant les traits
distinctifs des différents phonèmes et associations de phonèmes sous forme de processus de paroles,
pour lesquels nous avons synthétisé les données disponibles en langue Française, afin de préciser l’âge
de maîtrise typique de ces différents processus. Sur la base d’une analyse statistique portant sur la
parole segmentée d’une centaine d’enfants répétant des phrases type, nous avons pu recouper et
ajuster les âges de référence. Nous donnons deux exemples de comparaison de scores d’articulation
et de processus acquis avant et après prise en charge pour conclure nos propos.
Mots clé : voyelles, consonnes, enfant, acquisition des phonèmes, articulation, traits distinctifs, processus de
parole, triangle vocalique, voisement, nasalisation, cluster, diphtongue, plosives, constrictives, prise en charge,
orthophonie, DIADOLAB

Introduction
Le tableau d’acquisition des phonèmes en fonction de l’âge est notamment destiné aux parents pour
répondre à la question « Est-ce normal que mon enfant ne sache pas dire tel ou tel son à son âge ? ».
La diffusion de ces repères dans des sites grand public tels que [VCH 2021] ou [Williamson 2022] peut
ainsi rassurer les parents ou les intervenants en maternelle, mais dans le cas où des retards significatifs
seraient constatés, les intervenants ou parents sont invités à consulter en vue d’un possible bilan
orthophonique.

Implémenter ces repères dans un protocole ou dans un logiciel destiné à la pratique clinique permet
de situer de manière fiable les performances de l’enfant par rapport à une évolution normale, ce qui
renforce la pertinence de l’évaluation de l’orthophoniste, notamment face aux parents de l’enfant
pour justifier ou non une prise en charge thérapeutique.

En tant qu’auteurs du logiciel DIADOLAB [Menin-Sicard 2019] largement adopté par la communauté
des orthophonistes francophones, nous souhaitons donc étayer les repères d’acquisition de la langue
Française, en puisant dans la littérature scientifique pour identifier les mesures et repères faisant
consensus. Nous utilisons dans la suite de ce rapport de recherches une notation des phonèmes dont
la correspondance phonétique est reportée figure 1 pour les voyelles et les consonnes. Cette notation,
proche du langage naturel, est utilisée dans DIADOLAB pour simplifier l’interface avec l’outil
informatique. Cette notation est aussi utilisée dans les tableaux didactiques en ligne de [VCH 2021].

Figure 1 : correspondance entre la désignation des phonèmes et le symbole phonétique [Menin-Sicard 2019]

Dans cet article, nous présentons les données normatives d’acquisition et de maîtrise des phonèmes,
avec notamment les repères en langue Anglaise, et établissons un tableau similaire en langue Française
sur la base de publications probantes disponibles, en donnant une importance particulière aux
contenus en archives ouvertes. Nous abordons ensuite les processus de parole en faisant la distinction
entre l’approche dite linéaire des phonèmes, et non linéaire des traits distinctifs. Nous présentons nos
propres résultats d’analyses statistiques portant sur 100 enfants de 4 à 7 ans dont nous avons
segmenté les corpus enregistrés de 3 phrases type complémentaires. Nous tentons alors, pour chaque
processus défini, de déterminer un âge de maîtrise, correspondant à un pourcentage d’erreur
résiduelle inférieure à 15%. Nous illustrons enfin l’utilisation de l’approche par processus hiérarchisés,
des repères d’âge d’acquisition des phonèmes en comparant les performances phonologiques de deux
patients avant et après prise en charge. Pour terminer, nous discutons des limites des valeurs
proposées dans le cadre clinique.

Données normatives sur les phonèmes


Les données normatives présentées ci-après sont basées sur les résultats de recherche portant sur de
grands groupes d'enfants, permettant d’identifier quel phonème de la parole est ébauché, en cours
d’acquisition ou maîtrisé à un âge donné. Cela permet de situer les performances d’un enfant,
notamment pour savoir si le fait qu’un phonème ne soit pas correctement prononcé est normal pour
l’âge ou pourrait être considéré comme un signal d’alerte d’un possible retard d’acquisition du langage.

Données portant sur la langue Anglaise


Le graphique de la figure 2, téléchargé depuis le site de [Williamson 2022], représente les données
combinées de [Sander 1972], [Grunwell 1981] et [Smit 1990] en lien avec l’âge d’acquisition des
consonnes de la langue Anglaise. Le bord gauche de chaque barre horizontale représente l'âge à partir
duquel au moins 50 % des enfants produisent la consonne correctement. Le bord droit représente l'âge
où au moins 90% des enfants maîtrisent l'utilisation de la consonne dans leurs échanges spontanés.
Figure 2 : Age d’acquisition des phonèmes de la langue Anglaise téléchargé depuis le site SLT info de [Williamson 2022],

Les bornes de la figure 2 ne doivent pas être considérées comme des limites strictes. En effet, le
diagramme a été construit en compilant différentes sources qui ne sont pas toujours concordantes, et
les études elles-mêmes ont été conduites avec des différences méthodologiques notables pouvant
amener des variations voire des biais. Par exemple, les tâches demandées à l’enfant qui ont permis
d’extraire les repères d’âge ont consisté soit en de la répétition de mots, de la désignation d’image ou
de la parole spontanée, selon les études.

Nous pouvons cependant considérer ces bornes comme des plages de développement plausible pour
l’acquisition des phonèmes chez les jeunes enfants. A noter aussi que le diagramme ne porte que sur
les consonnes : les voyelles sont considérées comme acquises à l'âge de 3 ans, point sur lequel nous
reviendrons concernant la langue Française.

Une version grand public de ce tableau, avec quelques différences notables, est disponible en ligne via
le Vancouver Coastal Health [VCH 2021], reportée figure 3. Ce tableau précise l'âge auquel 90 % des
enfants sont censés avoir acquis la réalisation articulatoire des consonnes. Il fournit ainsi aux parents
et personnels éducatifs des repères d’acquisition. Si la prononciation de l’enfant s’écarte
significativement des repères, la rencontre avec un orthophoniste est alors conseillée.
Figure 3 : Acquisition des phonèmes en fonction de l’âge en Anglais selon le Vancouver Coastal Health Institute [VCH 2021]

Données portant sur la langue Française


En comparant les tableaux, nous observons certaines disparités entre les phonèmes de la langue
française et ceux de la langue anglaise, notamment en termes d’occurrence et de caractéristiques
motrices, ce qui complique l’adoption de valeurs de référence de l’Anglais pour la langue Française.
Certains phonèmes sont spécifiques à l’une ou l’autre des langues, comme le /h/ aspiré pour l’Anglais
et les voyelles nasales pour le Français. De nombreuses études telles que [De Boysson-Bardies 1989]
soutiennent l'hypothèse interactionnelle entre les productions infantiles du très jeune enfant et les
caractéristiques de son environnement linguistique, incitant à éviter de transposer trop directement
les caractéristiques des phonèmes d’une communauté linguistique à une autre.

Les données disponibles en langue française sont assez limitées, au point que certains auteurs comme
[Rose 2007] préfèrent ne pas s’engager sur des âges d’acquisition trop précis. Nous avons pu
sélectionné un certain nombre d’études où le nombre de cas était significatif, qui travaillaient par
classe d’âge, notamment :

 La mise en place du système phonologique du français chez 50 enfants entre trois et six ans
[Aicart-de Falco 1987]
 L’ouvrage de [Rondal 2000] sur les troubles du langage
 Les habiletés phonologiques de 16 enfants de 2 ans [Vinter 2001]
 Les données d’acquisition des consonnes finales chez 13 enfants de deux ans et demi de
[Hilaire-Debove 2004].
 Les travaux de [MacLeod 2011] sur l’acquisition des consonnes de 150 enfants Québécois de
2 à 5 ans
 Les séquences de consonnes en position initiale de mot produites par 50 enfants de 4 à 5 ans
½
 Le mémoire d’orthophonie de [Gaborieau & Sagaspe 2011] sur les consonnes finales de 30
enfants de 3 ans
 Les travaux de [Kehoe 2008] sur les diphtongues prononcées par 14 enfants de 2 à 3 ans.
 Notre propre étude sur l’analyse de phrases type prononcées par 60 enfants normo-
phoniques et 90 enfants suivis en clinique orthophonique [Sicard 2020b]

Nous avons exclu les études longitudinales portant sur un nombre trop restreint d’enfants (1 à 5) ainsi
que les résultats concernant les enfants avec suivi orthophonique pour un trouble phonologique, tels
que [Rvachew 2014].

La revue de littérature de [McLeod 2018] compare les résultats de 60 articles en lien avec l’acquisition
des consonnes, correspondant à 26 000 enfants et 27 langues différentes, qui n’inclut
malheureusement qu’une seule étude concerne la langue Française dans sa spécificité Québécoise
[MacLeod 2011]. Il ressort de la revue de littérature que la plupart des consonnes de toutes les
languées ont été acquises à 5 ans à un taux supérieur à 90%. Les plosives et nasales sont acquises plus
tôt que les fricatives, voisées et trilles.

Acquisition des phonèmes en fonction de l’âge


Nous reportons à la figure 4 la synthèse des résultats que nous avons obtenus en compilant les
différentes sources. Trois seuils avec leur couleur associée sont utilisés sur les lignes horizontales
associées à chaque phonème dans la figure 4 : le premier seuil (rose clair) correspond à celui où environ
50% des enfants prononcent correctement le phonème, le deuxième seuil (en orange) où entre 50 et
85% des sujets maîtrisent la prononciation du phonème, enfin le troisième seuil (en vert) où plus de
85% des enfants normo-phoniques prononce le phonème (vert). Le point rouge correspond au repère
d’âge utilisé dans le logiciel DIADOLAB [Menin-Sicard 2019], version 3.5. On peut constater des
différences significatives sur certains phonèmes par rapport aux repères en langue Anglaise exposés
plus haut.

Figure 5 : Normes d’acquisition des phonèmes de la langue Française incluses dans DIADOLAB [Sicard 2022]
Figure 5 : correspondance entre la désignation des phonèmes et le symbole phonétique, déduit de la figure 4.

Le résumé de la progression dans la maîtrise des consonnes, basé sur au moins 85% de phonèmes
corrects, ou encore moins de 15% d’erreurs résiduelles, toutes positions confondues, est reporté figure
5. Nous voyons ici que les phonèmes sourds sont acquis bien avant l’équivalent sonore et les
diphtongues rarement présentées dans les repères de la littérature mentionnée apparaissent et sont
maitrisées plus tardivement que les clusters. Le processus de nasalisation est aussi tardivement
stabilisé. L’analyse objective par segmentation spectrale permet d’observer des spécificités chez le
jeune enfant. L’apparition des extrêmes vocaliques /i/ou/ est plus tardive que les voyelles plus
centrales telles que /é/eu/au/. Les processus combinés constriction/voisement ou encore
occlusion/voisement ne sont pas prononcés avant 5 ans, même s’ils peuvent être ébauchés ou
substitués.

Processus de parole
Approche linéaire
L’analyse qui consiste à comparer un à un chacun des phonèmes produits par l’enfant par rapport à
une cible idéale est appelée « approche linéaire » dans la littérature scientifique [Brosseau-Lapré
2018]. C’est cette approche qui permet dans DIADOLAB [Menin-Sicard 2019] d’établir un score
d’articulation par segmentation spectrale en comparant d’un côté les phonèmes perçus par
l’orthophoniste grâce à la ré-écoute sélective et l’analyse de l’image spectrale, et de l’autre côté, les
phonèmes attendus sur une phrase prédéfinie. Ce score est ensuite comparé à une norme, ce qui,
complété à d’autres indicateurs en lien avec l’intelligibilité et la fluence, donne des indices sur
l’opportunité d’une prise en charge orthophonique.

L’approche linéaire est aussi la base de l’intervention orthophonique dite « approche traditionnelle »
[Brumbaugh 2013], pour laquelle l’orthophoniste vise principalement à corriger les sons isolés de la
parole, une approche majoritaire parmi les orthophonistes interrogées dans le cadre de leur sondage
auprès d’orthophonistes Anglaises. Dans la très grande majorité des cas, l’évaluation se fait « à
l’oreille » sans enregistrement de corpus, les épreuves comportant un grand nombre d’items et se
révélant souvent longues à administrer et à dépouiller.

Une métrique utilisée couramment pour qualifier le degré de maîtrise des processus articulatoires est
le pourcentage de phonèmes corrects, que l’on décline parfois en Pourcentage de Voyelles Correctes
(PVC) et Pourcentage de Consonnes correctes (PCC) comme étudié dans [Shriberg 1982], qui montre
sur 12 patients une corrélation intéressante entre ces métriques et le degré de sévérité du trouble
phonologique.
Figure 6 : Score d’articulation obtenu par segmentation et comparaison avec la liste des phonèmes attendus, donnant 20/30
pour une norme à 24/30 à 5 ans (cas SM004 de la base de données de parole). Cette approche est dite linéaire.

L’approche suivie dans DIADOLAB est assez similaire, bien que pondérée selon le type d’altération
identifiée : une omission ou confusion complète est plus sévèrement sanctionnée (-2) qu’une
altération ou déformation partielle (-1). Nous donnons figure 6 l’exemple d’un enfant de 5 ans avec
troubles phonologique dont la liste cumulative des erreurs sur la phrase /Bonjour Monsieur Tralipau/
(15 phonèmes, score maximum de 30/30) donne un score de 20/30, la norme à 5 ans étant de 24/30.
Le /on/ est perçu comme /a/, le /ou/ comme /au/, le /r/ est omis ainsi que le /l/.

L’un des inconvénients de l’approche linéaire est d’attribuer le même poids à tous les phonèmes,
malgré des fréquences d'occurrence très différentes dans la langue française (/a/ : 8%, /o/ 2,5% par
exemple). De même, l’impact de la place du phonème dans la phrase analysée peut être aussi très
différent selon qu’il s’agit d’une position initiale, médiane ou finale. Enfin l’altération de l’intelligibilité
ne repose pas seulement sur le nombre de phonèmes erronés, mais doit inclure d’autres indices,
comme le débit non conforme, les disfluences ou encore une prosodie inappropriée.

Occurrence des phonèmes


L’occurrence des phonèmes est représentée à la figure 7 sous forme de rond de taille variable, et
exprimée en %. Les voyelles sont positionnées dans l’espace vocalique des formants F1 (axe Y) corrélés
avec l’ouverture de la bouche, et F2 (axe X) corrélés avec la position postérieure ou antérieure de la
langue. Le placement des consonnes est fait selon le point d’articulation. Parmi les phonèmes les plus
fréquents de la langue Française [Wioland 1991] nous trouvons les voyelles /a,é,i/ et les consonnes
/r,l,s/.
Figure 7 : Occurrence des phonèmes de la langue français d’après [Wioland 1991], les voyelles étant positionnées dans
l’espace vocalique F1/F2, valeurs fréquentielles pour un enfant de 6 ans

Approche non linéaire - traits distinctifs


Une différence majeure entre l’approche linéaire décrite plus haut et l’approche dite « non linéaire »
comme décrite dans [Bernhardt 1992] consiste à représenter chaque phonème sous forme d’un
nombre restreint de traits distinctifs. Parmi ces traits nous trouvons communément la vibration
laryngée, la constriction, l’occlusion ou la nasalisation. Il est alors possible de relier ces traits entre eux
pour décrire une succession d’évènements qui composent la production du phonème. Ces différents
évènements sont ordonnés dans le temps, avec des points de rupture, d'où la désignation d’approche
non linéaire.

Par exemple le /b/ peut se décomposer en une occlusion, une mise en pression modérée au niveau
des lèvres avec mise en vibration (segment /vib-vibration laryngée/ sur la figure 8), suivie d’un
relâchement dont la signature fréquentielle permettent d’identifier un /b/ (segment /tr-transitoire/
au centre de la figure 8). Le transitoire est immédiatement suivi de la mise en vibration de la voyelle
suivante segmentée comme /voy-voyelle/.
Figure 8 : L’allure temporelle de la consonne /b/ se décompose en un phénomène d’occlusion bilabiale et de mise en pression
associée à la vibration laryngée (vib), suivie de l’ouverture de la bouche, d’un transitoire (tr) puis de l’établissement de la
voyelle (voy)

Tout comme les phonèmes sont les « blocs de construction » des syllabes, les traits distinctifs sont les
« blocs de construction » des phonèmes [Morley 1969]. La maîtrise progressive de ces traits permet la
mise en place du système phonologique de l'enfant. A l’inverse, l’incapacité à maîtriser un trait, comme
la constriction par exemple, compromet la prononciation de l’ensemble des consonnes fricatives
/f,s,ch/ d’une part, et /v,z,j/ d’autre part. Une confusion d’un enfant sur le trait « point d’articulation »
palatal/alvéolaire peut altérer le /ch/ en /s/, ou le /j/ en /z/, comme l’avait mise en avant l’étude de
[Aicart-de Falco 1987].

Traits distinctifs des voyelles et des consonnes


En s’inspirant de [Bernhardt 1992] qui décrit les différentes consonnes de la langue anglaise sous forme
de traits distinctifs, [Brosseau-Lapré 2018] détaille les traits phonologiques des consonnes du français,
en incluant les consonnes spécifiques au Français Québécois. Nous reprenons ce tableau en listant
l’ensemble des traits distinctifs mis en œuvre dans DIADOLAB, notamment pour l’animation de la tête
parlante (Table 1). Nous pouvons représenter l’ensemble des consonnes à l’aide de 6 traits distinctifs :
le voisement, la position des articulateurs, la pression, l’occlusion, la constriction et la nasalisation.

Concernant la position des voyelles, nous séparons la position de la mâchoire en 3 zones : mâchoire
fermée (MF), médiane (MM) ou ouverte (MO). De même nous distinguons la langue postérieure (LP),
médiane (LM) ou antérieure (LA). Concernant les consonnes, nous distinguons les différentes positions
de la langue ou des lèvres, selon les termes explicités à la figure 9.
CV Sigle Example Voisement Position Pression Occlusion Constriction Nasalisation
Voyelle a /chat/ Voisement Continu
MO+LM
Voyelle i /ici/ Voisement Continu
MF+LA
Voyelle u /usine/ Voisement Continu
MF+LM
Voyelle e /peur/ Voisement Continu
MM+LM
Voyelle è /aide/ Voisement Continu
MM+LA
Voyelle é /étoile/ Voisement Continu
MM+LM
Voyelle eu /heureux/ Voisement Continu
MM+LM
Voyelle o /ortie/ Voisement Continu
MM+LM
Voyelle ou /ours/ Voisement Continu
MF+LP
Voyelle au /olive/ Voisement Continu
MF+LM
Voyelle an /enfant/ Voisement Continu Nasal
MM+LA
Voyelle on /oncle/ Voisement Continu Nasal
MF+LP
Voyelle in /pain/ Voisement Continu Nasal
MM+LM
Voyelle un /lundi/ Voisement Continu Nasal
MF+LM
Consonne p /papa/ bilabial forte Occlusion
Consonne b /bonbon/ Voisement bilabial modérée Occlusion
Consonne m /maman/ Voisement bilabial faible Occlusion Nasal
Consonne t /tapis/ alvéolaire forte Occlusion
Consonne d /dent/ Voisement alvéolaire modérée Occlusion
Consonne n /noël/ Voisement alvéolaire faible Occlusion Nasal
Consonne k /copie/ vélaire forte Occlusion
Consonne g /gâteau/ Voisement vélaire modérée Occlusion
Consonne f /fille/ labiodental modérée Continu Constriction
Consonne v /valise/ Voisement labiodental faible Continu Constriction
Consonne ch /chat/ palatal faible Continu Constriction
Consonne j /jeu/ Voisement palatal faible Continu Constriction
Consonne s /sel/ alvéolaire modérée Continu Constriction
Consonne z /zèbre/ Voisement alvéolaire faible Continu Constriction
Consonne r /rat/ palatal faible Continu
Consonne l /lait/ Voisement alvéolaire faible Continu
Consonne gn /peigne/ Voisement palatal faible Continu Nasal
Table 1 : Description de chaque phonème de la langue Française sous forme des traits distinctifs dans DIADOLAB

Processus de parole
Par processus de parole, nous entendons principalement des groupes de phonèmes qui se distinguent
par un trait commun [Chomsky & Halle 1968] ou une caractéristique remarquable. Notons que ce
terme «processus de parole» a un sens très différent ici que celui évoqué par [Brosseau-Lapré 2018]
qui est un « processus phonologique simplificateur » dans la mesure où il décrit un phénomène
d’altération phonémique tel que des substitutions, des suppressions ou des simplifications qui
permettent à l’enfant de contourner certaines difficultés phonologiques. Par exemple, dans le cas du
cluster de consonnes /tr/ de /Tralipau/, on peut observer sur la suppression du /r/ dans /tr/, la
substitution /tr/ en /kr/, ou la simplification du /tr/ sous forme de /p/, beaucoup plus simple à
produire. Le terme de « patrons d’erreurs typiques » est employé par exemple dans le protocole
d’évaluation sommaire de la phonologie chez les jeunes enfants de [MacLeod 2014].
Bilabial /p,b,m/ Alvéolaire /t,d,n,s,z,l/ Vélaire /k,g/

Palatal /ch, j, r, gn/


Labio-dentale /f,v/

Figure 9 : Traits distinctifs et points d’articulation des différentes consonnes

Abrégé Description Phonème identifié Age acquisition Occurrence Priorité


(>85%) cumulée (%)
Aiou Extrêmes du triangle /a/, /i/ et /ou/ 4 17,8 ***
vocalique /a,i,ou/
mns Extrêmes des consonnes /m/ et /s/ ou /n/ et 5 12,0 **
/m,s/ ou /n,s/ /s/
Fsch Constrictive non voisée /f/ ou /s/ ou /ch/ 4 7,6 **
Vzj Constrictive voisée /v/ ou /z/ ou /j/ 6 4,5 *
Ptk Occlusive non voisée /p/ ou /t/ ou /k/ 3 13,3 ***
bdg Occlusive voisée /b/ ou /d/ ou /g/ 3 5,0 **
cnas Consonne nasale /m/ ou /n/ ou /gn/ 5 6,4 *
vnas Voyelle nasale /an/ ou /in/ ou /on/ 6 6,7 **
Euéè Variantes du /e/ /eu/ ou /é/ ou /è/ 3 12,4 *
L Consonne liquide /l/ 5 6,3 **
R Consonne roulée /r/ 4 7,1 **
CC Cluster de consonnes /CC/ 4 ***
VV Diphtongue /VV/ 6 **

Table 2 : processus, description, âge d’acquisition, occurrence et degré d’importance [Sicard 2022]
Notre déclinaison des processus de parole est composée de 13 processus distincts, listés à la table 2.
Pour chaque processus, nous précisions l’âge d’acquisition à 85% (soit moins de 15% d’erreur
résiduelle), l’occurrence cumulée (somme de l’occurrence des phonèmes concernés) et un score de
priorité, de 1 à 3. Ce score peut être considéré comme une indication de l’importance du processus
pour l’intelligibilité de la parole du patient, et donc de la priorité de sa prise en charge orthophonique.

Analyses statistiques sur la maîtrise des processus


Nous disposons d’un large corpus d’enregistrements de phrases type /Bonjour Monsieur Tralipau/,
/Est-ce que tu connais Glochin l’écureuil/ et /il vole des framboises/, en particulier grâce aux travaux
de [Bardelang 2020], [Grenier 2020], et de la contribution des orthophonistes cliniciennes membres
de l’ERU 46 « Parole pathologique » du LURCO [ERU 46]. Le protocole consiste en une tâche de
répétition de phrases courtes d’après modèles, dont le sens est assez « écologique » et respecte la
phonotactique du Français, s’approchant ainsi d’une situation de communication et de transmission
d’information naturelle.

L’approche se distingue d’une tâche de dénomination d'images, celle-ci étant moins représentative de
la structure linguistique et de la complexité du langage employé par l’enfant en situation d’interaction
réelle. A noter que notre protocole est moins favorable que celui qui consiste à enregistrer une
conversation en parole spontanée de l’enfant avec un adulte familier, situation dans laquelle le
Pourcentage de Consonnes Correctes (PCC) peut s’avérer significativement plus élevé [Vinter 2001].

Un corpus incluant la production de 140 enfants a ainsi été collecté auprès de 10 orthophonistes, avec
des âges allant de 3 à 8 ans. Chaque production sonore a été segmentée, et la comparaison des
phonèmes perçus par rapport aux phonèmes attendus a permis d’évaluer, pour chaque phrase
prononcée par chaque enfant, un score d’articulation. La réalisation des processus a été évaluée sur
chacune des phrases. Ensuite, une analyse statistique a été conduite pour chaque tranche d’âge, afin
d’extraire un pourcentage d’erreur pour chaque processus en fonction de l’âge. La détermination de
l’âge de maitrise du processus correspond à 85% de réalisation correcte (environ 7 enfants sur 8), soit
une erreur résiduelle de moins de 15% (1 enfant sur 8).

Certains enfants avec un score d’articulation significativement plus bas que la norme pour l’âge ont
été exclus du corpus. La répartition des 238 phrases utilisées dans les statistiques en fonction de l’âge
est donnée à la table 3.
Age Tralipau Glochin Framboise Total
3 ans 10 10
4 ans 13 13
5 ans 15 11 9 35
6 ans 24 9 15 48
7 ans 29 12 18 59
8 ans 23 23 27 73
Total 238

Table 3 : Corpus utilisé pour l’analyse de la maîtrise des processus en fonction de l’âge, groupe normo-phonique

Chaque phrase a été segmentée d’après les phonèmes réellement perçus. Chaque phonème repéré
valide le ou les processus qui lui correspondent : par exemple le /p/ valide le processus « ptk - Occlusive
non voisée », le /d/ valide le processus « bdg – Occlusive voisée ». Si le /a/, /i/ et le /ou/ sont présents
dans la segmentation le processus « Aiou – extrêmes du triangle vocalique » est validé.
Figure 11 : Pourcentage d’erreur sur les processus en fonction de l’âge, sur la base de 90 phrases « Bonjour Monsieur
Tralipau » d’enfants normo-phoniques.

Le pourcentage d’erreur en fonction de l’âge, pour chaque processus, est donné figure 11 concernant
la phrase /Bonjour Monsieur Tralipau/, pour laquelle nous disposions de 90 réalisations. Il permet par
exemple d’observer qu’à 4 ans, plus de 20 % des enfants font une erreur ou imprécision sur /a/, /i/ ou
/ou/, ce qui invalide le processus « Aiou – extrêmes du triangle vocalique ». A 5 ans, le seuil de 15 %
d’erreur résiduelle est franchi, on considère alors le processus comme maîtrisé. On note 2 processus
tardifs : le /vzj/ (encore au-dessus de 15 % d’erreur à 5 ans) et les diphtongues (clusters VV, ne passe
sous la barre de 15 % d’erreur qu’à 6 ans). Ces données doivent cependant être considérées avec une
certaine prudence, notamment pour les tranches de 3 à 5 ans, du fait d’un nombre peu élevé de cas
par classe d’âge (N=10 à 15).

Intérêt des processus de parole


Le raisonnement par processus de parole porte sur une palette plus réduite que celle qui distingue
chaque voyelle et chaque consonne séparément. Il forme une base intéressante non seulement pour
évaluer la sévérité du trouble phonologique de l’enfant mais aussi pour cibler les axes thérapeutiques
et orienter les exercices vers un travail spécifique du ou des processus défaillant(s).

Notre approche des processus est positive : l’idéal est que l’ensemble des processus soient maitrisés.
L’approche est complémentaire de l’évaluation du score de phonologie basé sur un inventaire des
mécanismes d’altération de la structure syllabiques (suppression, réduction, redoublement), des
disfluences (redoublement), ou des substitutions (antériorisation, glissement, occlusion,
dénasalisation). Le repère d’âge de maîtrise du processus revêt une importance particulière : l’alerte
ne dois pas être donnée si un enfant ne maîtrise pas un processus supposé acquis à un âge plus tardif.
En revanche, un délai important par rapport à l’âge de référence est un indice intéressant pour affiner
les cibles de la prise en charge clinique.

Afin de dresser un bilan de l’articulation d’un patient, nous pouvons superposer :

 Les phonèmes attendus


 Les phonèmes perçus
 Les différences entre les deux séquences
 Le type d’altération mis en jeu (omission, désonorisation, imprécision, etc.)
 La liste des processus non acquis correspondants
Figure 12 : Comparaison des phonèmes cible et perçus sur la phrase /Bonjour Monsieur Tralipau/, femme de 77 ans, et liste
des processus altérés classés par ordre de priorité

Un exemple d’analyse d’une phrase simple est reporté figure 12. Les phonèmes de référence de la
phrase /Bonjour Monsieur Tralipau/ sont listés en haut. Les phonèmes perçus par l’orthophoniste, sur
la base de la segmentation, sont listés en dessous. Les ronds rouges correspondent aux omissions de
phonèmes, c’est-à-dire des phonèmes présents dans la liste de référence, mais absents dans la
segmentation. Les ronds verts correspondent aux phonèmes identifiés. Les erreurs sont signalées en
dessous de chaque couple non conforme entre la cible et la segmentation. De cette liste d’erreurs,
nous déduisons la liste des processus altérés, classés par ordre de priorité, avec l’occurrence associée
dans la langue française, et l’âge de maîtrise du processus.

Détail des processus de parole


Nous détaillons dans cette section les informations concernant chaque processus de parole, en puisant
dans les ressources bibliographiques et nos propres analyses statistiques des éléments justifiant le
choix d’un âge de maîtrise du processus.

a/i/ou - Extrêmes vocaliques


La notion d’extrêmes vocaliques fait référence à la représentation du triangle vocalique dans une
représentation fréquentielle corrélée sur l’axe horizontale à la position reculée ou avancée de la
langue, et sur l’axe vertical, par l’ouverture de la bouche (Figure 12). Les zones de résonance
fréquentielle des formants F1 et F2 permettent de représenter l’ensemble des voyelles dans un espace
approximativement triangulaire traditionnellement appelé triangle vocalique [Sicard 2020] dont le
/a/,/i/ et /ou/ forment les extrêmes. L’imprécision sur l’une des voyelles composant les sommets du
triangle réduit l’aire vocalique du triangle et altère l’intelligibilité.
Figure 12 : Représentation du triangle vocalique /a,i,ou/ dans l’espace fréquentiel des formants F1 (axe vertical) et F2 (axe
horizontal)

Dans son étude sur les très jeunes enfants [De Boysson-Bardies 2007] souligne que l’espace vocalique
des productions de l’enfant d’un an reflète déjà celui de sa langue maternelle, avec des suites
syllabiques tendant à reproduire les schémas phonotactiques de sa langue. Les voyelles sont
globalement acquises plus précocement que les consonnes chez le jeune enfant. Leur intensité sonore,
durée et importance prosodique est significativement plus élevée que les consonnes.

Même si le /a/, /i/ et /ou/ pris séparément sont considérés comme maîtrisés à 2 ans ½ (voir repères
de la figure 5), le processus /aiou/ sur une phrase courte est considéré comme maîtrisé seulement à 4
ans, de par une certaine imprécision syllabique dans la phrase type, en particulier des confusions /u-
ou/ ou /e-au/ jusqu’à 3 ans inclus, relevées aussi par [Aicart-de Falco 1987].

Mns - Extrêmes des consonnes


Nous considérons les consonnes /m/ et /s/ comme des extrêmes consonantiques pour différentes
raisons : la position très différente de la langue, le contenu fréquentiel opposé et la corrélation forte
avec l’intelligibilité (Figure 13). La trajectoire fréquentielle du /m/ est essentiellement un pic à basse
fréquence correspondant à la vibration laryngée. Au contraire, la trajectoire fréquentielle du /s/ est
positionnée à très haute fréquence, sans vibration laryngée (Figure 14). Nous avons noté une
corrélation importante entre l’intelligibilité et l’écart fréquentiel entre les zones d’énergie maximale
du /m/ et du /s/ sur un corpus de parole normale et altérée [Sicard 2017]. Nous incluons aussi le /n/,
très proche du /m/, comme alternative à l’opposition /m-s/.

Figure 13 : représentation des consonnes /m/ et /s/ en lien avec la position de la langue
Figure 14 : Une forte distinction fréquentielle de l’énergie du /m/ et du /s/ favorise l’intelligibilité [Sicard 2017]

F/s/ch – Constrictives non voisées


Comme c'est le cas dans d'autres langues, les fricatives sont difficiles à produire chez le très jeune
enfant [Rose 2007]. La localisation des constrictives /f/, /s/ et /ch/ correspond à la position
labiodentale (Figure 15), où les différences de forme et de position de la langue influent sur la structure
du conduit turbulent qui permet de modifier l’enveloppe spectrale. Le /f/ est à large spectre, le /ch/ à
spectre plutôt moyenne fréquence, et le /s/ plutôt à hautes fréquences. Une comparaison des profils
fréquentiels du /ch/ et du /s/ d’un graçon de 9 ans normo-phonique est donnée Figure 16. L’énergie
du /s/ ne cesse de croitre au-delà de 4000 Hz, celle du /ch/ ne cesse de décroitre. La régulation du
débit d’air propre à chaque constrictive demande un haut niveau de maîtrise des muscles intrinsèques
de la langue afin de donner à celle-ci la forme et la tonicité adéquate. La fréquence des troubles de
type sigmatisme ou schlintement en sont la conséquence.

Figure 15 : Positionnement des consonnes du processus constrictives non voisées par rapport à la position de la langue

Figure 16 : Comparaison des spectres moyens de /ch/ (noir) et /s/ (rouge), garçon de 9 ans (MEC007)
L’étude de [Hilaire-Debove 2004] concernant les constrictives sourdes chez les enfants de 2 ans ½
indique un taux d’erreur supérieur à 25%. Le /f/ est considéré comme maîtrisé à 3 ans dans les repères
de [MacLeod 2014], mais le /s/ et le /ch/ sont beaucoup plus tardifs, autour de 5 ans. Par contre, le
score de consonnes correctes à 2 ans de [Vinter 2001] donne l’inverse : /s/ autour de 70%, mais /f,ch/
autour de 50%.

Le mémoire de [Gaborieau & Sagaspe 2011] sur une population de 30 enfants de 3 ans indique 18%
d’erreur sur les fricatives en position finale analysées dans les mots tasse (/s/), chaise, cerise (/z/), ainsi
que 40% sur les fricatives en position finale dans vache (/ch/), singe et manège (/j/). Dans cette étude,
on peut supposer que les fricatives non voisées /s, ch/ sont sujettes à un taux d’erreur moins élevé que
/z, j/. Nos propres analyses statistiques indiquent une production de /s/ de /Monsieur/, /ch/ de
/Glochin/ et /f/ de /Framboise/ maîtrisées à 4 ans. Nous plaçons donc le repère d’âge de ce processus
à 4 ans.

La segmentation spectrale réalisée avec le module Phonologie de Diadolab met en évidence une
distinctivité partielle de ces constrictives en dessous de 4 ans. Celles-ci se différentient
progressivement jusqu’à stabilisation autour de 5 ans.

Vzj – Constrictives voisées


Dans son étude portant sur 50 enfants de 3 à 6 ans, [Aicart-de Falco 1987] note une prépondérance de
l’altération des quatre consonnes fricatives /f/v/s/z/, l’imprécision étant de l’ordre de 30% à 50% selon
les tranches d’âge. L’auteur illustre ses propos en liant les consonnes pour indiquer le nombre de
confusions cumulées, 21/50 par exemple entre /s/ et /ch/, 12/50 entre /s/ et /z/ (Figure 17). Les
pointillés indiquent qu’aucune confusion n’a été signalée.

Figure 17 : représentation des consonnes et du nombre de confusion sur un corpus de 50 enfants [Aicart-de Falco 1987]

Dans [Hilaire-Debove 2004], le groupe intermédiaire G2 a un taux d’erreur sur les constrictives voisées
supérieur à 50% à 2 ans ½. Le mémoire de [Gaborieau & Sagaspe 2011] sur une population de 30
enfants de 3 ans indique 18% d’erreur sur les fricatives en position finale analysées dans les mots tasse
(/s/), chaise, cerise (/z/), et 40% sur les fricatives en position finale dans vache (/ch/), singe et manège
(/j/). Dans cette étude, nous n’avons pas pu séparer les processus voisés et non voisés, bien que l’on
puisse supposer que les fricatives voisées sont les plus difficiles à produire, donc sujettes à un taux
d’erreur plus élevé.

Nos propres études statistiques ont montré un taux d’erreur très élevé à 4 ans, supérieur à 20 % à 5
ans. A 6 ans cependant, et quel que soit la phrase analysée, le taux d’erreur passe significativement en
dessous du seuil de 15%. On peut donc considérer le processus de constrictives voisées comme l’un
des processus les plus difficiles à maîtriser. Nous fixons donc l’âge de maîtrise à 6 ans.
Figure 18 : Positionnement des consonnes du processus constrictives voisées par rapport à la position de la langue, et
spectre comparé /s/ et /z/

Les voyelles /v,z,j/ sont localisées en position labiodentale comme leurs correspondantes non voisées
/f,s,ch/ avec une enveloppe spectrale aux caractéristiques proches, mais significativement atténuées,
et l’apparition du voisement sous forme d’une pic à basse fréquence, comme le montre la comparaison
/s-z/ de la figure 18 pour un garçon de 9 ans normo-phonique.

Ptk – Plosives non voisées


Certains auteurs considèrent le /p-t-k/ comme le miroir du triangle vocalique, version consonnes. On
peut en effet remarquer que le /p/ est la plosive pour laquelle la langue en position avancée, et que le
/k/ correspond à la langue en position reculée, tandis que le /t/ se situe en position intermédiaire
(Figure 19). Les plosives /p,t,k/ utilisées dans les épreuves de diadococinésie [Sicard 2020c] nécessitent
donc un effort articulatoire important.

Figure 19 : position des articulateurs pour /p,t,k/ selon le point de contact

Les consonnes occlusives, en particulier /p,t,k/, sont attestées dans les premières productions verbales
de l’enfant [Rose 2007] et sont considérées comme maîtrisées à 3 ans par [MacLeod 2011]. L’étude de
[Vinter 2001] sur les habiletés phonologiques de 16 enfants de deux ans (23-25 mois) indique une
maîtrise de /p,t,k/ en position initiale dans les mots, du /p,t/ à 70% et du /k/ à 50% en position finale.

Nous n’avons identifié aucune erreur sur les 3 phrases types de nos propres études statistiques, ce qui
correspond à une maîtrise des processus à 3 ans, pour différentes positions de la plosive dans le mot.
En effet, le /p/ est en position intermédiaire dans /Tralipau/, le /k/ en position initiale dans /connais/
et intermédiaire dans /est-ce-que/écureuil/, enfin le /t/ est en position initiale dans /tu/. L’étude de
[Hilaire-Debove 2004] portant sur 13 enfants de 2 ans ½ montre un taux d’acquisition des plosives
sourdes de 80% à 95% selon les sous-groupes, ce qui va aussi dans le sens d’un repère d’âge
d’acquisition à 3 ans pour ce processus.

Bdg – Plosives non voisées


Le trio /b,d,g/ est la version voisée de /p,t,k/, avec une occurrence trois fois plus faible (Figure 20). On
constate un décalage significatif dans l’âge de maîtrise de ce processus vers 5 ans d’après nos études
statistiques. Par rapport aux repères en langue Anglaise de la figure 2, on identifie aussi une différence
notable : ce processus est maîtrisé à 3 ans ½, le plus tardif étant le /g/. Le mémoire de [Gaborieau &
Sagaspe 2011] sur les consonnes finales à 3 ans indique un taux d’erreur tout juste supérieur à 15%.
Concernant [Aicart-de Falco 1987], on ne constate aucune erreur sur le /b/, très peu sur le /d/, mais
quelques erreurs sur les oppositions /k-g/ jusqu’à 4 ans. Nos études statistiques pointent un souci
majeur sur le /b/ de /bonjour/ substitué en /p/ ou altéré pour 2/3 des enfants de 4 ans. C’est pourquoi
nous plaçons l’âge de maîtrise du processus à 5 ans.

Figure 20 : position des articulateurs pour /b,d,g/ selon le point de contact

Cnas - Consonnes Nasales


Nous regroupons les consonnes nasales /m/, /n/ et /gn/ dans un seul processus, correspondant à un
position espace articulatoire restreint (Figure 21). La position basse du voile du palais est considérée
comme une position de repos, ouvrant donc la possibilité d’un flux d’air par le nez, ce qui permet la
production des consonnes nasales. Dans [Stefanuto 1999], il est noté qu’un léger abaissement de la
luette permet à la fois la production de consonnes nasales et de voyelles orales, ce qui peut expliquer
pourquoi les très jeunes enfants sont capables de prononcer /mama/ (/m/ consonne nasale, /a/
voyelle orale) sans action volontaire du voile du palais.

Figure 21 : Consonnes nasales /m/, /n/ et /gn/ selon la position de la langue

L’étude de [Hilaire-Debove 2004] indique un taux d’erreur supérieur à 25% à 2 ans ½, tandis que
[MacLeod 2014] considère le processus comme maîtrisé pour le /m/n/ au même âge, mais
significativement plus tardif pour le /gn/ (4 ans). Nous notons dans nos propres études un taux très
faible d’erreur quel que soit l’âge sur /m/ et /n/ sur deux des trois phrases type. Nous fixons l’âge de
maîtrise des consonnes nasales à 3 ans, dans la mesure où l’occurrence du /gn/ (0.1%) est négligeable
devant celle du /m/ (3.4%) et /n/ (2.9%).
Vnas - Voyelles nasales
Les voyelles nasales sont en général absentes dans les premiers mots que prononce le très jeune
enfant : il dira plus /no/ que /non/, ou /mama/ plutôt que /maman/. Cependant, les consonnes nasales
existent dans presque toutes les langues du monde et appartiennent aux premières acquisitions
linguistiques de l'enfant. Ce sont des phonèmes qui requièrent peu d’effort articulatoire et peuvent
être prononcés avec un tonus faible.

Dans une étude portant sur 75 enfants de 3 à 6 ans, [Aicart-de Falco 1987] relève 25% de dénasalisation
du /an/ en /a/ entre 5 et 6 ans, ce qui constitue de loin la principale cause d’imprécision de l’ensemble
des voyelles. La maîtrise du processus des voyelles orales/nasales ne survient qu'après celle de toutes
les autres voyelles, d’après [Jakobson 1980]. La difficulté de coordination et de réactivité du voile du
palais est d’autant moins prise en compte que le voile est peu exploré et quasi invisible. On peut aussi
noter une rhinolalie ouverte dans les enfants ayant des déficits auditifs sévères et une rhinolalie plus
aléatoire dans le cas de dyspraxies verbales ou apraxies de la parole [Rousteau 2017].

D’autre part, la faible fréquence d'apparition des voyelles nasales (6% cumulés, au lieu de 17% par
exemple pour les voyelles orales correspondantes /a/è/au/) peuvent expliquer leur maîtrise tardive.
En termes fréquentiels, la position du /an/ dans l’espace vocalique F1/F2 est assez excentrée pour
femmes et enfants, comme l’indique la figure 22, extraite de l’analyse des profils types des oppositions
orales/nasales [Sicard 2021].

Figure 22 : Voyelles nasales /an, in, on/ dans l’espace vocalique F1/F2, ainsi que leurs oppositions orales /a,è,i/.

Nos propres études statistiques en lien avec le /on/ de /Bonjour/, le /in/ de /Glochin/ et le /an/ de
/Framboise/ montrent un taux d’erreur supérieur à 50% à 4 ans, environ 15% à 5 ans puis négligeable
à 6 ans et plus. Nous situons donc l’âge de maitrise du processus des voyelles nasales /au,in,on/ à 6
ans.

euéè - Variantes du /e/


Nous partons de l’hypothèse que l’enfant doit faire un effort de positionnement des articulateurs pour
passer du /e/ (position de repos) à /eu/, /è/ ou /é/, afin de produire un décalage fréquentiel suffisant
des formants F1 et F2 comme illustré figure 23. Si l’une des cibles est atteinte, le processus est validé.
Dans les phrases types, nous disposons du /eu/ dans /Monsieur/ et du /è/ dans /Est-ce que/ et
/Connais/.
Figure 23 : Voyelles /eu/, /é/ et /è/ positionnées dans le triangle vocalique, valeurs de référence pour un enfant de 6 ans

L’étude sur les voyelles centrales du système vocalique de [Aicart-de Falco 1987] ne montre pas de
difficulté de discernement des variantes du /e/, mais met en évidence des confusions /i-u/ et /u-ou/.
Nous fixons l’âge d’acquisition de ce processus à 3 ans, n’observant pas d’erreur significative à cet âge.

l - Consonne liquide
La consonne liquide /l/ est présentée comme l’un processus les moins maîtrisés dans l’étude de
[Hilaire-Debove 2004] (plus de 60% d’erreur à 2 ans ½ ). Cette consonne est considérée comme acquise
à 2 ans seulement en position initiale par [Vinter 2001]. La production du /l/ requiert une forme de
langue spécifique (sans relèvement des bords latéraux) et une dissociation des articulateurs
langue/mâchoire. C’est une occlusion douce sans mise en pression mais avec voisement. On peut donc
la considérer comme un processus combiné donc plus complexe à réaliser qu’un processus dit simple
comme son homologue /t/.

Dans le tableau des repères en langue Anglaise de la Figure 2, une distinction avait été faite entre /l-/
initial (5 ans, soit 3 ans de différence avec les résultats précédents) et /-l/ final (6 ans). Enfin le tableau
3 indique un âge de maîtrise de 5 ans. Nos propres analyses statistiques indiquent encore 30 % d’erreur
à 4 ans, mais plus aucune à 5 ans, d’après l’analyse du /l/ contenu dans /tralipau/, /Glochin/, ou /Vole/,
couvrant différentes positions dans le mot. Nous fixons donc l’âge de maîtrise de ce processus à 5 ans.

CC - Cluster de consonnes
Les très jeunes enfants réduisent en général les clusters de consonnes à une seule consonne, en raison
de la difficulté inhérente à synchroniser les traits distinctifs qui peuvent être complètement différents
entre les 2 consonnes. Progressivement, les mécanismes se mettent en place pour produire une
succession de consonnes, mais l’âge de maîtrise s’avère très variable. Dans [Vinter 2001], moins de
50% des enfants de 2 ans prononce les clusters de consonnes.

L’occurrence des clusters dans les mots prononcés par les jeunes enfants a été évaluée d’après
l’analyse phonétique des mots correspondants à 1600 images pour enfants de la médiathèque de
DIADOLAB. Il ressort que les trois clusters les plus fréquents sont le /tr/, /br/ et /fr/ (table 4). La
substitution /tr/ ->/kr/ est la plus notable car facilement détectable à l’oreille seule et parce que
soumise aux lois de facilitation articulatoire. Le /r/ étant très postérieur, il s’avère plus difficile de
l’enchainer avec le phonème/t/ comme dans /tr/, qu’avec le /k/ comme dans /kr/.
CLUSTER EXEMPLE OCCURRENCE (%) PHRASE TYPE
/TR/ Citron 6,5 /Tralipau/
/BR/ Nombre 1,9
/ST/ Stylo 1,8
/KR/ Ecrou 1,6
/BL/ Blé 1,5
/DR/ Drap 1,5
/GR/ Grotte 1,4
/GL/ Glace 1,3 /Glochin/
/PL/ Pluie 1,3
/FR/ Framboise 1,2 /Framboise/

Table 4 : Clusters de consonnes les plus fréquents dans la base d’images pour enfants de 1600 mots de DIADOLAB

L’étude de [MacLeod 2001] portant sur différents clusters de consonnes indique, pour un critère de
taux de réussite > 85%, un âge de maîtrise allant de 3 ans comme pour le /bl/ ou le /fl/ jusqu’à 5 ans
pour le /br/, voire 6 ans pour /gl/ (tableau 5). Le /tr/ de /Tralipau/ est considéré comme maîtrisé à 4
ans, le /fr/ de /Framboise/ à 4 ans ½, et le /gl/ de /Glochin/ à 6 ans, ce dernier ayant une occurrence
très faible.
CLUSTER CC/TAUX DE PCC <50% PCC DE 50 À 85% PCC >85%
REUSSITE
/BL/ <2 2 3
/FL/ <2 2 3
/FR/ <3 3 4-5
/KR/ <2 2-3 4
/TR/ <3 3 4
/BR/ <4 4 5
/GL/ <4 4-5 6
Table 5 : Pourcentage de clusters corrects (PCC) en fonction de l’âge d’après [McLeod 2011]

Dans son étude sur les séquences de consonnes en position initiale de mot produites par 50 enfants
francophones de 4 à 5 ans ayant un trouble phonologique, [Rvachew 2014] met aussi en évidence une
disparité forte dans l’acquisition des clusters, /cl/, /gl/, /bl/ et /fl/ obtenant des scores élevés de
réussite, /tr/ de /traineau/, et /fr/ de /framboise/ des scores faibles et /sp/-/ct/-/cl/ de /spectacle/ les
scores de loin les plus faibles. Au final, nous avons fixé l’âge de ce processus à 5 ans.

VV - Diphtongue
L’étude des clusters de voyelles (VV) est moins riche dans la littérature scientifique que celle des
clusters de consonnes, ce qui fait que nous disposons de peu de repères d’âge. Dans [Kehoe 2008],
l’étude longitudinale sur 5 enfants hispanophones ne montre pas de maîtrise du processus à 3 ans,
avec des scores de pourcentage correct de prononciation de l’ordre de 75%.

Les voyelles tardives étant les nasales, on peut s’attendre par voie de conséquence à un délai dans
l’acquisition des clusters incluant ces mêmes nasales. Nous n’avons testé dans nos études statistiques
que le /ieu/ de /Monsieur/, le /oua/ de /Framboise/ et le/eui/ de /Ecureuil/. Aucune des 3 diphtongues
ne contient de voyelle nasale. Nous observons une forte tendance à la simplification du /ieu/ en /eu/
jusqu’à 5 ans inclus. A partir de 6 ans, la diphtongue est bien distincte sur les 3 phrases. On peut donc
considérer un âge de maîtrise du processus VV à 6 ans.
r - Consonne roulée
L’âge de maîtrise de la consonne /r/ est fixé à 4 ans dans [MacLeod 2001], tandis que [Vinter 2001]
signale une disparité entre le /r-/ en position initiale, acquis par moins de 50% des enfants de 2 ans, et
le /-r/ en position finale acquis par 70% des enfants. L’étude sur les enfants d’âge moyen 2 ans ½ de
[Hilaire-Debove 2004] constate 40% de /r/ corrects pour le groupe intermédiaire. Nos propres études
indiquent quelques erreurs à 3 ans, puis parfois une imprécision au-delà, mais qui reste en-dessous du
seuil de 15% d’erreur résiduelle. Nous fixons donc l’âge de maîtrise du processus à 4 ans.

Age de maitrise des processus


Nous sommes maintenant en mesure de dresser la liste des processus acquis en fonction de l’âge,
selon un critère de plus de 85% de taux de réussite (tableau 6), d’après les analyses bibliographiques
et statistiques exposées dans les paragraphes précédents.

AGE SIGLE DESCRIPTION

3 ans ptk Occlusive non voisée /p,t ou k/

euéè Voyelle /eu,é ou è/

cnas Consonne nasale /n,m ou gn/

4 ans fsch Constrictive non voisée /f,s ou ch/

r Consonne roulée /r/

aiou Extrêmes du triangle vocalique /a,i,ou/

5 ans mns Extrêmes des consonnes /m-s/ ou /n-s/

bdg Occlusive voisée /b,d ou g/

l Consonne liquide /l/

CC Cluster de consonnes (CC) /tr, gl, fr../

6 ans vzj Constrictive voisée /v,z ou j/

vnas Voyelle nasale /an,in ou on/

VV Diphtongue (VV) /ieu, eui, oua../


Table 6 : Age de maîtrise des processus en fonction de l’âge

Evolution des processus de parole au cours de la prise en charge


Sur la base d’un enregistrement d’une phrase couvrant la majorité des processus de parole décrits plus
haut, telle que /Bonjour Monsieur Tralipau/, nous pouvons, avec le logiciel Diadolab (module
phonologie) segmenter les phonèmes perçus et les comparer avec les phonèmes attendus. Il est alors
possible de dresser la liste des processus acquis et non acquis, en insistant principalement sur les
processus non acquis pour lesquels le retard par rapport à l’âge du patient est considéré comme
significatif. De plus, nous pouvons comparer la liste initiale des processus défaillants avec celle établie
sur la même épreuve de bilan, suite à la prise en charge orthophonique. Le protocole d’enregistrement,
notamment les consignes, l’écoute d’un modèle et la méthodologie de segmentation doivent être
rigoureusement les mêmes, afin de situer de manière fiable les éventuels progrès du patient.
Figure 24 : Processus acquis et non acquis, avant et après prise en charge orthophonique (Cas SM010, garçon de 4 ans)

Figure 25 : Processus acquis et non acquis, avant et après prise en charge orthophonique (Cas SM011, garçon de 5 ans)

Dans l’illustration de la figure 24, l’analyse des processus d’un patient de 4 ans avant et après prise en
charge montre une progression du score qui passe au-dessus de la norme (20/30 à 4 ans), avec 3
processus non validés pour l’âge : les extrêmes du triangle vocalique (le /ou/ est perçu en /o/) les
constrictives non voisées (/s/ perçu en /z/) et la consonne /r/ omise. Les items en rouge correspondent
à des processus qui devraient être acquis pour l’âge, tandis que les processus en gris sont supposés
acquis à un âge plus tardif.

Discussion
L’approche par évaluation des phonèmes corrects et du score d’articulation associé reste intéressante,
car complémentaire de l’approche par processus. Dans l’exemple de la figure 25 concernant un enfant
de 5 ans, on note que la plupart des processus sont couverts, en revanche le logatome /Tralipau/ est
complètement déformé et désynchronisé, ce que ne permet pas de voir l’approche par processus. Le
score d’articulation reflète beaucoup mieux ici la resynchronisation des syllabes, qui se traduit par une
élévation significative des performances (15/30 à 23/30, soit 8 points), le score s’approchant de la
norme pour l’âge.

Cette illustration claire des processus réalisés permet de rendre l’évaluation positive puisque
l’attention est ici portée sur les processus réalisés avec un système de priorité. Le nombre d’astérisques
permettant de cibler les processus à forte occurrence qui ont l’impact le plus fort sur l’intelligibilité.
L’orthophoniste peut ainsi être guidée dans le choix des axes thérapeutiques.

L’utilisation des repères d’acquisition et de maîtrise des phonèmes et des processus de parole ne doit
pas être faite de manière trop rigide. Ce n’est pas parce que l’on dépasse un peu la « norme » que l’on
doit s’alerter et imposer à l’enfant une prise en soin. Ce dernier peut avoir le bénéfice du doute si le
décalage est peu important. Une évaluation de contrôle quelques mois après peut permettre une
mesure des progrès qui, dans une grande majorité des cas, rassureront les parents et l’orthophoniste.
Les repères ont beaucoup évolué au cours des années, et il ne semble pas possible aujourd’hui de les
considérer comme des limites strictes, de par la variabilité des méthodes qui ont conduit à
l’élaboration des valeurs, les biais de protocole ou encore la faible force statistique de certaines
études, portant sur un nombre d’enfants trop restreint.

Les critères d’inclusion ou d’exclusion de certains patients sont aussi assez fluctuants selon les études,
quand ce ne sont pas les seuils eux-mêmes (75, 85, 90 ou 100% de réussite). Certaines analyses se
basent sur l’enregistrement audio du corpus de mots, de phrases ou de tâches d’interprétation
d’image, suivi d’une segmentation puis d’une écoute sélective avec un jury d’écoute, ce qui prend
beaucoup de temps et de ressources mais permet d’avoir une certaine qualité et reproductibilité dans
les résultats. D’autres études se basent simplement sur l’avis d’un seul clinicien sur un mot prononcé
en direct, sans réécoute sélective ni analyse par segmentation spectrale, ce qui rend les résultats plus
variables, et les statistiques moins exploitables.

D’autres biais peuvent être cités : la régionalisation, si une part trop importante des enfants inclus
dans l’étude proviennent d’une région donnée, ou encore la variabilité de l’expertise en matière de
segmentation spectrale [Menin-Sicard 2021c]. Enfin, la force statistique des différentes études
n’excède pas une centaine d’enfants, ce qui correspond à 10-20 enfants par tranches d’âge, ce qui
demeure insuffisant pour étayer des valeurs référentielles.

Nous pensons cependant que malgré les réserves mentionnées, les données présentées dans ce travail
de synthèse pourront donner des repères raisonnablement fiables et utiles aux orthophonistes
cliniciennes dans le cadre de la prise en soin des patients ayant des retards et troubles du langage.

Conclusion
Nous avons synthétisé dans cet article différentes données illustrant l’acquisition des phonèmes de la
langue Anglaise et de la langue Française en fonction de l’âge, en passant en revue une dizaine de
sources pertinentes, que nous avons complété par le résultat d’études statistiques portant sur plus de
200 phrases types prononcées par plus d’une centaine d’enfants de 3 à 8 ans. Nous avons pu
confronter les différentes observations et proposer un tableau de repère d’âge d’acquisition des
voyelles et des consonnes, ainsi que les clusters de consonnes et les diphtongues. Chaque phonème a
aussi été décrit sous forme de traits distinctifs, que nous avons ensuite regroupés en processus de
parole, en mettant en avant leur intérêt potentiel pour la prise en charge orthophonique des troubles
de la parole. Pour chaque processus, nous avons regroupé les observations pertinentes de la littérature
scientifique francophone, que nous avons recoupées avec nos propres observations sur l’analyse
statistique des phrases type. Enfin, l’évolution des processus de parole au cours de la prise en charge
orthophonique a été illustrée au travers de deux exemples d’enfants avec troubles de la parole.

Remerciements
Nous saluons les efforts de mise en archive ouvertes d’un très grand nombre de résultats scientifiques,
en particulier dans le domaine de la parole, ce qui permet une diffusion très large, simple et sans droit
d’accès, autorisant de ce fait des analyses comparatives et méta-analyses qui accélèrent leur mise en
application clinique.

Nous remercions particulièrement les orthophonistes de l’équipe ERU 46 du laboratoire LURCO de


l’UNADREO pour la construction d’une base de données de parole pathologique et pour les échanges
en lien avec la pratique clinique, notamment dans le domaine de la dysarthrie, du bégaiement ou des
retards et troubles de la parole chez l’enfant. Merci à Marie DUREL, Diana SAADOUN, Cécile ROIRON
et Elisabeth MAUGER pour leur aide concernant la parole de très jeunes enfants. Nous remercions
également Géraldine HILAIRE-DEBOVE pour ses suggestions et la mise à disposition de ressources
scientifiques.

Enfin, nous remercions l’ensemble des orthophonistes, étudiants et chercheurs qui nous ont accordé
leur confiance en utilisant nos méthodologies, approches et outils dans le cadre de leur pratique
clinique ou de leurs travaux scientifiques.

A propos des auteurs


Etienne SICARD est professeur à Anne MENIN-SICARD est
l’INSA Toulouse en électronique, orthophoniste et titulaire d’un
informatique et traitement du master recherche en Sciences du
signal. Il est directeur de recherches langage de l’université de
de l’équipe ERU 46 sur la parole Grenoble. Elle a exercé en libéral à
pathologique au Laboratoire LURCO Toulouse de 1994 à 2015. Anne
de l’UNADREO. Il a été chercheur MENIN-SICARD est co-auteur des
associé à l’IRIT dans le cadre du logiciels VOCALAB et DIADOLAB.
projet ANR C2SI sur la voix de Dans le cadre de AMS Formation,
patient ayant eu un cancer ORL, et ANR Voice4PD sur le elle organise et anime des formations aux orthophonistes
diagnostic différentiel des Syndromes Parkinsoniens. sur le bilan et la prise en charge de la voix et parole
Etienne SICARD est co-auteur des logiciels VOCALAB et pathologique. Elle a fondé en 2019 un organisme de
DIADOLAB pour le bilan et la rééducation orthophonique formation en ligne personnalisée à destination des
de la voix et la parole. Il a co-écrit une vingtaine orthophonistes. Chercheuse associée à l’ERU 46 du
d’ouvrages et plus de 250 publications scientifiques, dont LURCO, elle développe des outils de mesures objectives et
50 sur l’analyse de la voix et 50 sur l’analyse de la parole, de rééducation de la parole en lien avec le logiciel
les plus significatives étant en archives ouvertes. DIADOLAB. Elle est co-auteur d’un ouvrage sur l’évaluation
Site : www.etienne-sicard.fr objective de la voix (DeBoeck, 2017) ainsi que plus d’une
Email : etienne.sicard@insa-toulouse.fr centaine de publications dans le domaine de la voix et de
la parole pathologique.
Site : https://www.formationsvoixparole.fr
Email : anne.sicard2@orange.fr

Références
[Aicart-de Falco 1987] Aicart-de Falco, S., & Vion, M. (1987). La mise en place du système
phonologique du français chez des enfants entre trois et six ans: une étude de la production. Cahiers
de Psychologie Cognitive-Current Psychology of Cognition, 7, 247-266.

[Bardelang 2020] Bardelang T. (2020), L’apport d’une phrase supplémentaire au protocole de


DIADOLAB3. Mémoire d’orthophonie. Université de Lyon.

[Bernhardt 1992] Bernhardt, B., & Gilbert, J. (1992). Applying linguistic theory to speech–language
pathology: the case for nonlinear phonology. Clinical Linguistics & Phonetics, 6(1-2), 123-145.

[Brosseau-Lapré 2018] Brosseau-Lapré, et al. (2018). Une vue d’ensemble: les données probantes sur
le développement phonologique des enfants francophones canadiens. Revue Canadienne
D’orthophonie Et D’audiologie, 42, 1-19.
[Brumbaugh 2013] Brumbaugh, K. M., & Smit, A. B. (2013). Treating children ages 3–6 who have
speech sound disorder: A survey.Language, Speech, and Hearing Services in Schools. Vol. 44, pp. 306–
319

[Chomsky & Halle 1968] Chomsky, N., & Halle, M. (1968). The sound pattern of English.

[De Boysson-Bardies 1989] De Boysson-Bardies, B., Hallé, P., Sagart, L., & Durand, C. (1989). A
crosslinguistic investigation of vowel formants in babbling. Journal of child language, 16(1), 1-17.

[De Boysson-Bardies 2007] De Boysson-Bardies, B. (2007). Comment la parole vient à l'enfant. Revue
française de psychanalyse, 71(5), 1473-1480.

[Fougeron 2016] Fougeron, C., et al. (2016). Chapitre 14. MonPaGe: un protocole informatisé
d’évaluation de la parole pathologique en langue française. In Joyeux N. & Topouzkhanian S.
Orthophonie et technologies innovantes, 2016, https://hal.archives-ouvertes.fr/hal-02437340

[Gaborieau & Sagaspe 2011] Gaborieau, F. Sagaspe, P. (2011). Etude de la production des consonnes
finales chez les enfants francophones de 3 ans. Mémoire d'orthophonie Université de Lyon.

[Grenier 2020] Grenier C. (2020), Etude comparative de tests phonologiques existants et du


protocole d'analyse objective de la parole avec Diadolab : intérêt et limites d'un test court et des
mesures objectives d'intelligibilité et de fluence. Mémoire de Master d’orthophonie. Université de
Toulouse.

[Grunwell 1981] Grunwell, P. (1981). The development of phonology. First Language , iii, 161-191.

[Grunwell 1988] Grunwell, P. (1988). Phonological assessment, evaluation and explanation of speech
disorders in children. Clinical linguistics & phonetics, 2(3), 221-252.

[Jakobson 1980] Jakobson, R. (1980). Langage enfantin et aphasie (Vol. 88). Flammarion.

[Kehoe 2008] Kehoe, M., Hilaire-Debove, G., Demuth, K., & Lleó, C. (2008). The structure of branching
onsets and rising diphthongs: Evidence from the acquisition of French and Spanish. Language
Acquisition, 15(1), 5-57.

[MacLeod 2011] MacLeod, A. A., Sutton, A., Trudeau, N., & Thordardottir, E. (2011). The acquisition
of consonants in Québécois French: A cross-sectional study of pre-school aged children. International
journal of speech-language pathology, 13(2), 93-109.

[MacLeod 2014] MacLeod, A. (2014). Évaluation sommaire de la phonologie chez les enfants d’âge
préscolaire. Montréal, QC: Université de Montréal.

[McLeod 2001] McLeod, S., Van Doorn, J., & Reed, V. A. (2001). Normal acquisition of consonant
clusters. American Journal of Speech-Language Pathology, Vol. 10, pp. 99–110

[McLeod 2018] McLeod, S., & Crowe, K. (2018). Children's consonant acquisition in 27 languages: A
cross-linguistic review. American journal of speech-language pathology, 27(4), 1546-1571.

[Menin-Sicard 2019] Menin-Sicard, A., Sicard, E. (2019). Méthodologie d'évaluation objective de la


phonologie, de la fluence et de la prosodie - Vers un bilan rapide à destination des orthophonistes.
Journées de Phonétique Clinique JPC 2019, Mai 2019, Mons, Belgique. https://hal.archives-
ouvertes.fr/hal-02127039

[Menin-Sicard 2019b] Menin-Sicard, A, Sicard. E. (2019) DIADOLAB 3 - Logiciel d’évaluation et de


rééducation de la parole - Manuel d'utilisation. https://hal.archivesouvertes.fr/hal-02073314
[Menin-Sicard 2019c] Menin-Sicard, A., Sicard, E., Grenier, C., Bardelang, T., Michel, S. (2021).
Méthodologie de la segmentation pour l'évaluation objective des compétences phonologiques avec
DIADOLAB3. Rapport de recherches LURCO/UNADREO, INSA Toulouse. https://hal.archives-
ouvertes.fr/hal-03149560

[Morley 1969] Morley, M. E., & Fox, J. (1969). Disorders of articulation: Theory and therapy. British
Journal of Disorders of Communication, 4(2), 151-165.

[Rondal 2000] Rondal, J. A., & Seron, X. (Eds.). (2000). Troubles du langage: bases théoriques,
diagnostic et rééducation. Editions Mardaga.

[Rose 2007] Rose, Y., & Wauquier-Gravelines, S. (2007). French speech acquisition. The international
guide to speech acquisition, 364-384.

[Rousteau 2017] Rousteau, G., Talmant, J. C., & Talmant, J. C. (2017). L’évaluation des insuffisances
vélo-pharyngées par l’aérophonoscope: essai de classification et incidences thérapeutiques. Rev
Laryngol Otol Rhinol, 138(4), 143-156

[Rvachew 2014] Rvachew, S., Leroux, É., & Brosseau-Lapré, F. (2014). Séquences de consonnes en
position initiale de mot produites par des enfants francophones d’âge préscolaire ayant un trouble
phonologique. CANADIAN JOURNAL OF SPEECH-LANGUAGE PATHOLOGY AND AUDIOLOGY, 253.

[Rvachew 2015] Rvachew, S., & Brosseau-Lapré, F. (2015). A randomized trial of 12-week
interventions for the treatment of developmental phonological disorder in Francophone children.
American Journal of Speech-Language Pathology, 24(4), 637-658

[Sander 1972] Sander, E. (1972). When are speech sounds learned? Journal of Speech and Hearing
Disorders, 37, 55-63.

[Shriberg 1982] Shriberg, L. D., & Kwiatkowski, J. (1982). Phonological disorders III: A procedure for
assessing severity of involvement. Journal of speech and Hearing Disorders, 47(3), 256-270

[Sicard 2017] Sicard, E., Mauclair, J., & Woisard, V. (2017, June). Etude de paramètres acoustiques
des voix de patients traités pour un cancer ORL dans le cadre du projet C2SI. In 7èmes Journées de
Phonétique Clinique, Paris. https://hal.archives-ouvertes.fr/hal-01510418

[Sicard 2019] Sicard, E., Menin–Sicard, A. (2019) Analyse de la qualité des phrases pour un bilan
objectif de la parole. [Rapport de recherche] INSA Toulouse. 2019. https://hal.archives-
ouvertes.fr/hal-02389764

[Sicard 2020] Sicard, E., & Menin-Sicard, A. (2020). Le triangle vocalique et son application en
contexte orthophonique. Rapport de recherches en archives ouvertes. INSA Toulouse,
LURCO/UNADREO. https://hal.archives-ouvertes.fr/hal-02504513/

[Sicard 2020b] Sicard, E., & Menin-Sicard, A. (2020). Analyse d'une phrase type dans le cadre du bilan
orthophonique de la parole. Rapport de recherches en archives ouvertes. INSA Toulouse,
LURCO/UNADREO. https://hal.archives-ouvertes.fr/hal-02568392

[Sicard 2020c] Sicard, E., & Menin-Sicard, A. (2020). La diadococinésie et son application en
orthophonique clinique. Rapport de recherches en archives ouvertes. INSA Toulouse,
LURCO/UNADREO, https://hal.archives-ouvertes.fr/hal-02512856
[Sicard 2021] Sicard, E., Menin-Sicard, A., Rousteau, G., Michel, S. (2021) Profils types des oppositions
orales-nasales dans le contexte de la rééducation orthophonique. Rapport de recherche
Lurco/UNADREO, INSA Toulouse. https://hal.archives-ouvertes.fr/hal-03131029

[Sicard 2022] Sicard, E., & Menin-Sicard, A. (2022). DIADOLAB 3.5. Manuel d’utilisation.
Gerip/Humensis.

[Smit 1990] Smit, A., Hand, L., Freilinger, J., Bernthal, J., & Bird, A. (1990). The Iowa articulation
norms project and its Nebraska replication. Journal of Speech and Hearing Disorders, 55, 779-79

[Storkel 2022] Storkel, H. L. (2022). Minimal, Maximal, or Multiple: Which Contrastive Intervention
Approach to Use With Children With Speech Sound Disorders?. Language, Speech, and Hearing
Services in Schools, 1-14.

[VCH 2011] Vancouver Health Institute https://vch.eduhealth.ca/PDFs/FM/FM.240.5.S644.pdf

[Vinter 2001] Vinter, S. (2001). Les habiletés phonologiques chez l'enfant de deux ans. Glossa, 4-19.

[Stefanuto 1999] Stefanuto, M., & Vallée, N. (1999, August). Consonant systems: From universal
trends to ontogenesis. In ICPhS, San Francisco.

[Williamson 2022] Williamson, G. (2022) SLT Info https://www.sltinfo.com/ess101-age-of-acquisition-


of-speech-sounds/

[Wioland 1991] WIOLAND, F., (1991). Prononcer les mots du français. Hachette

Vous aimerez peut-être aussi