INTRODUCTION A LA METHODE VERBO-TONALE DE CORRECTION PHONETIQUE – Raymond Renard 1. INTRODUCTION Le système phonologique d’une langue comporte généralement deux ou trois douzaines d’unités significatives dénommées phonèmes. Dort peu de chose au regard du système mortpho-syntaxique ou du corpus lexical. Un pourcentage relativement faible de cet ensemble est nécessaire au maniement courant de cette langue, lequel suppose cependant l’assimilation de tout le système phonologique. La méthode d’intégration phonétique dérive du système verbo-tonal de rééducation des troubles de l’audition. Cette méthode, mise au point à l’Institut Zagreb par son directeur, Petar Guberina, est partie intégrante de nombreux cours de langues relevant de la méthodologie « structuro-globale audio-visuelle » (SGAV), conçus par des équipes de pédagogues et de chercheurs sous la direction de P. Guberina et P. Rivenc. Le problème est celui d’enseigner la prononciation d’une langue nouvelle à des personnes qui disposent déjà d’un outil de communication orale : leur langue maternelle. 2. PERCEPTION ET (RE)PRODUCTION 2.1. Perception de la parole La méthode verbo-tonale plonge ses racines dans la psycholinguistique. Le problème posé est celui de la perception auditive. Celle-ci joue un rôle essentiel : il est reconnu que l’apprentissage du langage se réalise chez l’enfant par approximations articulatoires successives sous le contrôle de l’audition. Audition et phonation sont indissolublement liées. Les maxima d’énergie sont appelés formants. La variété des sons de parole qui parviennent quotidiennement à l’oreille est donc infinie. Il s’en faut cependant, et de beaucoup, que l’oreille perçoive toutes ces différences. « L’enfant passe, peu à peu, du soliloque spontané et sans but à un semblant de conversation. Cherchant à se conformer à l’entourage, il apprend à reconnaître l’identité du phénomène phonique qu’il entend et qu’il émet, qu’il garde dans sa mémoire et qu’il reproduit à son gré. L’enfant le distingue des autres phénomènes phoniques entendus, retenus et répétés, et cette distinction, sentie comme une valeur intersubjective et constante, tend vers une signification. Au désir de communiquer avec autrui vient s’ajouter la faculté de lui communiquer quelque chose » R. Jakobson. Chaque langue possède sa propre combinatoire : l’anglais et le français possèdent en commun les phonèmes /s/, / /, / /, /z/, /t/, /d/, /r/, mais normalement on ne trouve pas /sr/ dans un mot anglais. De même, dans les mots français, on ne trouve pas les groupes /t / ou /d /. La fixation du système phonologique ne concerne pas que les phonèmes mais aussi leur combinatoire. Celle-ci est solidement ancrée chez le jeune enfant. Dès l’âge de six ans, même les mots qu’il invente sont conformes aux règles séquentielles de son système linguistique. L’enfant apprend à parler essentiellement par audition et imitation. La répétition du phonème facilite l’apprentissage.
2.2. Le système (structuré et global) Tout système phonologique résulte de l’organisation de données selon un nombre d’unités phoniques (phonèmes). Ce nombre varie d’une langue à l’autre. Troubetzkoy a appelé le « crible phonologique » le conditionnement au système phonologique. Entendre un son du langage, ce n’est pas seulement le détecter, c’est l’identifier, le décoder, c’est le situer exactement dans le système auquel il appartient, c’est reconnaître sa fonction dans le système. De la détection au décodage, le son prend place dans un ensemble chargé de signification : il devient phonème. Il existe des zones d’interférences où les sons peuvent être confondus s’ils sont présentés isolément. Ainsi s’explique que nous ne puissions pas discriminer certains sons étrangers. Lorsqu’ils apprennent le français, les Anglais confondent [y] et [u], [ ] et [o]. Il arrive aussi que nous ne puissions discriminer des sons que cependant nous pouvons prononcer. Les Espagnols confondent [z] et [s], ils ne sont pas conscients de leur différence car ces variantes sonores n’ont en espagnol aucune valeur distinctive. De sorte que l’adulte qui écoute une langue étrangère n’en capte pas les différents sons comme le ferait un enfant, mais au travers d’un filtre, d’un « crible », conditionné par son propre système phonologique. 2.3. Le système de fautes Ainsi s’expliquent nos erreurs de prononciation lorsque nous voulons reproduire un message en langue étrangère. Nous le reproduisions mal parce que nous le percevons mal : cette mauvaise perception résulte d’une structuration des éléments informationnels inadéquate car dictée par des habitudes sélectives propres à la perception de notre langue maternelle. Etant donné que les deux langues (maternelle et étrangère) existent comme deux systèmes bien définis et séparés, de leur confrontation naît un autre système : le système de fautes. Dans la méthodologie verbo-tonale, l’action portera toujours en priorité sur le système plutôt que sur la « faute » isolée. 2.4. Complexité du phénomène de perception de la parole La perception de la parole résulte de la combinaison de facteurs multiples captés globalement. Ces facteurs sont les stimuli acoustiques comme la fréquence, l’amplitude, le temps, la structure formantique, d’autres facteurs tels la prosodie (intonation, rythme), extraauditifs comme le geste, la mimique, l’entourage, le contexte… 3. EXAMEN DE DIVERSES METHODES DE CORRECTION PHONETIQUE 3.1. La méthode articulatoire L’acte phonatoire implique une connaissance explicite de son fonctionnement. Perfectionnement au fil du temps d’instruments de visualisation ou de description des mouvements articulatoires. Ces procédés n’exclue pas de graves imprécisions. Le procédé devient presque impraticable lorsqu’il s’agit d’apprendre une langue dont le système phonologique est très éloigné de la langue maternelle.
La méthode articulatoire néglige le facteur auditif. Nous avons déjà dit que les Espagnols confondent [z] et [s], alors qu’ils savent les prononcer. Ces variantes sonores n’ayant aucune valeur distinctive en espagnol, ils ne sont pas conscients de leur différence. Il ne s’agit donc pas ici d’enseigner comment on produit un son donné différent d’un autre, mais comment on le distingue d’un autre. Le problème ne se situe pas au niveau de la production, mais à celui de la perception. Pour la motor theory, l’auditeur reproduit mentalement le son entendu et c’est dans la mesure où il réalise effectivement cette opération qu’il perçoit bien. La méthode articulatoire traditionnelle néglige les effets de la phonétique combinatoire. Alors que les sons s’influencent les uns les autres. De plus, elle ignore les phénomènes de compensation. En effet, des procédés articulatoires différents peuvent donner le même résultat acoustique. Enfin, elle néglige le facteur prosodique, qui est pourtant partie intégrante du langage. Un anglophone débutant dans l’apprentissage du français reproduira peut-être de façon plus satisfaisante le [y] dans « C’est ta voiture ? » (prononcé avec une intonation « montante ») que dans « Oui. C’est ma voiture » (prononcé avec une intonation « descendante »). On ne saurait assez insister sur le fait qu’un son du langage ne peut être parfaitement défini s’il n’est intégré dans la structure complexe qui le conditionne. Pour un étranger, un son isolé mal prononcé n’est pas un cas en soi – une sorte de cas pathologique – c’est en réalité l’illustration particulière d’habitudes linguistiques générales propres à une structure phonique donnée. En conclusion, la méthode articulatoire nuit à la spontanéité de l’expression par le fait qu’elle s’attache à l’élément isolé plutôt qu’à la structure. Elle prétend traiter au niveau conscient ce qui devrait s’organiser au niveau de l’inconscient. 3.2. Des machines plutôt que des hommes Les procédés basés sur l’audition de modèles (patterns) à partir de machines se sont développés dès l’invention du phonographe. Ces méthodes reconnaissent la primauté de l’audio-oral et par là même forcent les élèves à l’écoute attentive. Elles présentent des modèles valables de voix authentiques de native speakers. Cependant, l’apprentissage en cabine rend difficile l’évocation du contexte situationnel. 3.3. La méthode des oppositions phonologiques La méthode dite des oppositions phonologiques se fonde sur les conceptions de Bloomfield, Jakobson et Halle qui classaient les phonèmes en fonction des traits distinctifs permettant des oppositions de type binaire. La méthode des oppositions phonologiques néglige le facteur prosodique, dans la mesure même où elle poursuit un autre objectif, celui de permettre la production d’éléments isolés, alors que la parole est un continuum. De plus, elle néglige l’éventail des allophones, leur combinatoire distributionnelle, les effets séquentiels. L’erreur fondamentale de la méthodologie traditionnelle de correction phonétique, c’est de considérer la « faute » dans sa singularité. On offre des recettes pour corriger ou pour enseigner chacun des sons sans se rendre compte que ces sons appartiennent à un système riche d’une dynamique interne et qui peut réserver au professeur des surprises tant agréables
que désagréables : résurgence d’une erreur qu’on croyait corrigée ou facilitation imprévue d’un progrès déterminé. 4. UNE APPROCHE NOUVELLE : DE LA PATHOLOGIE DE L’AUDITION A LA PEDAGOGIE DES LANGUES 4.1. Critique des méthodes classiques d’audiométrie L’appellation verbo-tonale s’est appliquée, à l’origine, à la méthode de réhabilitation des déficients auditifs, créée par P. Guberina, elle-même née de la critique des techniques classiques de mesure de l’audition : l’audiométrie tonale et l’audiométrie vocale. L’audiométrie tonale compare la courbe d’audibilité du sujet à la courbe liminaire moyenne du champ de l’audition. P. Guberina ne conteste évidemment pas la valeur diagnostique de l’audiométrie tonale. Il lui reproche avant tout de tester l’oreille à partir de sons purs qui ne correspondent aucunement à la réalité linguistique. L’audiométrie vocale étudie les réactions de l’individu à la parole. Elle permet de déceler les seuils de détection, de distinction et d’intelligibilité. Elle se fonde sur divers stimuli : phonèmes isolés, syllabes sans signification (logatomes), mots monosyllabiques, mots dissyllabiques, phrases. Le reproche fait par P. Guberina est qu’elle ne fournit pas suffisamment de précision quant aux fréquences, en dépit de l’élaboration de listes de mots « phonétiquement équilibrés ». 4.2. L’audiométrie verbo-tonale D’où la recherche d’une audiométrie qui, tout en se servant de signaux de nature linguistique (verbale) fournirait des indications de nature tonale sur les déficiences. Les signaux choisis sont des logatomes prononcés par une voix naturelle. Les indications de nature tonale sont des bandes d’octaves. Les logatomes proposés sont fréquentiellement équilibrés. L’hypothèse de départ est double. Il est normal que l’oreille malade ne perçoive pas le logatome filtré sur la bande optimal d’intelligibilité de l’oreille saine ; le logatome non filtré sera mieux perçu que le précédent par l’oreille malade, car elle « structure » différemment. Ainsi, on parvient à déterminer le rôle (positif ou négatif) des diverses bandes d’octaves du champ auditif, on voit dans quelle mesure l’oreille se comporte comme l’oreille normale et on relève avec précision les bandes fréquentielles restées saines : ces bandes résiduelles sont dites « de transfert » car ce sont elles exclusivement que la rééducation va stimuler afin que puisse se constituer ou se reconstituer un système de codage correspondant au système phonologique de la langue de communication. P. Guberina va éliminer les bandes déficientes par filtrage et proposer une éducation du processus audio-phonatoire sur la base des seules bandes demeurées saines. A cette fin, il a créé divers appareils : les Suvag (Système universel verbo-auditif Guberina). Ces appareils accordent beaucoup d’importance aux bandes les plus graves et aux infrasons. Ainsi, on ne joue pas sur l’intensité, mais sur le choix des fréquences et sur la durée. 4.3. Les optimales Les zones fréquentielles les plus intenses – les formants dans le cas des voyelles - ne sont pas nécessairement déterminantes pour l’identification du son.
Au moyen de filtres électroniques, Guberina a cherché pour chaque son isolé la bande d’octave optimale, c’est-à-dire quand il apparaît à l’oreille normale comme le moins déformé. Si nous filtrons un [i] ou un [u] dans l’octave optimal de [ ], nous percevons [ ]. Autrement dit, si les sons et les mots sont transmis par des octaves non optimales, ils sont perçus déformés : l’oreille les entend comme des sons différents. La détermination des optimales chez un individu donné dépend de sa culture linguistique. L’optimale de [i] ou de [u], deux sons universels, est différente selon qu’on la cherche chez un Anglais, un Français, un Russe ou un Chinois. Chacun se constitue graduellement et inconsciemment un « crible », un système structurant qui est fonction du système phonologique de sa langue maternelle. Ceci explique l’existence d’un système d’erreurs conditionné par la langue maternelle des apprenants. Le crible conditionne le processus audio-phonatoire. Ce dernier peut se modifier ultérieurement en fonction de l’apprentissage éventuel de celui ou de ceux d’une ou d’autres langues. L’apprentissage d’une langue nouvelle constitue une gymnastique d’assouplissement de l’audition. 4.4. Eduquer l’oreille Une personne qui apprend une nouvelle langue n’entend pas ou plutôt ce qu’il perçoit est bruit au lieu de langage. Il est possible par un conditionnement adéquat de doter ces bruits d’une valeur fonctionnelle. Une série de facteurs ainsi que le « crible » (dû au système phonologique de la langue maternelle) se fondent sur des éléments extra-acoustiques tels que le contexte, l’intelligibilité, l’attente, la reproductibilité, l’information, et qui appartiennent à la culture et à la personnalité de celui qui écoute. Il s’agit donc de faire sauter le crible, de l’assouplir et de le modeler par un conditionnement adéquat. Il n’est pas si paradoxal d’initier les professeurs de langue aux techniques de travail avec les malentendants. Il faut « faire entendre ». On utilise la stimulation basse pour corriger rythme et intonation. Mais pour ce faire, comment inspirer confiance, susciter une collaboration active ? L’éducateur doit être patient, compréhensif. L’ambiance amical et sereine entre le rééducateur et le patient est indispensable. Il faut rechercher un conditionnement du processus audio-phonatoire qui se caractérisera par une action portant non pas sur la production (expression orale), qui est cependant son but essentiel et final, mais sur l’émission (stimulus, structure modèle). Le travail portera sur l’émission et sera guidé et contrôlé par la production. Le système verbo-tonal d’intégration phonétique met en œuvre une batterie de procédés servant à réaliser ce conditionnement. 5. LA METHODE VERBO-TONALE D’INTEGRATION PHONETIQUE 5.1. Principes généraux Le professeur recherchera toujours les stimulations les plus favorables du point de vue de la perception auditive, parmi lesquelles la stimulation psychologique : la motivation. La perception de l’adolescent ou de l’adulte se fonde sur des facteurs socio-culturels extra-acoustiques tels que le contexte, la compréhension ou l’attente. On peut à la rigueur et pour les besoins de l’apprentissage ne pas comprendre (d’une manière analytique) ce que l’on répète (fait fréquent chez les enfants), cependant une fois que l’on parle il faut savoir ce que l’on dit.
La correction phonétique opèrera mieux en liaison naturelle avec des stimulations telles que l’intonation, le geste, le rythme, la mimique, l’affectivité. Guberina parle de stimulations biologiques ou bio-physiologiques. Il existe dans la méthodologie audio-visuelle une phase privilégiée, celle de la répétition. Il faudra bannir tout ce qui pourrait favoriser une certaine intellectualisation de la matière phonétique. Cette intellectualisation suppose en effet une analyse, voire une comparaison, qui, ainsi que nous l’avons dit à propos de la description des sons et de la méthode articulatoire, nuit à la spontanéité de l’expression. Il y a lieu de retarder l’étude de la langue écrite. L’écrit ne peut que gêner le professeur dans ses efforts pour conditionner ses élèves à partir d’une sorte de déconditionnement de la langue maternelle. Les pédagogues savent en effet que seule la vue des caractères connus éveille la représentation psycho-auditive de leur énoncé sonore et déclenche chez les débutants des réactions automatiques d’articulation en rapport avec leur langue maternelle ou avec d’autres langues qu’ils auraient étudiées. Le souci du respect de la structure implique que soit respectée la prosodie, c’est-à-dire le schéma prosodique ainsi que l’alternance des accents d’intensité (ou de durée) et des pauses. En deux mots : l’intonation et le rythme. La relation entre les facteurs prosodiques et les aspects affectifs de la situation de communication est très étroite. L’incertitude entraîne une modification dans la distribution du tonus. La voix s’en trouve modifiée dans sa hauteur, son timbre, son débit, son intensité. Ainsi, l’intonation informe. « C’est haut ! ». La tension créée par cette situation affective contribue au mieux à la production correcte de l’expression et en particulier du [o]. De même, on obtient des résultats appréciables auprès des élèves étrangers qui éprouvent des difficultés à prononcer les nasales françaises lorsqu’on leur présente la situation affective (mécanisme grammatical) : on y voit une dame affublée d’un chapeau assez comique. Les personnes à qui elle demande : « Est-ce que mon chapeau vous plaît ? » répondent à l’unisson : « Non ! ». D’où l’intérêt d’un recours régulier à des situations affectives pour favoriser la bonne prononciation. Le rythme consiste dans l’organisation dans le temps des pauses et des différentes mises en évidence de hauteur, durée et/ou intensité, plus couramment appelées accents. Le rythme informe. La voyelle se trouvant au sommet, c’est-à-dire à l’aboutissement d’une intonation « montante » ou au départ d’une intonation « descendante », est perçue comme plus claire et plus tendue. Dans le cas contraire, soit à la fin d’une intonation « descendante » ou au début d’une intonation « montante », elle est perçue comme plus relâchée et plus sombre. L’élève qui concentre son esprit sur les facteurs prosodiques « débloque » inconsciemment sa perception des autres éléments informationnels du message. En d’autres termes, il ne fixe pas son attention sur le son difficile. D’où l’intérêt pour la didactique des langues des chansons, des comptines et des logatomes Pour rendre sensible à l’élève une différence qui n’est pas suffisante pour être perçue, il y a lieu de l’exagérer en modifiant le modèle de telle sorte qu’on s’éloigne de la faute. On ne peut agir sur la reproduction (de l’élève) qu’en agissant sur la transmission et sur l’émission (le modèle). L’assimilation d’un système phonologique nouveau est une lutte âpre et acharnée, avec des hauts et des bas. La persévérance se voit récompensée. 5.2. Procédés particuliers
Le respect des éléments prosodiques est essentiel. A partir de la faute, il faut apprécier d’abord correctement l’écart par rapport à la norme. Le paramètre essentiel est le spectre. Pour les voyelles c’est lui qui permet la différenciation des timbres, seuls facteurs distinctifs en français ; pour les consonnes, il intègre le facteur temporel (durée, tension), qui joue un rôle important pour la différenciation du mode articulatoire (occlusives : tendues, brèves ; constrictives : relâchées, longues). L’intonation comprend la hauteur tonale et la variation de hauteur. La hauteur tonale modifie l’équilibre des fréquences à l’intérieur d’un timbre donné. Il y a plus de chance de valoriser l’élément clair d’une voyelle avec un son aigu qu’avec un son grave. La variation de hauteur est ce qui caractérise les intonations montantes ou descendantes. Le timbre des voyelles sera toujours mieux défini en intonation variable : il sera clarifié en intonation montante et assombri en intonation descendante. En conséquence, lorsque le son est situé dans un creux mélodique, le timbre [i] s’assombrit en [e] ou [y]. Par contre, lorsque le son se trouve à un sommet mélodique, [y] s’éclaircit en [i], [u] en [y], [o] en [ ]. En français, l’accent vocalique se réalise par une variation de durée, d’intensité et/ou de hauteur. L’accentuation permet une meilleure identification du timbre, plutôt qu’une clarification de celui-ci. Par rapport aux voyelles toniques (plus tendues), les voyelles atones (plus relâchées) tendent à se rapprocher du centre du trapèze vocalique, siège du schwa. Pour les consonnes, un allongement, c’est-à-dire un ralentissement du rythme ou du temps favorise le relâchement. « Elle a ri ? » « Qui est venu ? » « Elle est ici ? » « C’est ici ? » Un son vocalique placé au sommet d’une intonation voit précisément se valoriser sa tonalité claire. Le son sera donc mieux saisi dans cette situation. Au contraire, lorsque la faute consistera en une prononciation trop tendue, le choix d’un son placé dans un creux intonatif s’avèrera le plus efficace. Doivent être considérées a priori comme « non optimales » les structures dont on trouve l’équivalent dans la langue de l’élève, car elles seraient des pièges sur le plan phonétique. L’intonation montante tend la voyelle et souligne les fréquences aiguës. L’intonation descendante contribue à relâcher le son et à en souligner l’élément grave. Le choix du professeur est donc simple : haut-bas. Le phénomène de la tension concerne à la fois : la hauteur, le timbre, la durée, l’intensité. L’intensité (ou force sonore) est fonction de l’amplitude et de la fréquence (mais
l’amplitude peut être perçue comme durée ou comme hauteur). La durée est fonction du temps (mais il peut être perçu comme intensité ou qualité). Le timbre est fonction du spectre des fréquences, la hauteur est fonction de la fréquence fondamentale (mais la fréquence peut être perçue comme durée). La tension joue un rôle régulateur dans la production des phonèmes. L’hypotension peut expliquer l’émission [baba] pour « papa » ; au contraire, une hypertension engendrera [popo] pour « maman ». Le recours à la prosodie est utile seulement pour la correction des sons vocaliques. Du point de vue de la tension, il s’avère efficace de localiser à un sommet/creux mélodique ou d’intensité les sons mal timbrés. Le recours à la phonétique combinatoire : on localisera à l’initiale les consonnes apparaissant comme trop relâchées, on les accompagnera d’une voyelle fermée antérieure ou postérieure selon qu’il s’agit d’une palatale ou d’une vélaire. Le recours à la prononciation nuancée est utile si l’élève a tendance à « relâcher » un son. Dans ce cas il faudra lui présenter ce modèle avec un maximum de tension et réciproquement. La phonétique combinatoire nous apprend que les sons s’influencent les uns les autres et que les effets séquentiels ne peuvent être sous-estimés. On mettra plus facilement en relief le caractère sombre ou claire du timbre d’une voyelle en l’associant à une consonne relativement grave ou aiguë. En d’autres termes, on vélarisera ou palatalisera selon qu’on l’associera à une consonne vélaire ou palatale. La classification des voyelles et des consonnes sur l’axe clair-sombre permet de déduire la règle générale de la phonétique combinatoire : il faut associer ce qui se ressemble. Influence des voyelles sur les consonnes : Voyelles antérieures (i, y, e) palatalisation Voyelles postérieures (u, o) vélarisation Voyelles labiales (y, u) labialisation Influence des consonnes sur les voyelles : Labiales, vélaires, laryngées, R assombrissement du timbre Nasales, sonores assombrissement du timbre Alvéolaires, post-alvéolaires éclaircissement du timbre Constrictives sourdes fermeture Occlusives sourdes ouverture j fermeture arrondissement Influence des consonnes entre elles : Sonore précédant sourde assombrissement de la sonore Sourde précédant sonore sonorisation de la sourde 5.3. Récapitulatif Mise en condition du processus audio-phonatoire Recours à la prosodie Mise en condition de la phonation Recours à la phonétique combinatoire Mise en condition de la perception Recours à la prononciation nuancée CORRECTION DES VOYELLES
Pour assombrir le timbre : - creux intonatif - chuchotement Pour éclaircir le timbre : - sommet intonatif - sommet d’intensité o fin d’exclamation o syllabe tonique CORRECTION DES CONSONNES Pour relâcher : - position intervocalique ou finale - consonne correspondante moins tendue Pour tendre : - position initiale - consonne correspondante plus tendue - contexte avec [i] [e]