Cours de linguistique générale/Appendice

Texte établi par Charles Bally, Albert Sechehaye et Albert Riedlinger, Payot (p. 63-95).

Appendice

Principes de phonologie

Chapitre premier

Les espèces phonologiques

§ 1.

Définition du phonème.

[Pour cette partie nous avons pu utiliser la reproduction sténographique de trois conférences faites par F. de S. en 1897 sur la Théorie de la syllabe, où il touche aussi aux principes généraux du premier chapitre ; en outre une bonne partie de ses notes personnelles ont trait à la phonologie ; sur bien des points elles éclairent et complètent les données fournies par les cours I et III. (Ed.)]

Beaucoup de phonologistes s’attachent presque exclusivement à l’acte de phonation, c’est-à-dire à la production des sons par les organes (larynx, bouche, etc.), et négligent le côté acoustique. Cette méthode n’est pas correcte : non seulement l’impression produite sur l’oreille nous est donnée aussi directement que l’image motrice des organes, mais encore c’est elle qui est la base naturelle de toute théorie.

La donnée acoustique existe déjà inconsciemment lorsqu’on aborde les unités phonologiques ; c’est par l’oreille que nous savons ce que c’est qu’un b, un t, etc. Si l’on pouvait reproduire au moyen d’un cinématographe tous les mouvements de la bouche et du larynx exécutant une chaîne de sons, il serait impossible de découvrir des subdivisions dans cette suite de mouvements articulatoires ; on ne sait où un son commence, où l’autre finit. Comment affirmer, sans l’impression acoustique, que dans fāl, par exemple, il y a trois unités, et non deux ou quatre ? C’est dans la chaîne de la parole entendue que l’on peut percevoir immédiatement si un son reste ou non semblable à lui-même ; tant qu’on a l’impression de quelque chose d’homogène, ce son est unique. Ce qui importe, ce n’est pas non plus sa durée en croches ou doubles croches (cf. fāl et făl), mais la qualité de l’impression. La chaîne acoustique ne se divise pas en temps égaux, mais en temps homogènes, caractérisés par l’unité d’impression, et c’est là le point de départ naturel pour l’étude phonologique.

A cet égard l’alphabet grec primitif mérite notre admiration. Chaque son simple y est représenté par un seul signe graphique, et réciproquement chaque signe correspond à un son simple, toujours le même. C’est une découverte de génie, dont les Latins ont hérité. Dans la notation du mot bárbaros « barbare », ΒΑΡΒΑΡΟΣ, chaque lettre correspond à un temps homogène ; dans la figure ci-dessus la ligne horizontale représente la chaîne phonique, les petites barres verticales les passages d’un son à un autre. Dans l’alphabet grec primitif, on ne trouve pas de graphies complexes comme notre « ch » pour š, ni de représentations doubles d’un son unique comme « c » et « s » pour s, pas non plus de signe simple pour un son double, comme « x » pour ks. Ce principe, nécessaire et suffisant pour une bonne écriture phonologique, les Grecs l’ont réalisé presque intégralement[1].

Les autres peuples n’ont pas aperçu ce principe, et leurs alphabets n’analysent pas la chaîne parlée en ses phases acoustiques homogènes. Les Cypriotes, par exemple, se sont arrêtés à des unités plus complexes, du type pa, ti, ko, etc. ; on appelle cette notation syllabique ; désignation quelque peu inexacte, puisqu’une syllabe peut être formée sur d’autres types encore, par exemple pak, tra, etc. Les Sémites, eux, n’ont marqué que les consonnes ; un mot comme bárbaros aurait été noté par eux brbrs.

La délimitation des sons de la chaîne parlée ne peut donc reposer que sur l’impression acoustique ; mais pour leur description, il en va autrement. Elle ne saurait être faite que sur la base de l’acte articulatoire, car les unités acoustiques prises dans leur propre chaîne sont inanalysables. Il faut recourir à la chaîne des mouvements de phonation ; on remarque alors qu’au même son correspond le même acte : b (temps acoustique) = b′ (temps articulatoire). Les premières unités qu’on obtient en découpant la chaîne parlée seront composées de b et b′ ; on les appelle phonèmes ; le phonème est la somme des impressions acoustiques et des mouvements articulatoires, de l’unité entendue et de l’unité parlée, l’une conditionnant l’autre : ainsi c’est déjà une unité complexe, qui a un pied dans chaque chaîne.

Les éléments que l’on obtient d’abord par l’analyse de la chaîne parlée sont comme les anneaux de cette chaîne, des moments irréductibles qu’on ne peut pas considérer

en dehors du temps qu’ils occupent. Ainsi un ensemble comme ta sera toujours un moment plus un moment, un fragment d’une certaine étendue plus un autre fragment. En revanche le fragment irréductible t, pris à part, peut être considéré in abstracto, en dehors du temps. On peut parler de t en général, comme de l’espèce T (nous désignerons les espèces par des majuscules), de i comme de l’espèce I, en ne s’attachant qu’au caractère distinctif, sans se préoccuper de tout ce qui dépend de la succession dans le temps. De la même façon un ensemble musical, do, , mi ne peut être traité que comme une série concrète dans le temps ; mais si je prends un de ses éléments irréductibles, je puis le considérer in abstracto.

Après avoir analysé un nombre suffisant de chaînes parlées appartenant à diverses langues, on arrive à connaître et à classer les éléments avec lesquels elles opèrent ; on constate alors que, si l’on néglige des nuances acoustiquement indifférentes, le nombre des espèces données n’est pas indéfini. On en trouvera la liste et la description détaillée dans les ouvrages spéciaux[2] ; ici nous voudrions montrer sur quels principes constants et très simples toute classification de ce genre est fondée.

Mais disons tout d’abord quelques mots de l’appareil vocal, du jeu possible des organes et du rôle de ces mêmes organes comme producteurs du son.

§ 2.

L’appareil vocal et son fonctionnement[3].

1. Pour la description de l’appareil, nous nous bornons à une figure schématique, où A désigne la cavité nasale, B la cavité buccale, C le larynx, contenant la glotte ɜ entre les deux cordes vocales.

Dans la bouche il est essentiel de distinguer les lèvres α et a, la langue β — γ (β désignant la pointe et γ tout le reste), les dents supérieures d, le palais, comprenant une partie antérieure, osseuse et inerte f-h, et une partie postérieure, molle et mobile ou voile du palais i, enfin la luette δ.

Les lettres grecques désignent les organes actifs dans l’articulation, les lettres latines les parties passives.

La glotte ε, formée de deux muscles parallèles ou cordes vocales, s’ouvre par leur écartement ou se ferme par leur resserrement. La fermeture complète n’entre pour ainsi dire pas en ligne de compte ; quant à l’ouverture, elle est tantôt large, tantôt étroite. Dans le premier cas, l’air passant librement, les cordes vocales ne vibrent pas ; dans le second, le passage de l’air détermine des vibrations sonores. Il n’y a pas d’autre alternative dans l’émission normale des sons.

La cavité nasale est un organe tout à fait immobile ; le passage de l’air peut être arrêté par le relèvement de la luette δ, rien de plus ; c’est une porte ouverte ou fermée.

Quant à la cavité buccale, elle offre un jeu possible très varié : on peut augmenter la longueur du canal par les lèvres, enfler ou desserrer les joues, rétrécir et même fermer la cavité par les mouvements infiniment divers des lèvres et de la langue.

Le rôle de ces mêmes organes comme producteurs du son est en raison directe de leur mobilité : même uniformité dans la fonction du larynx et de la cavité nasale, même diversité dans celle de la cavité buccale.

L’air chassé des poumons traverse d’abord la glotte, il y a production possible d’un son laryngé par rapprochement des cordes vocales. Mais ce n’est pas le jeu du larynx qui peut produire les variétés phonologiques permettant de distinguer et de classer les sons de la langue ; sous ce rapport le son laryngé est uniforme. Perçu directement, tel qu’il est émis par la glotte, il nous apparaîtrait à peu près invariable dans sa qualité.

Le canal nasal sert uniquement de résonateur aux vibrations vocales qui le traversent ; il n’a donc pas non plus le rôle de producteur de son.

Au contraire, la cavité buccale cumule les fonctions de générateur de son et de résonateur. Si la glotte est largement ouverte, aucune vibration laryngienne ne se produit, et le son qu’on percevra n’est parti que de la cavité buccale (nous laissons au physicien le soin de décider si c’est un son ou simplement un bruit). Si au contraire le rapprochement des cordes vocales fait vibrer la glotte, la bouche intervient principalement comme modificateur du son laryngé.

Ainsi, dans la production du son, les facteurs qui peuvent entrer en jeu sont l’expiration, l’articulation buccale, la vibration du larynx et la résonance nasale.

Mais énumérer ces facteurs de production du son, ce n’est pas encore déterminer les éléments différentiels des phonèmes. Pour classer ces derniers, il importe bien moins de savoir en quoi ils consistent que ce qui les distingue les uns des autres. Or un facteur négatif peut avoir plus d’importance pour la classification qu’un facteur positif. Par exemple l’expiration, élément positif, mais qui intervient dans tout acte phonatoire, n’a pas de valeur différenciatrice ; tandis que l’absence de résonance nasale, facteur négatif, servira, aussi bien que sa présence, à caractériser des phonèmes. L’essentiel est donc que deux des facteurs énumérés plus haut, sont constants, nécessaires et suffisants pour la production du son :

a) l’expiration,
b) l’articulation buccale,
tandis que les deux autres peuvent manquer ou se surajouter aux premiers :
c) la vibration du larynx,
d) la résonance nasale.

D’autre part, nous savons déjà que a, c et d sont uniformes, tandis que b comporte des variétés infinies.

En outre il faut se souvenir qu’un phonème est identifié quand on a déterminé l’acte phonatoire, et que réciproquement on aura déterminé toutes les espèces de phonèmes en identifiant tous les actes phonatoires. Or ceux-ci, comme le montre notre classification des facteurs en jeu dans la production du son, ne se trouvent différenciés que par les trois derniers. Il faudra donc établir pour chaque phonème : quelle est son articulation buccale, s’il comporte un son laryngé (〰) ou non ([ ]), s’il comporte une résonance nasale (....) ou non ([ ]). Quand l’un de ces trois éléments n’est pas déterminé, l’identification du son est incomplète ; mais dès qu’ils sont connus tous les trois, leurs combinaisons diverses déterminent toutes les espèces essentielles d’actes phonatoires.

On obtient ainsi le schéma des variations possibles :

I II III IV
a Expiration Expiration Expiration Expiration
b Art. bucc. Art. bucc. Art. bucc. Art. bucc.
c [ ] [ ]
d [ ] [ ] ..... .....

La colonne I désigne les sons sourds. II les sons sonores, III les sons sourds nasalisés, IV les sons sonores nasalisés.

Mais une inconnue subsiste : la nature de l’articulation buccale ; il importe donc d’en déterminer les variétés possibles.

§ 3.

Classification des sons d’après leur articulation buccale.

On classe généralement les sons d’après le lieu de leur articulation. Notre point de départ sera différent. Quelle que soit la place de l’articulation, elle présente toujours une certaine aperture, c’est-à-dire un certain degré d’ouverture entre deux limites extrêmes qui sont : l’occlusion complète et l’ouverture maximale. Sur cette base, et en allant de l’aperture minimale à l’aperture maximale, les sons seront classés en sept catégories désignées par les chiffres 0, 1, 2, 3, 4, 5, 6. C’est seulement à l’intérieur de chacune d’elles que nous répartirons les phonèmes en divers types d’après le lieu de leur articulation propre.

Nous nous conformerons à la terminologie courante, bien qu’elle soit imparfaite ou incorrecte sur plusieurs points : des termes tels que gutturales, palatales, dentales, liquides, etc. sont tous plus ou moins illogiques. Il serait plus rationnel de diviser le palais en un certain nombre d’aires ; de la sorte, et en tenant compte de l’articulation linguale, on pourrait toujours dire vis-à-vis de quel point se trouve dans chaque cas le resserrement principal. Nous nous inspirerons de cette idée, et, utilisant les lettres de la figure p. 67, nous symboliserons chaque articulation par une formule où le chiffre d’aperture se trouve placé entre la lettre grecque marquant l’organe actif (à gauche) et la lettre latine désignant l’organe passif (à droite). Ainsi β 0 e veut dire qu’avec le degré d’aperture correspondant à l’occlusion complète, la pointe de la langue β s’applique contre les alvéoles des dents supérieures e.

Enfin, dans l’intérieur de chaque articulation, les diverses espèces de phonèmes se distinguent par les concomitances — son laryngé et résonance nasale — dont l’absence aussi bien que la présence sera un élément de différenciation.

C’est d’après ce principe que nous allons classer les sons. Il s’agit d’un simple schéma de classification rationnelle ; on ne doit donc pas s’attendre à y trouver des phonèmes d’un caractère complexe ou spécial, quelle que soit leur importance pratique, par exemple les aspirées (ph, dh, etc.), les affriquées (ts, , pf, etc.), les consonnes mouillées, les voyelles faibles (ə ou e muet, etc.), ni inversement des phonèmes simples qui sont dépourvus d’importance pratique et n’entrent pas en ligne de compte comme sons différenciés.

A. — Aperture zéro : Occlusives. Cette classe renferme tous les phonèmes obtenus par la fermeture complète, l’occlusion hermétique mais momentanée de la cavité buccale. Il n’y a pas lieu d’examiner si le son est produit au moment de la fermeture ou à celui de l’ouverture ; en réalité il peut se produire des deux manières (voir p. 79 sv.).

D’après le lieu d’articulation on distingue trois types principaux d’occlusives : le type labial (p, b, m), le type dental (t, d, n), le type dit guttural (k, g, ).

Le premier s’articule avec les deux lèvres ; dans le second l’extrémité de la langue s’applique sur l’avant du palais ; dans le troisième le dos de la langue est en contact avec l’arrière du palais.

Dans beaucoup de langues, notamment en indo-européen, on distingue nettement deux articulations gutturales, l’une, palatale, sur f-h, l’autre, vélaire, sur i. Mais ailleurs, en français par exemple, on néglige cette différence, et l’oreille assimile un k d’arrière, comme celui de court, à un k d’avant, comme celui de qui.

Le tableau suivant montre les formules de ces divers phonèmes :

labiales dentales gutturales
p b (m) t d (n) k g (n)
α 0 a α 0 a α 0 a β 0 e β 0 e β 0 e γ 0 h γ 0 h γ 0 h
[] 〰〰 〰〰 [] 〰〰 〰〰 [] 〰〰 〰〰
[[ [] ..... [] [] ..... [] [] .....

Les nasales m, n, sont proprement des occlusives sonores nasalisées ; quand on prononce amba, la luette se relève pour fermer les fosses nasales au moment où l’on passe de m à b.

En théorie chaque type possède une nasale sans vibration glottale, ou sourde ; c’est ainsi que dans les langues scandinaves m sourd existe après une sourde ; on en trouverait aussi des exemples en français, mais les sujets parlants n’y voient pas un élément différentiel.

Les nasales figurent entre parenthèses dans le tableau ; en effet si leur articulation comporte une fermeture complète de la bouche, l’ouverture du canal nasal leur confère un caractère d’aperture supérieur (voir classe C).

B. — Aperture 1 ; fricatives ou spirantes, caractérisées par une fermeture incomplète de la cavité buccale, permettant le passage de l’air. Le terme de spirante est tout à fait général ; celui de fricative, sans rien dire sur le degré de fermeture, rappelle l’impression de frottement produite par le passage de l’air (lat. fricāre).

Dans cette classe on ne peut plus s’en tenir à trois types, comme dans la première catégorie. D’abord les labiales proprement dites (correspondant aux occlusives p et b), sont d’un emploi très rare ; nous en faisons abstraction ; elles sont ordinairement remplacées par les labio-dentales, produites par le rapprochement de la lèvre inférieure et des dents (f et v français) ; les dentales se divisent en plusieurs variétés, suivant la forme que prend l’extrémité de la langue dans le resserrement ; sans les détailler, nous désignerons par β, β′ et β″ les diverses formes de la pointe de la langue. Dans les sons qui intéressent le palais, l’oreille distingue généralement une articulation d’avant (palatales) et une articulation d’arrière (vélaires)[4].

labio-dent. dentales
f v þ đ s z š ž
α 1 d α 1 d β 1 d β 1 d β′ 1 d β′ 1 d β″ 1 d β″ 1 d
[] 〰〰 [] 〰〰 [] 〰〰 [] 〰〰
[] [] [] [] [] [] [] []
palatales guturales
χ′ ɣ′ χ ɣ
ɣ 1 f ɣ 1 f ɣ 1 i ɣ 1 i
[] 〰〰 [] 〰〰
[] [] []
þ anglais th dans thing
đ =   " th   " then
s = français s   " si
z =   " s   " rose
š =   " ch   " chant
ž =   " g   " génie
χ  = allemand ch   " ich
γ′ = all. Nord g   " liegen
χ = allemand  ch   " Bach
γ = all. Nord g   " Tage

Y a-t-il dans les fricatives ce qui correspondrait à n, m, , etc. dans les occlusives, c’est-à-dire un v nasal, un z nasal, etc. ? Il est facile de le supposer ; ainsi on entend un v nasal dans le français inventer ; mais en général la fricative nasale n’est pas un son dont la langue ait conscience.

C.Aperture 2 : nasales (voir plus haut, p. 72).

D.Aperture 3 : liquides.

Deux sortes d’articulations relèvent de cette classe :

1) L’articulation latérale : la langue appuie contre la partie antérieure du palais, mais en laissant une ouverture à droite et à gauche, position figurée par un l dans nos formules. D’après le lieu d’articulation, on distingue l dental, l′ palatal ou « mouillé » et ł guttural ou vélaire. Dans presque toutes les langues ces phonèmes sont des sonores, au même titre que b, z, etc. Cependant la sourde n’est pas impossible ; elle existe même en français, où un l suivant une sourde sera prononcé sans le son laryngé (par exemple dans pluie, par opposition à bleu) ; mais nous n’avons pas conscience de cette différence.

Inutile de parler de l nasal, très rare et non différencié, bien qu’il existe, surtout après un son nasal (par exemple dans le français branlant).

2) L’articulation vibrante : la langue est moins rapprochée du palais que pour l, mais elle vibre, avec un nombre d’ailleurs variable de battements (signe dans les formules), et par là on obtient un degré d’aperture équivalent à celui des latérales. Cette vibration peut être produite de deux façons : avec la pointe de la langue appliquée en avant sur les alvéoles (r dit « roulé » du français), ou en arrière, avec la partie postérieure de la langue (r grasseyé). On peut répéter à propos des vibrantes sourdes ou nasales ce qui a été dit des latérales.

l l′ ł r
βl 3 e ɣl 3 f-h ɣl 3 i βv 3 e ɣ 3 δv
〰〰 〰〰 〰〰 〰〰 〰〰
[] [] [] [] []

Au delà du degré 3, nous entrons dans un autre domaine : des consonnes nous passons aux voyelles. Jusqu’ici, nous n’avons pas fait prévoir cette distinction ; c’est que le mécanisme de la phonation reste le même. La formule d’une voyelle est exactement comparable à celle de n’importe quelle consonne sonore. Au point de vue de l’articulation buccale, il n’y a pas de distinction à faire. Seul l’effet acoustique est différent. Passé un certain degré d’aperture, la bouche fonctionne principalement comme résonateur. Le timbre du son laryngé apparaît pleinement et le bruit buccal s’efface. Plus la bouche se ferme, plus le son laryngé est intercepté ; plus on l’ouvre, plus le bruit diminue ; c’est ainsi que, tout à fait mécaniquement, le son prédomine dans la voyelle.

E.Aperture 4 : i u ü.

Par rapport aux autres voyelles, ces sons supposent une fermeture encore considérable, assez voisine de celle des consonnes. Il en résulte certaines conséquences qui apparaîtront plus tard, et qui justifient le nom de semi-voyelles donné généralement à ces phonèmes.

i se prononce avec lèvres tirées (signe ‾) et articulation d’avant, u avec lèvres arrondies (signe °) et articulation d’arrière, ü avec la position des lèvres de u et l’articulation de i.

Comme toutes les voyelles, i u ü ont des formes nasalisées ; mais elles sont rares et nous pouvons en faire abstraction. Il est à remarquer que les sons écrits in et un dans l’orthographe française correspondent à autre chose (voir plus bas).

Existe-t-il un i sourd, c’est-à-dire articulé sans le son laryngé ? La même question se pose pour u et ü et pour toutes les voyelles ; ces phonèmes, qui correspondraient aux consonnes sourdes, existent, mais ne doivent pas être confondus avec les voyelles chuchotées, c’est-à-dire articulées avec la glotte relâchée. On peut assimiler les voyelles sourdes aux h aspirés prononcés devant elles ; ainsi dans hi on entend d’abord un i sans vibration, puis un i normal.

i u ü
‾ ɣ 4 f ° ɣ 4 i ° ɣ 4 f
〰〰 〰〰 〰〰
[] [] []

F.Aperture 5 : e o ö, dont l’articulation correspond respectivement à celle de i u ü. Les voyelles nasalisées sont fréquentes ( õ , par exemple en français dans pin, pont, brun). Les formes sourdes sont l'h aspiré de he ho .

N. B. — Beaucoup de langues distinguent ici plusieurs degrés d’aperture ; ainsi le français a au moins deux séries, l’une dite fermée ọ̈ (p. ex. dans , dos, deux), l’autre ouverte ę ǫ ǫ̈ (p. ex. dans mer, mort, meurt).

e o ö õ
‾ ɣ 5 f ° ɣ 5 i ° ɣ 5 f ‾ ɣ 5 f ° ɣ 5 i ° ɣ 5 f
〰〰 〰〰 〰〰 〰〰 〰〰 〰〰
[] [] [] ..... ..... .....


G.Aperture 6 : a, ouverture maximale, qui a une forme nasalisée, un peu plus resserrée, il est vrai, ã (par exemple dans grand), et une forme sourde, l'h de ha.

a ā
ɣ 6 h ɣ 6 h
〰〰 〰〰
[] .....

Chapitre II

Le phonème dans la chaine parlée

§1.

Nécessité d’étudier les sons dans la chaîne parlée.

On peut trouver dans les traités spéciaux et surtout dans les ouvrages des phonéticiens anglais de minutieuses analyses des sons du langage.

Suffisent-elles pour que la phonologie réponde à sa destination de science auxiliaire de la linguistique ? Tant de détails accumulés n’ont pas de valeur en eux-mêmes ; la synthèse importe seule. Le linguiste n’a nul besoin d’être un phonologiste consommé ; il demande simplement qu’on lui fournisse un certain nombre de données nécessaires pour l’étude de la langue.

Sur un point la méthode de cette phonologie est particulièrement en défaut ; elle oublie trop qu’il y a dans la langue non seulement des sons, mais des étendues de sons parlés ; elle n’accorde pas encore assez d’attention à leurs rapports réciproques. Or ce n’est pas cela qui nous est donné d’abord ; la syllabe s’offre plus directement que les sons qui la composent. On a vu que certaines écritures primitives ont marqué les unités syllabiques : ce n’est que plus tard qu’on est arrivé au système alphabétique.

En outre, ce n’est jamais une unité simple qui embarrasse en linguistique : si, par exemple, à un moment donné, dans une langue donnée, tout a devient o, il n’en résulte rien ; on peut se borner à constater le phénomène, sans chercher à l’expliquer phonologiquement. La science des sons ne devient précieuse que lorsque deux ou plusieurs éléments se trouvent impliqués dans un rapport de dépendance interne ; car il y a une limite aux variations de l’un d’après les variations de l’autre ; le fait seul qu’il y a deux éléments entraîne un rapport et une règle, ce qui est très différent d’une constatation. Dans la recherche du principe phonologique, la science travaille donc à contresens en marquant sa prédilection pour les sons isolés. Il suffit de deux phonèmes pour qu’on ne sache plus où on en est. Ainsi en vieux haut allemand hagl, balg, wagn, lang, donr, dorn, sont devenus plus tard hagal, balg, wagan, lang, donnar, dorn ; ainsi, selon la nature et l’ordre de succession en groupe, le résultat est différent : tantôt une voyelle se développe entre deux consonnes, tantôt le groupe reste compact. Mais comment formuler la loi ? D’où provient la différence ? Sans doute des groupes de consonnes (gl, lg, gn, etc.) contenus dans ces mots. Il est bien clair qu’ils se composent d’une occlusive qui dans un des cas est précédée, et dans l’autre suivie d’une liquide ou d’une nasale ; mais qu’en résulte-t-il ? Aussi longtemps que g et n sont supposés quantités homogènes, on ne comprend pas pourquoi le contact g-n produirait d’autres effets que n-g.

A côté de la phonologie des espèces, il y a donc place pour une science qui prend pour point de départ les groupes binaires et les consécutions de phonèmes, et c’est tout autre chose. Dans l’étude des sons isolés, il suffit de constater la position des organes ; la qualité acoustique du phonème ne fait pas question ; elle est fixée par l’oreille ; quant à l’articulation, on a toute liberté de la produire à son gré. Mais dès qu’il s’agit de prononcer deux sons combinés, la question est moins simple ; on est obligé de tenir compte de la discordance possible entre l’effet cherché et l’effet produit ; il n’est pas toujours en notre pouvoir de prononcer ce que nous avons voulu. La liberté de lier des espèces phonologiques est limitée par la possibilité de lier les mouvements articulatoires. Pour rendre compte de ce qui se passe dans les groupes, il y a à établir une phonologie où ceux-ci seraient considérés comme des équations algébriques ; un groupe binaire implique un certain nombre d’éléments mécaniques et acoustiques qui se conditionnent réciproquement ; quand l’un varie, cette variation a sur les autres une répercussion nécessaire qu’on pourra calculer.

Si dans le phénomène de la phonation quelque chose offre un caractère universel qui s’annonce comme supérieur à toutes les diversités locales des phonèmes, c’est sans doute cette mécanique réglée dont il vient d’être question. On voit par là l’importance que la phonologie des groupes doit avoir pour la linguistique générale. Tandis qu’on se borne généralement à donner des règles pour articuler tous les sons, éléments variables et accidentels des langues, cette phonologie combinatoire circonscrit les possibilités et fixe les relations constantes des phonèmes interdépendants. Ainsi le cas de hagl, balg, etc. (voir p. 78), soulève la question si discutée des sonantes indo-européennes ; or c’est le domaine où l’on peut le moins se passer d’une phonologie ainsi conçue, car la syllabation est pour ainsi dire le seul fait qu’elle mette en jeu du commencement à la fin. Ce n’est pas l’unique problème qu’on ait à résoudre par cette méthode ; mais un fait est certain : il devient presque impossible de discuter la question des sonnantes en dehors d’une appréciation exacte des lois qui régissent la combinaison des phonèmes.

§ 2.

L’implosion et l’explosion.

Nous partons d’une observation fondamentale : quand on prononce un groupe appa, on perçoit une différence entre les deux p, dont l’un correspond à une fermeture, le second à une ouverture. Ces deux impressions sont assez analogues pour qu’on ait représenté la suite pp par un seul p (voir p. 66, note). Cependant c’est cette différence qui nous permet de distinguer par des signes spéciaux (˃ ˂) les deux p de appa (ap͐p᷾a) et de les caractériser quand ils ne se suivent pas dans la chaîne (cf. ap͐ta, atp᷾a). La même distinction peut se poursuivre au delà des occlusives et s’applique aux fricatives (af͐f᷾a), aux nasales am͐m᷾a, aux liquides (al͐l᷾a), et en général à tous les phonèmes jusqu’aux voyelles (ao͐o᷾a) sauf a.

On a appelé la fermeture implosion et l’ouverture explosion ; un p est dit implosif () ou explosif (p᷾). Dans le même sens on peut parler de sons fermants et de sons ouvrants.

Sans doute, dans un groupe comme appa, on distingue, outre l’implosion et l’explosion, un temps de repos dans lequel l’occlusion se prolonge ad libitum, et s’il s’agit d’un phonème d’aperture plus grande, comme dans le groupe alla, c’est l’émission du son lui-même qui continue dans l’immobilité des organes. D’une façon générale, il y a dans toute chaîne parlée de ces phases intermédiaires que nous appellerons tenues ou articulations sistantes. Mais elles peuvent être assimilées aux articulations implosives, parce que leur effet est analogue ; il ne sera tenu compte dans la suite que des implosions ou des explosions[5].

Cette méthode, qui ne serait pas admissible dans un traité complet de phonologie, se justifie dans un exposé qui ramène à un schéma aussi simple que possible le phénomène de la syllabation considéré dans son facteur essentiel ; nous ne prétendons pas résoudre par là toutes les difficultés que soulève la division de la chaîne parlée en syllabes, mais poser seulement une base rationnelle pour l’étude de ce problème.

Encore une remarque. Il ne faut pas confondre les mouvements fermants et ouvrants que nécessite l’émission des sons avec les diverses apertures de ces sons eux-mêmes. N’importe quel phonème peut être aussi bien implosif qu’explosif ; mais il est vrai que l’aperture influe sur l’implosion et l’explosion, en ce sens que la distinction des deux mouvements devient d’autant moins nette que l’aperture du son est plus grande. Ainsi avec i u ü, on perçoit encore très bien la différence ; dans ai͐i᷾a, il est possible de saisir un i fermant et un i ouvrant ; de même dans au͐u᷾a, aü͐ü᷾a on distingue nettement le son implosif du son explosif qui suit, à tel point que, contrairement à son habitude, l’écriture marque parfois cette distinction ; le w anglais, le j allemand et souvent le y français (dans yeux, etc.) représentent des sons ouvrants (u᷾, i᷾) par opposition à u et i qui sont employés pour et . Mais à un degré d’aperture plus élevé (e et o), l’implosion et l’explosion, théoriquement concevables (cf. ae͐e᷾a, ao͐o᷾a), sont très malaisées à distinguer en pratique. Enfin, comme on l’a vu plus haut, au degré le plus élevé, a ne présente plus ni implosion ni explosion, car pour ce phonème l’aperture efface toute différence de ce genre.

Il faut donc dédoubler le tableau des phonèmes sauf pour a, et établir comme suit la liste des unités irréductibles :

p͐ p᷾, etc.
f͐ f᷾, etc.
m͐ m᷾, etc.
r͐ r᷾, etc.
i͐ y᷾, etc.
e͐ e᷾, etc.
a.

Loin de supprimer les distinctions consacrées par la graphie (y w), nous les gardons soigneusement ; la justification de ce point de vue se trouve plus loin, § 7.

Pour la première fois, nous sommes sortis de l’abstraction ; pour la première fois apparaissent des éléments concrets, indécomposables, occupant une place et représentant un temps dans la chaîne parlée ; on peut dire que P n’était rien sinon une unité abstraite réunissant les caractères communs de et de p᷾, qui seuls se rencontrent dans la réalité, exactement de même que B P M sont réunis dans une abstraction supérieure, les labiales. On parle de P comme on parlerait d’une espèce zoologique ; il y a des exemplaires mâles et femelles, mais pas d’exemplaire idéal de l’espèce. Ce sont ces abstractions que nous avons distinguées et classées jusqu’ici ; mais il était nécessaire d’aller au delà et d’atteindre l’élément concret.

Ce fut une grande erreur de la phonologie de considérer comme des unités réelles ces abstractions, sans examiner de plus près la définition de l’unité. L’alphabet grec était arrivé à distinguer ces éléments abstraits, et l’analyse qu’il suppose était, nous l’avons dit, des plus remarquables ; mais c’était pourtant une analyse incomplète, arrêtée à un certain degré.

En effet qu’est-ce qu’un p, sans autre détermination ? Si on le considère dans le temps, comme membre de la chaîne parlée, ce ne peut être ni p᷾ spécialement, ni , encore moins p͐p᷾, ce groupe étant nettement décomposable ; et si on le prend en dehors de la chaîne et du temps, ce n’est plus qu’une chose qui n’a pas d’existence propre et dont on ne peut rien faire. Que signifie en soi un groupe tel que l + g ? Deux abstractions ne peuvent former un moment dans le temps. Autre chose est de parler de l͐k͐, de l᷾k᷾, de l͐k᷾, de l᷾k͐, et de réunir ainsi les véritables éléments de la parole. L’on voit pourquoi il suffit de deux éléments pour embarrasser la phonologie traditionnelle, et ainsi se trouve démontrée l’impossibilité de procéder, comme elle le fait, par unités phonologiques abstraites.

On a émis la théorie que dans tout phonème simple considéré dans la chaîne, par exemple p dans pa ou apa, il y a successivement une implosion et une explosion (a͐p᷾a). Sans doute toute ouverture doit être précédée d’une fermeture ; pour prendre un autre exemple encore, si je dis r͐p᷾ je devrai, après avoir opéré la fermeture du r, articuler avec la luette un r ouvrant pendant que l’occlusion du p se forme vers les lèvres. Mais pour répondre à cette objection, il suffit de bien spécifier quel est notre point de vue. Dans l’acte phonatoire que nous allons analyser, nous ne tenons compte que des éléments différentiels, saillants pour l’oreille et capables de servir à une délimitation des unités acoustiques dans la chaîne parlée. Seules ces unités acoustico-motrices doivent être considérées ; ainsi l’articulation du r explosif qui accompagne celle du p explosif est pour nous inexistante, parce qu’elle ne produit pas un son perceptible, ou du moins qu’elle ne compte pas dans la chaîne des phonèmes. C’est là un point essentiel dont il faut bien se pénétrer pour comprendre les développements qui suivent.

§ 3.

Combinaisons diverses des explosions et des implosions dans la chaîne.

Voyons maintenant ce qui doit résulter de la consécution des explosions et des implosions dans les quatre combinaisons théoriquement possibles : 1° <>, 2° ><, 3° <<, 4° >>.

1° Groupe explosivo-implosif (<>). On peut toujours, sans rompre la chaîne parlée, joindre deux phonèmes dont l’un est explosif et le second implosif. Ex. : k᷾r͐, k᷾i͐, y᷾m͐, etc. (cf. sanscrit k᷾r͐ta-, français k᷾i͐te « quitter », indo-europ. y᷾m͐to-, etc.). Sans doute, certaines combinaisons, telles que k͐t͐, etc., n'ont pas un effet acoustique susceptible de réalisation pratique, mais il n’en est pas moins vrai qu’après avoir articulé un k ouvrant, les organes sont dans la position voulue pour procéder à un resserrement sur un point quelconque. Ces deux phases phonatoires peuvent se succéder sans se gêner mutuellement.

2° Groupe implosivo-explosif (><). Dans les mêmes conditions, et sous les mêmes réserves, il n’y a aucune impossibilité à joindre deux phonèmes dont l’un est implosif et le second explosif ; ainsi i͐m᷾, k͐t᷾, etc. (cf. grec haîma, français actif, etc.).

Sans doute ces moments articulatoires successifs ne se suivent pas aussi naturellement que dans le cas précédent. Il y a entre une première implosion et une première explosion cette différence que l’explosion, tendant à une attitude neutre de la bouche, n’engage pas le moment suivant, tandis que l’implosion crée une position déterminée qui ne peut pas servir de point de départ à une explosion quelconque. Il faut donc toujours quelque mouvement d’accommodation destiné à obtenir la position des organes nécessaire pour l’articulation du second phonème ; ainsi, pendant qu’on exécute le s d’un groupe s͐p᷾, il faut fermer les lèvres pour préparer le p ouvrant. Mais l’expérience montre que ce mouvement d’accommodation ne produit rien d’appréciable, si ce n’est un de ces sons furtifs dont nous n’avons pas à tenir compte, et qui ne gênent en aucun cas la suite de la chaîne.

Chaînon explosif (<<). Deux explosions peuvent se produire consécutivement ; mais si la seconde appartient à un phonème d’aperture moindre ou d’aperture égale, on n’aura pas la sensation acoustique d’unité qu’on trouvera dans le cas contraire et que présentaient les deux cas précédents ; p᷾k᷾ peut se prononcer (p᷾k᷾a), mais ces sons ne forment pas chaîne, parce que les espèces P et K sont d’égale aperture. C’est cette prononciation peu naturelle qu’on obtiendrait en s’arrêtant après le premier a de cha-p᷾k᷾a[6]. Au contraire p᷾r᷾ donne une impression de continuité (cf. prix) ; r᷾y᷾ ne fait pas davantage difficulté (cf. rien). Pourquoi ? C’est qu’à l’instant où la première explosion se produit, les organes ont déjà pu se placer dans la position voulue pour exécuter la deuxième explosion sans que l’effet acoustique de la première en ait été gêné ; par exemple dans prix, pendant qu’on prononce p, les organes se trouvent déjà en r. Mais il est impossible de prononcer en chaînon continu la série inverse r᷾p᷾ ; non pas qu’il soit mécaniquement impossible de prendre la position de p᷾ en même temps qu’on articule un r᷾ ouvrant, mais parce que le mouvement de cet r᷾, rencontrant l’aperture moindre de p᷾, ne pourra pas être perçu. Si donc on veut faire entendre r᷾p᷾, il faudra s’y prendre à deux fois et l’émission sera rompue.

Un chaînon explosif continu peut comprendre plus de deux éléments, pourvu qu’on passe toujours d’une ouverture moindre à une ouverture plus grande (par exemple k᷾r᷾w᷾a). En faisant abstraction de certains cas particuliers sur lesquels nous ne pouvons insister[7], on peut dire que le nombre possible des explosions trouve sa limite naturelle dans le nombre des degrés d’aperture qu’on peut pratiquement distinguer.

4° Le chaînon implosif (>>) est régi par la loi inverse. Tant qu’un phonème est plus ouvert que le suivant, on a l’impression de continuité (par exemple i͐r͐, r͐t͐), si cette condition n’est pas remplie, si le phonème suivant est plus ouvert ou de même aperture que le précédent, la prononciation reste possible, mais l’impression de continuité n’est plus là : ainsi s͐r͐ de a͐s͐r͐ta a le même caractère que le groupe p͐k͐ de cha-pka (voir plus haut, p. 84 sv.). Le phénomène est entièrement parallèle à celui que nous avons analysé dans le chaînon explosif : dans r͐t͐, le , en vertu de son degré d’aperture inférieur, dispense de l’explosion ; ou, si l’on prend un chaînon dont les deux phonèmes ne s’articulent pas au même point, comme r͐m͐, l’ ne dispense pas l’ d’exploser, mais, ce qui revient au même, il en couvre complètement l’explosion au moyen de son articulation plus fermée. Sinon, comme dans le cas inverse m͐r͐, l’explosion furtive, mécaniquement indispensable, vient rompre la chaîne parlée.

On voit que le chaînon implosif, comme le chaînon explosif, peut comprendre plus de deux éléments, si chacun d’eux a une ouverture supérieure à celui qui suit (cf. a͐r͐s͐t).

Laissant de côté les ruptures de chaînons, plaçons-nous maintenant devant la chaîne continue normale, qu’on pourrait appeler « physiologique », telle qu’elle est représentée par le mot français particulièrement, soit p᷾a͐r͐t᷾i͐k᷾ü͐l᷾y᷾e͐r͐m᷾ã͐. Elle est caractérisée par une succession de chaînons explosifs et implosifs gradués, correspondant à une succession d’ouvertures et de fermetures des organes buccaux.

La chaîne normale ainsi définie donne lieu aux constatations suivantes, dont l’importance est capitale.

§ 4.

Frontière de syllabe et point vocalique.

Si dans une chaîne de sons on passe d’une implosion à une explosion (>|<), on obtient un effet particulier qui est l’indice de la frontière de syllabe, par exemple dans i͐k᷾ de particulièrement. Cette coïncidence régulière d’une condition mécanique avec un effet acoustique déterminé assure au groupe implosivo-explosif une existence propre dans l’ordre phonologique : son caractère persiste quelles que soient les espèces dont il est composé ; il constitue un genre contenant autant d’espèces qu’il y a de combinaisons possibles.

La frontière syllabique peut être, dans certains cas, placée en deux points différents d’une même série de phonèmes, suivant qu’on passe plus ou moins vite de l’implosion à l’explosion. Ainsi dans un groupe ardra, la chaîne n’est pas rompue, qu’on coupe a͐r͐d᷾r᷾a͐ ou a͐r͐d͐r᷾a͐, puisque a͐r͐d͐, chaînon implosif, est aussi bien gradué que d᷾r᷾, chaînon explosif. Il en serait de même pour ülye de particulièrement, (ü͐l᷾y᷾e͐ ou ü͐l͐y᷾e͐).

En second lieu, nous remarquerons qu’à l’endroit où l’on passe d’un silence à une première implosion (>), par exemple dans a͐rt de artiste, ou d’une explosion à une implosion (<>), comme dans p᷾a͐rt de particulièrement, le son où se produit cette première implosion se distingue des sons voisins par un effet propre, qui est l’effet vocalique. Celui-ci ne dépend pas du tout du degré d’ouverture plus grand du son a, car dans p᷾r͐t, r le produit aussi bien ; il est inhérent à la première implosion, quelle que soit son espèce phonologique, c’est-à-dire son degré d’aperture ; peu importe aussi qu’elle vienne après un silence ou une explosion. Le son qui donne cette impression par son caractère de première implosive peut être appelé point vocalique.

On a donné aussi à cette unité le nom de sonante, en appelant consonantes tous les sons précédents ou suivants de la même syllabe. Les termes de voyelles et consonnes, désignent comme nous l’avons vu p. 75, des espèces différentes ; sonantes et consonantes désignent au contraire des fonctions dans la syllabe. Cette double terminologie permet d’éviter une confusion qui a longtemps régné. Ainsi l’espèce I est la même dans fidèle et dans pied : c’est une voyelle ; mais elle est sonante dans fidèle et consonante dans pied. L’analyse montre que les sonantes sont toujours implosives et les consonantes tantôt implosives (par exemple dans l’anglais boi͐, écrit « boy » ) tantôt explosives (par exemple dans le français p᷾y᷾e͐, écrit « pied » ). Cela ne fait que confirmer la distinction établie entre les deux ordres. Il est vrai qu’en fait, e o a sont régulièrement des sonantes ; mais c’est une simple coïncidence : ayant une plus grande aperture que tous les autres sons, ils sont toujours au commencement d’un chaînon implosif. Inversement les occlusives, qui ont l’aperture minimale, sont toujours consonantes. Dans la pratique ce sont les phonèmes d’aperture 2, 3 et 4 (nasales, liquides, semi-voyelles) qui jouent l’un ou l’autre rôle selon leur entourage et la nature de leur articulation.

§ 5.

Critique des théories de la syllabation.

L’oreille perçoit dans toute chaîne parlée la division en syllabes, et dans toute syllabe une sonante. Ces deux faits sont connus, mais on peut se demander quelle est leur raison d’être. On a proposé diverses explications :

1o Remarquant que certains phonèmes sont plus sonores que d’autres, on a cherché à faire reposer la syllabe sur la sonorité des phonèmes. Mais alors pourquoi des phonèmes sonores tels que i et u ne font-ils pas nécessairement syllabes ? Et puis, où s’arrête la sonorité, puisque des fricatives comme s peuvent faire syllabe, par exemple dans pst ? S’il s’agit seulement de la sonorité relative de sons en contact, comment expliquer des groupes tels que w᷾l͐ (ex. : indo-europ. *wlkos « loup » ), où c’est l’élément le moins sonore qui fait syllabe ?

2o M. Sievers a le premier établi qu’un son classé parmi les voyelles peut ne pas donner l’impression de voyelle (nous avons vu que par exemple y et w ne sont pas autre chose que i et u) ; mais quand on demande en vertu de quoi se produit la double fonction, ou le double effet acoustique (car le mot « fonction » ne veut pas dire autre chose), on répond : tel son a telle fonction selon qu’il reçoit ou non l’ « accent syllabique ».

C’est là un cercle vicieux : ou bien je suis libre en toute circonstance de dispenser à mon gré l’accent syllabique qui crée les sonantes, alors il n’y a aucune raison de l’appeler syllabique plutôt que sonantique ; ou bien, si l’accent syllabique a un sens, c’est apparemment qu’il se réclame des lois de la syllabe. Non seulement on ne fournit pas ces lois, mais on donne à cette qualité sonantique le nom de « silbenbildend », comme si à son tour la formation de la syllabe dépendait de cet accent.

On voit comment notre méthode s’oppose aux deux premières : par l’analyse de la syllabe, telle qu’elle se présente dans la chaîne, nous avons obtenu l’unité irréductible, le son ouvrant ou le son fermant, puis combinant ces unités, nous sommes arrivés à définir la limite de syllabe et le point vocalique. Nous savons dès lors dans quelles conditions physiologiques ces effets acoustiques doivent se produire. Les théories critiquées plus haut suivent la marche inverse : on prend des espèces phonologiques isolées, et de ces sons on prétend déduire la limite de syllabe et la place de la sonante. Or étant donnée une série quelconque de phonèmes, il peut y avoir une manière de les articuler plus naturelle, plus commode qu’une autre ; mais la faculté de choisir entre les articulations ouvrantes et fermantes subsiste dans une large mesure, et c’est de ce choix, non des espèces phonologiques directement, que dépendra la syllabation.

Sans doute cette théorie n’épuise ni ne résout toutes les questions. Ainsi l’hiatus, d’un emploi si fréquent, n’est pas autre chose qu’un chaînon implosif rompu, avec ou sans intervention de la volonté : Ex. i᷾-a͐ (dans il cria) ou a͐-i͐ (dans ébahi). Il se produit plus facilement avec les espèces phonologiques de grande aperture.

Il y a aussi le cas des chaînons explosifs rompus, qui sans être gradués, entrent dans la chaîne phonique au même titre que les groupes normaux ; nous avons touché ce cas à propos du grec kteínō, p. 85, note. Soit encore, par exemple, le groupe pzta : il ne peut se prononcer normalement que p᷾z᷾t᷾a͐ : il doit donc comprendre deux syllabes, et il les a en effet si l’on fait entendre nettement le son laryngé de z ; mais si le z s’assourdit, comme c’est un des phonèmes qui demandent le moins d’ouverture, l’opposition entre z et a fait qu’on ne perçoit plus qu’une syllabe et qu’on entend à peu près p᷾z᷾t᷾a͐.

Dans tous les cas de ce genre, la volonté et l’intention peuvent, en intervenant, donner le change et tourner dans une certaine mesure les nécessités physiologiques ; il est souvent difficile de dire exactement quelle part revient à chacun des deux ordres de facteurs. Mais quoi qu’il en soit, la phonation suppose une succession d’implosions et d’explosions, et c’est là la condition fondamentale de la syllabation.

§ 6.

Durée de l’implosion et de l’explosion.

En expliquant la syllabe par le jeu des explosions et des implosions, on est conduit à une observation importante qui n’est que la généralisation d’un fait de métrique. On distingue dans les mots grecs et latins deux sortes de longues : celles de nature (māter) et celles de position (fāctus). Pourquoi fac est-il mesuré long dans facius ? On répond : à cause du groupe ct ; mais si cela tient au groupe en soi, n’importe quelle syllabe commençant par deux consonnes aura aussi la quantité longue ; pourtant il n’en est rien (cf. clĭens, etc.).

La véritable raison est que l’explosion et l’implosion sont essentiellement différentes sous le rapport de la durée. La première est toujours si rapide qu’elle reste une quantité irrationnelle pour l’oreille ; c’est pour cela aussi qu’elle ne donne jamais l’impression vocalique. Seule l’implosion peut être appréciée ; d’où le sentiment qu’on reste plus longtemps sur la voyelle par laquelle elle commence.

On sait d’autre part que les voyelles placées devant un groupe formé d’occlusive ou fricative + liquide sont traitées de deux façons : dans patrem l’a peut être long ou bref : cela tient au même principe. En effet, t͐r᷾ et t͐r᷾ sont également prononçables ; la première manière d’articuler permet à l’a de rester bref ; la seconde crée une syllabe longue. Le même traitement double de l’a n’est pas possible dans un mot comme factus, puisque seul t᷾ est prononçable à l’exclusion de c᷾t.

§ 7.

Les phonèmes de quatrième aperture. La diphtongue. Questions de graphie.

Enfin les phonèmes de quatrième aperture donnent lieu à certaines observations. Nous avons vu p. 81 que, contrairement à ce que l’on constate pour d’autres sons, l’usage a consacré pour ceux-là une double graphie (w = u᷾, u =  ; y = i᷾, i = ). C’est que dans des groupes tels que aiya, auwa on perçoit, mieux que partout ailleurs, la distinction marquée par < et > ; et donnent nettement l’impression de voyelles, i᷾ et u᷾ celle de consonnes[8]. Sans prétendre expliquer ce fait, nous observons que ce i consonne n’existe jamais sous l’aspect fermant. Ainsi on ne peut avoir un ai dont l' fasse le même effet que le y dans aiya (comparez l’anglais boy avec le français pied) ; c’est donc par position que y est consonne et i voyelle, puisque ces variétés de l'espèce I ne peuvent pas se manifester partout également. Les mêmes remarques s’appliqueraient à u et w, ü et .

Ceci éclaire la question de la diphtongue. Elle n’est qu’un cas spécial du chaînon implosif ; les groupes a͐r͐ta et ta sont absolument parallèles ; il n’y a entre eux qu’une différence d’aperture du second élément : une diphtongue est un chaînon implosif de deux phonèmes dont le second est relativement ouvert, d’où une impression acoustique particulière : on dirait que la sonante continue dans le second élément du groupe. Inversement un groupe comme t᷾y᷾a ne se distingue en rien d’un groupe comme t᷾r᷾a, sinon par le degré d’aperture de la dernière explosive. Ceci revient à dire que les groupes appelés par les phonologistes diphtongues ascendantes ne sont pas des diphtongues, mais des groupes explosivo-implosifs dont le premier élément est relativement ouvert, mais sans qu’il en résulte rien de particulier au point de vue acoustique t᷾y᷾a͐). Quant aux groupes du type u͐o, i͐a, avec l’accent sur et , tels qu’on les trouve dans certains dialectes allemands (cf. buob, liab), ce ne sont également que de fausses diphtongues qui ne donnent pas l’impression d’unité comme o͐u͐, a͐i͐, etc. ; on ne peut pas prononcer u͐o͐ comme implos. + implos. sans rompre la chaîne, à moins qu’un artifice n’impose à ce groupe l’unité qu’il n’a pas naturellement.

Cette définition de la diphtongue, qui la ramène au principe général des chaînons implosifs, montre qu’elle n’est pas, comme on pourrait le croire, une chose discordante, inclassée parmi les phénomènes phonologiques. Il est inutile de lui faire une case à part. Son caractère propre n’a en réalité aucun intérêt ni aucune importance : ce n’est pas la fin de la sonante qu’il importe de fixer, mais son commencement.

M. Sievers et beaucoup de linguistes distinguent par l’écriture i, u, ü, , , etc. et , , ü̯, r, n, etc. (i̯ = « unsilbisches » i, i = « silbisches » i), et ils écrivent mirta, mai̯rta, mi̯arta, tandis que nous écrivons mirta, mairta, myarta. Ayant constaté que i et y sont de même espèce phonologique, on a voulu avoir avant tout le même signe générique (c’est toujours la même idée que la chaîne sonore se compose d’espèces juxtaposées !). Mais cette notation, bien que reposant sur le témoignage de l’oreille, est au rebours du bon sens et efface justement la distinction qu’il importerait de faire. Par là : 1° on confond i, u ouvrants (= y, w) et i, u fermants ; on ne peut, par exemple, faire aucune distinction entre newo et neuo; 2° inversement, on scinde en deux i, u fermants (cf. mirta et mairta). Voici quelques exemples des inconvénients de cette graphie. Soit l’ancien grec dwís et dusí, et d’autre part rhéwō et rheûma : ces deux oppositions se produisent exactement dans les mêmes conditions phonologiques et se traduisent normalement par la même opposition graphique : suivant que le u est suivi d’un phonème plus ou moins ouvert, il devient tantôt ouvrant (w), tantôt fermant (u). Qu’on écrive du̯is, dusi, rheu̯ō, rheu̯ma, et tout est effacé. De même en indo-européen les deux séries māter, mātrai, māteres, mātrsu et sūneu, sūnewai, sūnewes, sūnusu, sont strictement parallèles dans leur double traitement de r d’une part, de u de l’autre ; dans la seconde au moins l’opposition des implosions et des explosions éclate dans l’écriture, tandis qu’elle est obscurcie par la graphie critiquée ici (sūnu̯e, sūneu̯ai, sūneu̯es, sūnusu). Non seulement il faudrait conserver les distinctions faites par l’usage, entre ouvrants et fermants (u : w, etc.), mais on devrait les étendre à tout le système et écrire, par exemple : māter, mātρai, māteρes, mātrsu ; alors le jeu de la syllabation apparaîtrait avec évidence ; les points vocaliques et les limites de syllabes se déduiraient d’eux-mêmes.

Note des éditeurs. — Ces théories éclairent plusieurs problèmes, dont F. de Saussure a touché quelques-uns dans ses leçons. Nous en donnerons quelques spécimens.

1. M. Sievers cite beritn̥nn̥n (allemand berittenen) comme exemple typique du fait que le même son peut fonctionner alternativement deux fois comme sonante et deux fois comme consonante (en réalité n ne fonctionne ici qu’une fois comme consonante, et il faut écrire beritn̥nn̥ ; mais peu importe). Aucun exemple n’est plus frappant précisément pour montrer que « son » et « espèce » ne sont pas synonymes. En effet, si l’on restait sur le même n, c’est-à-dire sur l’implosion et l’articulation sistante, on n’obtiendrait qu’une seule syllabe longue. Pour créer une alternance de n sonants et consonants, il faut faire suivre l’implosion (premier n) de l’explosion (second n), puis reprendre l’implosion (troisième n). Comme les deux implosions ne sont précédées d’aucune autre, elles ont le caractère sonantique.

2. Dans les mots français du type meurtrier, ouvrier, etc., les finales -trier, -vrier ne formaient autrefois qu’une syllabe (quelle que fût d’ailleurs leur prononciation, cf. p. 85 note). Plus tard on s’est mis à les prononcer en deux syllabes (meurtri-er, avec ou sans hiatus, c’est-à-dire -t᷾r᷾i͐e͐ ou t᷾r᷾i͐y᷾e͐). Le changement s’est produit, non en plaçant un « accent syllabique » sur l’élément i, mais en transformant son articulation explosive et une articulation implosive.

Le peuple dit ouvérier pour ouvrier : phénomène tout semblable, seulement c’est le second élément au lieu du troisième qui a changé d’articulation et est devenu sonant : uvr᷾y᷾e͐uvr͐y᷾e͐. Un e a pu se développer après coup devant l'r sonant.

3. Citons encore le cas si connu des voyelles prothétiques devant s suivi de consonne en français : latin scūtumiscūtum → français escu, écu. Le groupe s᷾k᷾, nous l’avons vu p. 85, est un chaînon rompu ; s͐k᷾ est plus naturel. Mais cet s implosif doit faire point vocalique quand il est au commencement de la phrase ou que le mot précédent se termine par une consonne d’aperture faible. L’i ou l’e prothétiques ne font qu’exagérer cette qualité sonantique ; tout caractère phonologique peu sensible tend à se grossir quand on tient à le conserver. C’est le même phénomène qui se reproduit dans le cas de esclandre et dans les prononciations populaires esquelette, estatue. C’est encore lui qu’on retrouve dans cette prononciation vulgaire de la préposition de, que l’on transcrit par ed : un œil ed tanche. Par syncope, de tanche est devenu d’tanche ; mais pour se faire sentir dans cette position, le d doit être implosif : d͐t᷾anche, et une voyelle se développe devant lui comme dans les cas précédents.

4. Il est à peine nécessaire de revenir sur la question des sonantes indo-européennes, et de se demander par exemple pourquoi le vieux-haut-allemand hagl s’est transformé en hagal, tandis que balg est resté intact. Le l de ce dernier mot, second élément d’un chaînon implosif (ba͐l͐g͐), joue le rôle de consonante et n’avait aucune raison de changer de fonction. Au contraire le l, également implosif, de hagl faisait point vocalique. Étant sonantique, il a pu développer devant lui une voyelle plus ouvrante (un a, s’il faut en croire le témoignage de la graphie). D’ailleurs, elle s’est assombrie avec le temps, car aujourd’hui Hagel se prononce de nouveau ha͐g᷾l͐. C’est même ce qui fait la différence entre la prononciation de ce mot et celle de français aigle ; l'l est fermant dans le mot germanique et ouvrant dans le mot français avec e muet final (e͐g᷾l᷾e)

  1. Il est vrai qu’ils ont écrit Χ, Θ, Φ pour kh, th, ph ; ΦΕΡΩ représente phérō ; mais c’est une innovation postérieure ; les inscriptions archaïques notent ΚΗΑΡΙΣ et non ΧΑΡΙΣ. Les mêmes inscriptions offrent deux signes pour k, le kappa et le koppa, mais le fait est différent : il s’agissait de noter deux nuances réelles de la prononciation, le k étant tantôt palatal, tantôt vélaire ; d’ailleurs le koppa a disparu dans la suite. Enfin, point plus délicat, les inscriptions primitives grecques et latines notes souvent une consonne double par une lettre simple ; ainsi le mot latin fuisse a été écrit FUISE ; donc infraction au principe, puisque ce double s dure deux temps qui, nous le verrons, ne sont pas homogènes et donnent des impressions distinctes ; mais erreur excusable, puisque ces deux sons, sans se confondre, présentent un caractère commun (cf. p. 79 sv.).
  2. Cf. Sievers, Grundzüge der Phonetik, 5e éd. 1902 ; Jespersen, Lehrbuch der Phonetik, 2e éd. 1913 : Roudet, Éléments de phonétique générale, 1910
  3. La description un peu sommaire de F. de Saussure a été complétée d’après le Lehrbuch der Phonetik de M. Jespersen, auquel nous avons aussi emprunté le principe d’après lequel les formules des phonèmes seront établies ci-dessous. Mais il s’agit là de questions de forme, de mise au point, et le lecteur se convaincra que ces changements n’altèrent nulle part la pensée de F. de S. (Ed.).
  4. Fidèle à sa méthode de simplification, F. de Saussure n’a pas cru devoir faire la même distinction à propos de la classe A, malgré l’importance considérable des deux séries K1 et K2 en indo-européen. Il y a là une omission toute volontaire (Éd.).
  5. C'est là un des points de la théorie qui prête le plus à discussion. Pour prévenir certaines objections, on peut faire remarquer que toute articulation sistante, comme celle d'un f, est la résultante de deux forces: 1o la pression de l'air contre les parois qui lui sont opposées et 2o la résistance de ces parois, qui se resserrent pour faire équilibre à cette pression. La tenue n'est donc qu'une implosion continuée. C'est pourquoi, si l'on fait suivre une impulsion et une tenue de même espèce, l'effet est continu d'un bout à l'autre. À ce titre, il n'est pas illogique de réunir ces deux genres d'articulation en une unité mécanique et acoustique. L'explosion s'oppose au contraire à l'une et à l'autre réunies : elle est par définition un desserrement ; voir aussi § 6 (Ed.).
  6. Sans doutes certains groupes de cette catégorie sont très usités dans certaines langues (p. ex. kt initial en grec : cf. ktetnō) ; mais bien que faciles à prononcer, ils n'offrent pas d'unité acoustique (Voir la note suivante).
  7. Ici par une simplification voulue, on ne considère dans le phonème ope sons degré d'aperture, sans tenir compte ni du lieu, ni du caractère particulier de l'articulation (si c'est une sourde ou une sonore, une vibrante ou une latérale, etc.). Les conclusions tirées du principe unique de l'aperture ne peuvent donc pas s'appliquer à tous les cas réels sans exception. Ainsi dans un groupe comme trya les trois premiers éléments peuvent difficilement se prononcer sans rupture de chaîne : t᷾r᷾y᷾a͐ (à moins que le y᷾ ne se fonde avec l'r᷾' en le palatalisant) ; pourtant ces trois éléments try forment un chaînon explosif parfait (cf. d'ailleurs p. 94 à propos de meurtrier, etc.) ; au contraire trwa ne fait pas difficulté. Citons encore des chaînons, comme pmla, etc., où il est bien difficile de ne pas prononcer la nasale implosivement (p᷾m͐l᷾a͐). Ces cas aberrants apparaissent surtout dans l'explosion, qui est par nature un acte instantané et ne souffre pas de retardements. (Ed.)
  8. Il ne faut pas confondre cet élément de quatrième aperture avec la fricative palatale douce (liegen dans l’allemand du Nord). Cette espèce phonologique appartient aux consonnes et en a tous les caractères.