La classification des langues révèle un monde linguistique d’une richesse étonnante. Selon Ethnologue, nous cohabitons avec 7 151 langues activement parlées, regroupées en 142 familles distinctes. Cette diversité extraordinaire témoigne de la créativité humaine à travers les millénaires.
Quand nous explorons la classification des langues du monde, nous découvrons que la famille indo-européenne domine avec plus de 3,3 milliards de locuteurs. Cependant, cette réalité ne représente qu’une facette de notre paysage linguistique. En effet, les familles sino-tibétaine, afro-asiatique, niger-congo et austronésienne complètent ce tableau des langues les plus parlées. Ainsi, nous pouvons organiser ces différentes langues selon trois approches principales : généalogique (basée sur les racines historiques), aréale (selon la proximité géographique) ou typologique (d’après les caractéristiques structurelles).
Dans ce guide, nous explorerons notamment la typologie introduite par les frères Schlegel au début du XIXe siècle, qui distingue les langues isolantes (comme le chinois), agglutinantes (comme le turc), flexionnelles (comme le français) et polysynthétiques (comme le yupik). Ces catégories nous aideront à comprendre comment les langues du monde s’organisent et fonctionnent.
Origines historiques de la classification des langues
La naissance des typologies linguistiques s’inscrit dans l’histoire intellectuelle du XIXe siècle, période marquée par une volonté de comprendre et d’organiser le monde. Avant cette époque, les tentatives de classification des langues restaient limitées et souvent teintées de considérations religieuses ou philosophiques.
Le comparatisme et les frères Schlegel
L’émergence du comparatisme linguistique constitue un tournant majeur dans l’histoire de la classification des langues. Cette approche, qui s’est développée entre 1810 et 1875, visait initialement à établir des liens de parenté entre différentes langues éloignées dans le temps et l’espace. Ce n’est que vers 1860 que cette grammaire comparée s’est véritablement transformée en linguistique historique, cherchant à reconstituer les évolutions entre une langue ancienne et ses descendantes.
La découverte du sanskrit par des érudits anglais à la fin du XVIIIe siècle a joué un rôle déterminant. William Jones (1746-1794), fondateur de la Société asiatique en 1784, fut le premier à souligner l’importance de cette découverte en remarquant que le sanskrit, le latin et le grec présentaient des « affinités tant dans les racines des verbes que des formes de la grammaire, qui ne pouvaient pas être dues au simple hasard ».
C’est cependant aux frères Schlegel que l’on doit la première véritable classification typologique des langues. En 1808, Friedrich von Schlegel (1772-1829) propose dans son ouvrage Über die Sprache und Weisheit der Indier une première distinction entre différents types de langues. Son frère, August Wilhelm von Schlegel (1767-1845), complète cette approche en 1818 dans ses Observations sur la langue et la littérature provençales, en distinguant trois classes fondamentales de langues. Ensemble, ils établissent une typologie morphologique qui classe les langues en fonction de la manière dont les mots se forment : langues isolantes, agglutinantes et flexionnelles.
Cette classification révolutionnaire s’inscrit dans le mouvement comparatiste alors en plein essor. À la même époque, d’autres linguistes comme Franz Bopp définissent le champ de la grammaire comparée, décrivant la langue comme un « organisme vivant » qui naît, se développe, puis se dégrade.
L’évolution des typologies linguistiques
Au fil du temps, cette première typologie s’est considérablement enrichie et affinée. Wilhelm von Humboldt introduit plus tard les langues polysynthétiques comme quatrième catégorie, caractérisées par un degré supérieur de synthétisme. Cette appellation, bien que traditionnellement qualifiée de « morphologique », possède en réalité une dimension morphosyntaxique, puisque le système morphologique est étroitement lié au système syntaxique.
Au XXe siècle, Edward Sapir précise et diversifie la typologie morphologique, en s’intéressant particulièrement à la façon dont la structure morphologique des mots exprime les rapports entre eux dans la phrase. Cette évolution marque un changement important : on passe d’une vision purement classificatoire à une analyse plus fine des mécanismes linguistiques.
En outre, les recherches récentes montrent que les différentes familles linguistiques suivent des chemins d’évolution distincts. Une étude menée par des scientifiques de l’Institut Max Planck de psycholinguistique révèle que l’ordre des mots dans les langues de diverses familles se développe de manières variées, remettant en question l’idée de règles universelles innées. Ainsi, contrairement aux théories de Noam Chomsky sur une faculté de langage innée, ces résultats suggèrent que « l’évolution culturelle a bien plus d’influence sur le développement du langage que les facteurs universels ».
Cette évolution des typologies linguistiques témoigne d’un glissement progressif d’une approche purement taxonomique vers une compréhension plus complexe et nuancée de la diversité des langues humaines.
Langues isolantes : une information par mot
Dans l’univers de la classification des langues, les langues isolantes représentent une catégorie fascinante qui fonctionne selon des principes radicalement différents des langues plus familières aux locuteurs européens. Ces langues constituent un exemple parfait de la diversité structurelle qui caractérise les différentes langues du monde.
Définition et fonctionnement
Les langues isolantes se distinguent par leur degré maximal d’analytisme. Dans ces langues, chaque mot est généralement invariable et correspond à un seul morphème, c’est-à-dire la plus petite unité porteuse de sens. Contrairement aux langues flexionnelles comme le français, les mots ne changent pas de forme pour exprimer des variations grammaticales telles que le temps, le genre ou le nombre.
Le linguiste Joseph Greenberg a développé une méthode pour mesurer ce qu’il appelle le « degré de synthèse » des langues, calculé en divisant le nombre de morphèmes par le nombre de mots sur des échantillons de cent mots. Plus l’indice est petit, plus la langue est analytique ou isolante. Par exemple, le vietnamien, avec un degré de synthèse de 1,06, est considéré comme une langue nettement isolante.
En effet, dans les langues isolantes, les rapports syntaxiques s’expriment principalement à l’aide de mots-outils indépendants (particules, prépositions) et de l’ordre des mots. Cette structure contraste fortement avec les langues synthétiques où les relations grammaticales sont indiquées par des affixes. Ainsi, au lieu de modifier un mot pour exprimer une nouvelle idée, les langues isolantes ajoutent simplement un autre mot.
La position des mots dans la phrase joue un rôle crucial dans la détermination du sens. Les mots étant invariables, c’est leur agencement qui permet de comprendre les relations entre eux. Par conséquent, la syntaxe devient l’élément clé pour déterminer la fonction de chaque mot dans l’énoncé.
Exemples : chinois, vietnamien, birman
Le chinois mandarin représente l’exemple par excellence des langues isolantes. Prenons une phrase simple en chinois : « wǒ chī fàn le » qui se traduit en français par « j’ai mangé ». Dans cette construction, chaque élément apporte une information spécifique : « wǒ » signifie « je/moi », « chī » correspond au verbe « manger », « fàn » désigne le « repas/nourriture », et « le » est une particule qui marque l’aspect accompli, équivalant au passé.
Ce qui est particulièrement remarquable, c’est qu’en chinois, le verbe « chī » (manger) reste identique quelle que soit la personne ou le temps. Contrairement au français où le verbe se conjugue (je mange, tu manges, j’ai mangé), le chinois utilise des mots supplémentaires pour indiquer ces variations. De même, pour exprimer le pluriel, les langues isolantes n’ajoutent pas un suffixe comme le « s » en français, mais utilisent plutôt un mot distinct.
Parmi les autres exemples notables de langues isolantes figurent le vietnamien, considéré comme très proche de l’idéal isolant avec son degré de synthèse de 1,06, ainsi que le birman, le thaï et le tibétain. Le coréen est également mentionné comme une langue fortement isolante.
Toutefois, il convient de noter qu’aucune langue n’est « purement » isolante. Même le chinois présente des exceptions à cette règle générale. Par exemple, le chinois moderne (mandarin) contient des mots dérivés et composés comme « fù-mǔ » (parents, littéralement « père-mère ») ou « zhěn-tóu » (oreiller, littéralement « repos-tête »), ce qui élève son degré de synthèse à 1,54 et en fait une langue modérément isolante. En fait, le chinois classique était plus isolant que le mandarin moderne.
Cette caractéristique des langues isolantes ne les rend pas nécessairement plus simples à apprendre. Bien que l’absence de conjugaisons et d’accords grammaticaux puisse sembler un avantage, d’autres aspects comme l’importance du contexte, l’ordre des mots rigide et, dans le cas du chinois, les variations tonales, ajoutent des niveaux de complexité différents mais tout aussi considérables.
Langues agglutinantes : les affixes en action
Les langues agglutinantes occupent une place singulière dans la classification des langues du monde. Contrairement aux langues isolantes où chaque mot porte une seule information, les langues agglutinantes construisent leur richesse par l’assemblage méthodique d’éléments grammaticaux.
Principe de construction
Le terme « agglutinant » vient du verbe latin « agglutinare » qui signifie « coller ensemble », une métaphore parfaite pour décrire leur fonctionnement. Ce concept a été utilisé pour la première fois en 1836 par le linguiste allemand Wilhelm von Humboldt. Dans une langue agglutinante, les mots se forment à partir d’une racine lexicale qui porte le sens principal, à laquelle on ajoute plusieurs affixes (préfixes, suffixes ou infixes). Chaque affixe apporte une information grammaticale précise et reste généralement invariable.
Ce qui caractérise particulièrement ces langues est leur principe fondamental : un affixe ne peut exprimer qu’une seule information à la fois. En outre, la forme de l’affixe reste identique quel que soit le mot auquel il s’attache. Ainsi, contrairement au français où le pluriel peut s’exprimer de différentes manières (arbre→arbres, hibou→hiboux), les langues agglutinantes utilisent toujours le même affixe pour une fonction donnée.
La richesse morphologique des langues agglutinantes est remarquable. En turc, par exemple, on peut combiner jusqu’à 12 suffixes, créant des mots d’une grande complexité informationnelle. Cette caractéristique permet d’exprimer en un seul mot ce qui nécessiterait une phrase entière dans d’autres langues.
Exemples : turc, japonais, finnois
Le turc représente l’exemple parfait de langue agglutinante. Prenons le mot « ev » (maison) : on peut y ajouter « ler » pour former le pluriel (evler = maisons), puis « im » pour indiquer la possession (evlerim = mes maisons), et encore « de » pour exprimer la localisation (evlerimde = dans mes maisons). Cette construction progressive permet de créer des mots complexes comme « evlerimdekiler » (ceux qui sont dans mes maisons).
En finnois, la logique est similaire. Le mot « taloissani » (dans mes maisons) se décompose en « talo » (maison), « i » (marque du pluriel), « ssa » (inessif signifiant « dans ») et « ni » (possesseur première personne).
Le japonais, également agglutinant, présente quelques particularités. La phrase « samukunakatta deshō ne » (Il ne faisait pas froid, n’est-ce pas?) combine plusieurs morphèmes : « samuku » (froid), « naku » (négation), « ari » (être), « ta » (passé), « deshō » (conditionnel adoucissant) et « ne » (particule interrogative).
D’autres langues agglutinantes incluent le hongrois, le coréen, le basque, le géorgien, le swahili et les langues dravidiennes. Cette façon de construire les mots, par ajouts successifs d’éléments grammaticaux, offre une flexibilité remarquable tout en suivant des règles systématiques, ce qui constitue l’une des expressions les plus fascinantes de la diversité linguistique mondiale.
Langues flexionnelles : la fusion des formes
Au cœur de la classification des langues du monde se trouvent les langues flexionnelles, caractérisées par un phénomène linguistique fascinant : la fusion des formes. Ces langues, parmi les plus répandues en Europe, montrent une complexité morphologique singulière où les mots se transforment selon leur fonction grammaticale dans la phrase.
Différences avec les langues agglutinantes
Contrairement aux langues agglutinantes où les morphèmes s’ajoutent clairement à un radical qui peut exister seul, les langues flexionnelles présentent une structure plus complexe et moins prévisible. Dans une langue flexionnelle, la frontière entre le radical et les affixes devient souvent floue, voire impossible à distinguer. Par ailleurs, un même affixe peut exprimer simultanément plusieurs informations grammaticales différentes.
Prenons l’exemple du latin, langue hautement flexionnelle. Dans la forme « Cæsaris » (de César), la désinence « -is » indique à la fois le cas génitif et le nombre singulier. Cette fusion des informations grammaticales contraste nettement avec les langues agglutinantes où chaque affixe n’exprime généralement qu’une seule information. En outre, le même cas grammatical peut s’exprimer par des désinences différentes selon les mots : « Cæsaris » utilise « -is » pour le génitif singulier, tandis que « boni » utilise « -i » pour le même cas.
Les langues flexionnelles se distinguent également par un phénomène appelé « flexion interne », où la modification ne se fait pas par simple ajout d’affixes, mais par changement phonétique du radical lui-même. Ainsi, en français, le pluriel de « cheval » devient « chevaux », montrant une transformation interne au mot.
Exemples : français, latin, russe
Le français illustre parfaitement cette nature flexionnelle. La lettre « s » y joue des rôles multiples : marque du pluriel dans « arbres », de la deuxième personne dans « tu chantes » ou encore de la première personne dans « je fais ». Cette polyvalence des affixes est caractéristique des langues flexionnelles.
Le latin représente un cas extrême avec ses déclinaisons complexes. La série « bonus dominus » (bon maître), « boni domini » (du bon maître), « bonos dominos » (les bons maîtres à l’accusatif) montre comment les terminaisons varient pour exprimer simultanément le cas, le genre et le nombre.
Le russe, avec son système de cas élaboré, offre un autre exemple frappant. Le mot « dom » (maison) se transforme en « doma » au génitif singulier, « domu » au datif singulier et « domov » au génitif pluriel. Cette richesse morphologique permet aux langues flexionnelles une syntaxe plus souple : l’ordre des mots importe moins puisque les relations entre les termes sont indiquées par les flexions.
Toutes les langues indo-européennes, à l’exception de l’arménien, sont flexionnelles à différents degrés, ce qui témoigne de l’importance de ce type dans la classification des différentes langues humaines.
Langues polysynthétiques : une phrase en un mot
Pour compléter notre panorama de la classification des langues, nous explorerons maintenant le cas le plus extrême : les langues polysynthétiques. Ces langues constituent un phénomène linguistique fascinant où l’expression atteint son niveau maximal de synthèse.
Caractéristiques extrêmes
Les langues polysynthétiques se distinguent par leur capacité à exprimer en un seul mot ce qui nécessiterait une phrase entière dans d’autres langues. Cette notion a été proposée par Peter Stephen Du Ponceau dès 1816 pour caractériser la structure des langues d’Amérique. Sa définition originelle reste éclairante : une forme « dans laquelle le plus grand nombre d’idées sont comprises dans le plus petit nombre de mots ».
Bien que la catégorie des langues polysynthétiques ne fasse pas partie de la typologie initiale proposée par les frères Schlegel, elle a été ajoutée par August Friedrich Pott en 1849. Ces langues poussent le principe d’agglutination à son extrême, au point où la distinction entre mot et phrase devient floue.
Dans les langues polysynthétiques, les verbes présentent des formes multiples reflétant simultanément le sujet et l’objet. Cette richesse morphologique s’obtient notamment par l’incorporation, procédé permettant de combiner plusieurs morphèmes lexicaux en un seul mot. Cependant, il convient de noter que toutes les langues polysynthétiques ne sont pas incorporantes et inversement.
Exemples : yupik, inuktitut
Les langues yupik, parlées en Alaska et à l’extrémité de la Sibérie orientale, illustrent parfaitement ce phénomène. Elles « synthétisent » une racine et différents affixes grammaticaux pour créer de longs mots à valeur de phrase. Prenons l’exemple du yupic : « angyaghllangyugtuq » signifie « il veut acquérir un grand bateau », combinant « angya » (bateau), « ghlla » (grand), « ng » (acquérir), « yug » (vouloir) et « tuq » (lui/il).
L’inuktitut, parlé au Canada (Nunavut, Nunavik, Labrador), offre des exemples encore plus saisissants. Le mot « Tusaatsiarunnanngittualuujunga » signifie « je n’entends pas très bien ». Il se décompose en « Tusaa- » (entendre) suivi de cinq suffixes : « tsiaq- » (bien), « -junnaq- » (être capable de), « -nngit- » (négation), « -tualuu- » (beaucoup) et « -junga » (marque de la première personne et du présent).
Il faut néanmoins reconnaître que cette définition des langues polysynthétiques reste controversée dans la classification des langues du monde. En effet, il est souvent difficile de déterminer avec précision la part de polysynthétisme d’une langue, particulièrement pour celles n’ayant pas de tradition écrite. Par ailleurs, contrairement à une idée reçue, les phrases dans ces différentes langues ne se limitent généralement pas à un seul mot, même si certains mots peuvent équivaloir à des phrases complètes.
Au terme de ce voyage à travers la diversité linguistique mondiale, nous constatons que la classification des langues révèle bien plus qu’une simple taxonomie. En effet, chaque type linguistique – isolant, agglutinant, flexionnel ou polysynthétique – témoigne des multiples façons dont l’humanité a développé ses moyens de communication. Cette richesse linguistique reflète, sans aucun doute, notre capacité d’adaptation et notre créativité collective à travers les âges.
Bien que les premières classifications aient émergé au XIXe siècle grâce aux travaux pionniers des frères Schlegel, la compréhension des mécanismes linguistiques s’est considérablement affinée depuis. Notamment, les recherches récentes remettent en question l’idée de règles universelles innées, suggérant plutôt que l’évolution culturelle joue un rôle prépondérant dans le développement des langues. Par conséquent, chaque famille linguistique suit son propre chemin évolutif, façonné par son contexte historique et culturel.
Il convient de souligner qu’aucune langue n’appartient entièrement à une seule catégorie. Même le chinois, souvent cité comme exemple parfait de langue isolante, présente des exceptions à cette règle générale. De même, les langues flexionnelles comme le français contiennent des éléments isolants, tandis que certaines langues agglutinantes peuvent présenter des caractéristiques polysynthétiques. Ainsi, cette classification constitue davantage un spectre qu’une série de catégories hermétiques.