L'écriture tamoule en Unicode
Présentation à partir de la devanâgari
- Le matériau de base
- Composition
- Exemples
Refs Web :
Refs Livres :
-
[KH] Kausalya HART, Christian GHASSARIAN, Tamoul pour débutants - Grammaire (Geuthner - Manuels 1996)
-
[LT30] Learn Tamil in 30 days (Balaji, Madras 1988)
- [JV] Julien VINSON, Manuel de la langue tamoule, Paris 1903 [réimpression Asian Educational Services, new Delhi 1986]
J.V. fut professeur de tamoul aux Langues Orientales. Né et élevé à Karikal et à Pondichéry...
-
Le matériau de base
Côté consonnes
L'écriture tamoule est un abugida, comme la devanâgari, mais
le système phonétique du tamoul est assez différent de celui du sanskrit
qui sert de base à l'écriture devanâgari.
Les occlusives
on retrouve dans l'écriture les 5 séries d'occlusives (vélaires, affriquées, cérébrales, dentales, labiales)
mais au lieu de 5 réalisations (sourde, sourde aspirée, sonore, sonore aspirée, nasale)
on a pour chaque série 2 formes seulement (sourde et nasale) :
Série | Sourde | Nasale |
Vélaires |
க (k - क ) |
ங (ṅ - ङ ) |
Affriquées |
ச (c - च ) |
ஞ (ñ - ञ ) |
Cérébrales |
ட (ṭ - ट ) |
ண (ṇ - ण ) |
Dentales |
த (t - त ) |
ந (n - न ) |
Labiales |
ப (p - प ) |
ம (m - म ) |
Du côté des analogies, il est à noter que cet ordre de présentation est aussi celui du tamoul,
et que l'emploi des consonnes nasales suit le modèle de la devanâgari,
mais sans homologue de l'anusvâra.
Du point de vue phonologique, il n'y a pas d'aspirées (caractère typiquement dravidien [Wikipedia],
et contrairement aux autres langues indiennes),
et la distinction entre les occlusives sourdes et sonores est affaire de position
(règles précises dans le Tolkâppiyam) :
- sourdes à l'initiale
avec un cas particulier pour ச prononcé s
- sonores après voyelles
- sonores après nasales
- les redoublées sont sourdes : donc en pratique, ailleurs qu'à l'initiale les sourdes s'écrivent redoublées !
Ainsi (voir plus loin le rôle du point suscrit, qui tient lieu du virâma) :
-
ச்ச se prononce tcha, ஞ்ச se prononce ndja
- ங est toujours suivi de க et se prononce nga. Exemple : sangam = caṅkam சங்கம்
- contrairement à l'usage sanscrit, ஞ apparaît à l'initiale : ஞாபகம் ñâbaham = le souvenir
-
Les autres consonnes ayant une correspondante en devanâgari
sont (dans l'ordre de la devanâgari qui est aussi celui du tamoul) :
le yod ய (y - य ), le r 'normal' ர (r - र) , le l 'normal' ல (l - ल ), le v வ (v - व ).
Le tamoul a aussi un ḷ rétroflexe ள correspondant au ळ
de la devanâgari
(rare en sanscrit, utilisé en marathi).
On note avec intérêt l'absence des deux chuintantes (ś - श et ṣ - ष ), de la sifflante (s - स )
et du h ह (qui réapparaîtront avec les grantha).
Consonnes inconnues de la devanâgari
En revanche, le tamoul possède une consonne originale ழ
(le l de tamil = தமிழ்
aussi translittérée zh...)
Selon Wikipedia,
on le croit propre au tamoul et à son dérivé le malayalam.
Et aussi un r ற, et un n ன
supplémentaires (tranlittérés ṟ et ṉ)
Quelles sont leurs valeurs, leurs rôles, leurs fonctions ?
Il faut voir du côté des translittérations !
Le ன est censé être alvéolaire [KH] plutôt que rétroflexe. Il apparaît en finale de American = அமெரிக்கன்
N.B. Que ண soit bien la nasale de la série rétroflexe est attesté par son rôle dans la nasalisation de ட.
On a donc affaire à trois niveaux : dentale, alvéolaire, rétroflexe, autre trait typiquement dravidien [Wikipedia].
-
Les 5 lettres supplémentaires grantha
N.B. Grantha désigne à proprement parler une écriture du sud de l'Inde, dérivée de la brahmi,
antérieure à l'alphabet tamoul et utilisée pour écrire le sanscrit.
Il ne s'agit ici que de quelques caractères qui sont passés de cette écriture ancienne dans le tamoul
standard pour noter les mots sanscrits (et quelques autres, dont les emprunts à l'anglais !)அ
ஜ (j - ज), ஷ (ṣ - ष), ஸ (s - स), ஹ (h - ह)
et la ligature கஷ (kṣ - क्ष) donnée par les tables mais décomposée en Unicode (க + ஷ).
- Le signe supplémentaire ak (ஃ) transforme le p (ப) et le j (ஜ) :
பஃ se prononce fa et ஜஃ se prononce za
- Un autre discours sur la phonologie du tamoul (extrait de Wikipédia-fr) :
Le tamoul comporte cinq consonnes rétroflexes : ṭ, ḍ, ṇ, ṣ et ḷ, dites
"fortes",
qui sont prononcées en repliant la langue vers le palais et
en effectuant un claquement.
Les lettres ஷ (ṣa), ஸ (sa), ஜ (dja), க்ஷ
(kṣa), ஶ (cha) et ஹ (ha)
n'appartiennent pas à proprement parler à
l'alphabet tamoul,
mais sont empruntées au grantha pour noter des sons
particuliers,
souvent dans des mots empruntés au sanskrit.
Ces lettres
sont d'un usage relativement courant, mais on pourra également en
trouver bien d'autres,
de façon très sporadique, qui ne sont par
ailleurs même pas prévues pour Unicode.
Côté voyelles
le système est voisin de celui de la devanâgari (mais pas identique)
du point de vue d'Unicode, la même règle s'applique: on écrit le matra après la consonne dans tout les cas
le placement du signe graphique avant ou après, ou des deux côtés, est l'affaire du logiciel d'affichage
(ici, le navigateur qui interprète cette page Web).
- Trois voyelles de base brèves ou longues : a அ / ஆ, i இ / ஈ, u உ / ஊ,
dont les matras sont suffixées
(mais avec plus de variété dans le graphisme qu'en devanâgari, voir plus loin).
Ex. de base : ka க, kā கா, ki கி, kī கீ, ku கு, kū கூ.
- Pas de r ni de l voyelle.
- Les ex-diphtongues e எ et o ஒ apparaissent avec leur formes longues ஏ et ஓ
Les matras des deux e sont préfixés (comme en bengali le e et le oi) : ke கெ, kē கே
ceux des deux o sont les mêmes avec en plus celui du a long suffixé : ko கொ, kō கோ.
(là aussi, comme pour le o et le ou en bengali).
- Enfin deux vraies diphtongues ai ஐ et au ஔ,
dont les matras suivent la mode du e et du o respectivement : kai கை, kau கௌ.
Exemple : சென்னை ceṉṉai = Chennai, l'ancienne Madras
- Note sur la prononciation de voyelles :
le u bref en position finale est prononcé e
(e français, pas é)
- Encore un autre discours sur le système du tamoul (extrait de Wikipedia-script) :
The vowels are divided into short and long (five of each type) and two diphthongs.
The consonants are classified into three categories with 6 in each category: vallinam - hard,
mellinam - soft or nasal, and idayinam - medium.
Tamil has neither conjunct consonants nor aspirated and voiced stops.
Because of this, the Tamil script, unlike Devanagari, does not have any glyphs for these sounds.
Some scholars have suggested that in Sentamil (which refers to Tamil as it existed
before Sanskrit words were borrowed), stops were voiceless when at the start of a word
and sometimes voiced otherwise allophonically.
However, no such distinction is observed by modern Tamil speakers.
-
Questions de transcription en alphabet latin.
- On peut bien entendu étendre au tamoul la transcription savante en usage pour le sanscrit.
Le choix des signes diacritiques ajoutés aux caractères latins provient de deux sources :
- la correspondance "naturelle" entre lettres tamoules et lettres devanâgari, indiquée ci-dessus
- l'emploi d'un soulignement au lieu du point souscrit pour les lettres du tamoul
inconnues de la devanâgari : ṉ pour ன, ṟ pour ற et ḻ pour le fameux ழ.
C'est ce système qui est employé ici.
Il est clair, précis, et grâce à Unicode il ne présente aucune difficulté d'emploi.
- La transcription savante a l'inconvénient de nécessiter des caractères hors de l'ASCII 7 bits.
De plus, sa rigidité l'empêche de tenir compte des règles phonologiques du tamoul,
et de ce fait elle impose un Sprachbild qui heurte la sensibilité des locuteurs.
(Cet inconvénient est moindre dans le cas du sanskrit, où le principe "un signe - un son"
est grosso modo respecté.)
On trouvera donc souvent un autre système, ainsi décrit par le prof. C.R. Krishnamurti
dans l'introduction à la série
Thamizh Literature Through the Ages (§ 1.2.3)
...the Thamizh vowels (உயிர் எழுத்துக்கள்) and their
corresponding English equivalents (in parentheses) are as follows: அ
(a), ஆ(A), இ(i), ஈ(I), உ (u), ஊ(U), எ(e), ஏ(E), ஐ (ai), ஒ(o),
ஓ(O), ஔ(au), ஃ (ah). The compound consonants (உயிர்மெய் எழுத்துக்கள்),
derived from the combination of the vowels and the primary consonants
(with the superimposed dot) are represented as follows: ka (க), kA
(கா), ki (கி), kI (கீ) , ku (கு), kU (கூ), ke (கெ), kE (கே), kai
(கை), ko (கொ), kO (கோ) , kou (கௌ). Other members of the series
are: க (ka, ga), ங (nga), ச (cha,ca,sa), ஞ
(nya), ட (ta,da), ண(Na), த (tha,dha), ந (n^a), ப
(pa,ba), ம (ma), ய (ya), ர (ra) , ல (la), வ (va), ழ (zha,za), ள
(La), ற (Ra), ன(na).
In this system the flexibility of differential phonetics for consonants
(க, ச, ட, த, ப) renders it possible to pronounce proper names and
borrowed words according to current usage. It is relevant to emphasize
that differences in the pronunciation of Thamizh letters and words do
exist depending on regions and castes. In order to streamline the
written language, especially for transliteration purposes, it is
necessary to standardize the correct pronunciation of names with the
help of a panel of experts.
- Le même système est employé (avec modifications) par le dictionnaire tamoul de l'université de Cologne
(Cologne Online Tamil Lexicon).
- Échantillon comparatif : dans la même introduction, on lit au § 1.2.2 :
several authors with the names n^akkIrar (நக்கீரர்) Kampan (கம்பன்) and ouvaiyAr (ஒளவையார்)
et si on suit le lien "ouvaiyAr" on arrive sur un titre "Auvaiyar & her Writings"...
Je préfère donc m'en tenir à ṅkkīrar, kampaṉ et auvaiyār.
Les règles de composition
-
L'absence de voyelle
est notée systématiquement par le virâma (en forme de point suscrit) : pas de ligatures !!!
En Unicode, ce caractère s'écrit bien entendu après la consonne.
Exemple : catamaran vient de kattu maram, கட்டு மரம் = "bundled logs"
Noter que le r ர est censé perdre son "pied" en prenant le virâma :
ர்
[ce que négligent Safari et TextEdit, mais à en juger d'après [KH] la chose est optionnelle]
- En revanche les matras des voyelles donnent lieu à une floraison de dessins qu'il faut énumérer.
On peut distinguer le cas "régulier", par exemple la série du p :
pa ப, pâ பா, pi பி, pī பீ, pu பு, pū பூ,
pe பெ, pē பே, pai பை, po பொ, pō போ, pau பௌ.
On peut constater qu'elle est parfaitement homologue de la série du k, sauf pour les deux u :
ka க, kā கா, ki கி, kī கீ, ku கு, kū கூ,
ke கெ, kē கே, kai கை, ko கொ, kō கோ, kau கௌ.
De tels écarts dépendent et de la consonne et de la voyelle.
En s'inspirant de la page Omniglot sur l'écriture tamoule, on ne donnera que les "combinaisons non-standard".
Mais attention ! Selon [KH p. 23], un nouvel usage a récemment remplacé celui qu'illustre [LT30].
Clairement, Safari et TextEdit suivent le nouvel usage !
- Série du a long : ṇā ணா, ṟā றா. [nouvel usage]
- Série du i bref : ṭi டி, et du i long : ṭī டீ.
- La série du u bref est très variable : ku கு, cu சு, ñu ஞு, ṭu டு, ṇu ணு,
tu து, nu நு, mu மு, ru ரு, lu லு, ḷu ளு, ṟu று, ḻu ழு, ṉu னு,
ju ஜு, ṣu ஷு, su ஸு, hu ஹு.
[nouvel usage, cf. [KH p. 25 ]
- idem pour le u long : kū கூ, ñū ஞூ, ṇū ணூ,tū தூ, nū நூ, mū மூ, rū ரூ, lū லூ,
ḷū ளூ, ṟū றூ, ḻū ழூ, ṉū னூ,
jū ஜூ, ṣū ஷூ, sū ஸூ, hū ஹூ.[sur les 4 grantha Safari et TextEdit ne sont pas conformes ]
- Série du ai : ṇai ணை, lai லை, ḷai ளை, ṉai னை. [nouvel usage]
- Séries du o et du ō : mêmes phénomènes que pour le a long.
Exemples
- Tirés du rapport de Cyril Rassou
அவன் avaṉ = le pronom personnel il - au féminin : elle = அவள் avaḷ
அப்பா appā = papa - au féminin : maman = அம்மா ammā
மணி maṇi = heure - நல்ல nalla = bon
ஆடு āṭu = chèvre - காது kātu = oreille
இருக்க irukka = être (verbe faible à l'infinitif, d'après Wikipédia)
படிக்க paṭikka = lire, apprendre
பில்லை pillai = fils - தம்பி tampi = jeune frère
பூ pū = fleur -
ஐநது aintu = cinq -
பையன் paiyaṉ = garçon - au féminin : fille = பெண் peṇ
- Sur un sac provenant du passage Brady :
வேலன் ஸ்தாபனம் = Velan SARL // மளிகை வியாபாரம்
ஊதுவத்திகள் / ஊறுகாய்கள்/ / அரிசி வகைகம் / பருப்பு வகைகம்
-
L'exemple महोदय discuté sur le site Acharya : மஹொதய
Transcription de Mahâtmâ Gândhi மகாத்மா காந்தி
- Divers
pays = நாடு nāṭu, d'où le nom officiel Tamil Nadu = தமிழ் நாடு
தொல்காப்பியம் = le Tolkâppiyam, premier monument de la langue (200 av. JC - une grammaire en vers !)
disponible en pdf auprès du projet Madurai.
சிலப்பதிகாரம் = le Cilappatikâram, première épopée en tamoul (200 ap. JC)
disponible en UTF-8 auprès du projet Madurai.
- Termes grammaticaux :
lettre = eḻuttu எழுத்து d'où தமிழ் எழுத்து l'alphabet tamoul, உயிர் எழுத்து voyelle (உயிர் uyir = vie)
- L'exemple de texte tamoul proposé par Wikipédia-fr :
மனிதப் பிறவியினர் சகலகரும் சதந்கிரமாகவ அவர்கன் மகிப்பிலும் உரிமைகளிம் சமமானவர்கள்.
- Le (début du) texte proposé par Wikipedia :
- ஆசிரியர் வகுப்பறையுள் நுழைந்தார். āciriyar vakuppaṟaiyuḷ nuḻaintār. Le professeur entra dans la classe.
ஆசிரியர் nom. pl. suff. -ar (honorifique - sg. inusité, cf. [LT30 p. 66])
வகுப்பு la salle de classe, suffixes -aṟai
et -uḷ introuvables dans [KH] , -y- euphonique [KHp. 36]
நுழைந au passé (groupe 2 : suffixe -t), 3è p. honorifique terminaison -ār