Note sur le traitement l'alphabet géorgien par Unicode

Supplément au cours n°4

Le traitement du géorgien dans Unicode mérite d'être analysé car il offre un exemple frappant d'interaction entre une histoire, des pratiques, et les outils informatiques.
Comme la documentation disponible évolue très rapidement, il est utile de dater cette page : 24/11/2010.
  1. Majuscules et minuscules : affaire de polices ?
  2. Autres formes de l'écriture géorgienne
  3. Unicode
  4. Conclusion

  1. Majuscules et minuscules : affaire de polices ?

  2. Autres formes de l'écriture géorgienne

  3. Unicode

    1. La position prise inititalement par Unicode, extraite du rapport sur la version 3.1., qui concerne le bloc géorgien U+10A0 – U+10FF.

      Script Forms. The Georgian script originates from an inscriptional form called Asomtavruli, from which was derived a manuscript form called Nuskhuri. Together these forms are categorized as Khutsuri (ecclesiastical), but Khutsuri is not itself the name of a script form. Although no longer seen in most modern texts, the Nuskhuri style is still used for liturgical purposes. It was replaced, through a history now uncertain, by an alphabet called Mkhedruli (military), which is now the form used for nearly all modern Georgian writing.

      Case Forms. The Georgian alphabet is fundamentally caseless, and is used as such in most texts. However, possibly owing to the influence of case forms in other alphabets, modern Georgian is occasionally written with uppercase capital letters. In this typographic departure, it is the Asomtavruli forms that serve to represent uppercase letters, while the lowercase is Mkhedruli or Nuskhuri. This usage parallels the evolution of the Latin alphabet, in which the original linear monumental style came to be considered uppercase, while manuscript styles of the same alphabet came to be represented as lowercase. The Unicode encoding of Georgian follows the Latin analogy: the range U+10A0..U+10CF is used to encode the uppercase capital forms (Asomtavruli), and the basic alphabetic range U+10D0..U+10FF may be regarded as lowercase (Mkhedruli or Nuskhuri). In lowercase (i.e. normal caseless) Georgian text, Mkhedruli or Nuskhuri are distinguished via font, as are regular and italic forms in Latin lowercase.

      Soulignons deux points :
      1. Unicode a bien été guidé par l'analogie avec le bicaméralisme latin.
      2. La série des GEORGIAN CAPITAL LETTERs vise explicitement l'écriture asomtavruli,
        tandis que pour les minuscules la distinction entre mkhedruli et nuskhuri est laissée au choix de la police,
        "comme pour l'italique".

    2. Dans la version 4.1 d'Unicode, le bloc Georgian a été complété par un supplément consacré à l'ancienne écriture minuscule nuskhuri.
      [Georgian Supplement (U+2D00 - U+2D2F)].
      Citation extraite de la documentation sur Unicode 4.1.0 (Notable Changes...)

      The Nuskhuri forms of Khutsuri Georgian have been added in a new Georgian Supplement block (U+2D00..U+2D2F). Those characters are now to be taken as the lowercase pairs of the Asomtavruli Georgian encoded at U+10A0..U+10C5. This introduction of case pairs for Khutsuri is a change from the previous documentation about Georgian in the standard.

      Le choix de minuscule entre mkhedruli et nuskhuri, qui était auparavant affaire de police, devient maintenant exprimable dans le choix des numéros Unicode eux-mêmes. C'est reconnaître qu'il s'agit bien de deux écritures différentes.
  4. Conclusion

    Le système actuel (Unicode 6.0) conserve les mêmes dispositions que 4.1., avec
    Voyez le bloc Georgian et le bloc Georgian Supplement.

    Par conséquent :
    Force est de constater que le système ne permet pas au scripteur de préciser ses intentions sans faire d'hypothèses sur la police que le logiciel d'affichage emploiera. Par exemple, la page de démonstration du Thesaurus Indogermanischer Text- und Sprachmaterialien (TITUS), qui annonce du texte en asomtavruli, est obligée de préciser (en bas de page) qu'une police idoine est nécessaire...
    D'où l'incomplétude de la recommandation d'Alan Wood au sujet du bloc géorgien, qui ne dit rien des majuscules :

    The characters in this range should be used for the secular, caseless Mkhedruli script; for the ecclesiatical, cursive Nuskhuri script, the characters in the Georgian Supplement range should be used.


    Certes, la norme promulguée par Unicode est sans ambiguïté, et dans toute police conforme au standard la zone U+10A0 – U+10C5 doit contenir les glyphes asomtavruli et non pas mtavruli.
    Pour revenir à notre exemple initial, Arial Unicode MS est conforme, BPG Glaho  Arial V5 ne l'est pas !

    La pratique courante doit donc se limiter à la zone U+10D0 – U+10FB, qui est à coup sûr de la minuscule mkhedruli, et on se gardera d'appliquer la transformation toUpperCase !