Cours PLURITAL 2014-2015

Cours n° 2  (mise à jour du 13 octobre 2014)

Jean-François Perrot

Caractères, écrans, claviers


  1. I. Position du problème
    1. Communication ?
    2. Lire un (fichier) texte ?
    3. Écrire un (fichier) texte ?
    4. Un historique

  2. II. Typographie
    1. Notions succinctes sur la typographie [introduction, histoire]
    2. Informatisation de la typographie
      1. La technique informatique :
      2. La notion de rendering
      3. La technique actuelle :
      4. Les polices sur l'ordinateur
        1. L'inspection des polices
        2. Se procurer des polices
        3. Le détail de la mise en œuvre est compliqué...

  3. III. Clavier, palette etc.
    1. Le clavier
    2.  Écrire avec un jeu de caractères donné (avec une police ad hoc !)
      1. La palette de caractères de Mac OS X
      2. La table des caractères de Windows
      3. Unicode character pickers
    3. Dispositifs de saisie plus complexes
      1. Exemple du japonais
      2. Exemple du vietnamien
      3. Exemple en arabe
      4. Le service Google Transliteration


I. Position du problème

  1. Communication ?

    Après avoir vu au cours précédent la nature exacte de l'information logée dans les fichiers,
    et l'omniprésence des mécanismes interprétatifs,
    voyons par quels procédés complexes l'ordinateur nous permet

    Nous admettons sans peine que pour afficher une image à l'écran, ou pour faire entendre le son d'un fichier audio,
    plus encore pour faire jouer un fichier vidéo, il faut un logiciel sophistiqué et une forte puissance de calcul.
    D'ailleurs, pour un fichier image nous distinguons bien l'affichage de la modification
    (tout le monde ne sait pas se servir de PhotoShop !).
    Plus encore pour un fichier audio ou vidéo (là, il faut être un spécialiste pour intervenir).

    En revanche, s'il s'agit d'un fichier texte, nous avons l'illusion d'un contact direct, reproduisant notre expérience
    de la feuille de papier sur laquelle nous lisons et nous écrivons (mais à l'ordinateur il nous faut renoncer à dessiner...).

    Plus précisément, nous projetons sur l'usage conjugué de l'écran et du clavier une image mentale héritée de la machine à écrire.
    En particulier, nous imaginons que le caractère qui apparaît à l'écran quand nous frappons une touche du clavier
    est mécaniquement lié à cette touche,
    et que son apparition est la conséquence directe de la frappe...

    Corbeille
    source : http://www.agers.cfwb.be/apsdt/historiq.htm


    Grave erreur !
    Entre les octets dans le fichier et la forme des caractères à l'écran, un traitement d'information considérable a lieu.
    De même, entre notre geste - frappe au clavier, sélection à la souris - et les octets envoyés dans le buffer
    de l'éditeur de texte, un autre traitement d'information se produit.
    Et la complexité des traitements que peuvent effectuer les machines modernes n'a point de limite !

    Il suffit d'ailleurs de penser à l'envoi d'un SMS sur un téléphone portable pour "sentir" que rien n'est simple :
    Ces petites machines permettent une saisie intuitive, avec des procédés comme le T9,
    qui pourraient nous faire croire qu'elles sont intelligentes...
  2. Lire un (fichier) texte ?

    L'ordinateur ne lit un texte pas plus qu'il ne lit une image !

    Un fichier ne contient que des octets, toute visualisation repose sur une interprétation.
    Les fichiers-texte ne font pas exception à la règle !
    Que ce texte soit la base d'une interprétation ultérieure (RTF, HTML) ne change rien à l'affaire....

    Démo : le même texte est exhibé de manières différentes par différents outils
    également compétents !
    TextEdit, TextWrangler, Terminal (more & ed).

    Ceci nous amène à interroger l'ordinateur sur ses capacités de scripteur
    - car nous ne lisons que ce que l'ordinateur a écrit pour nous.
  3. Écrire un (fichier) texte ?

    Il s'agit d'envoyer des octets dans un fichier, ce qui ne peut se faire qu'au moyen d'un instrument ad hoc.
    Le clavier n'est pas un instrument simple, et il n'est pas le seul en usage (les tablettes graphiques sont parmi nous).

    L'ordinateur comme lecteur ?

  4. Un historique

    succinct va nous aider dans cette quête.

II. Typographie

Références : Haralambous et plus
  1. Notions succinctes sur la typographie [introduction, histoire]

  2. Informatisation de la typographie

    1. La technique informatique :

      l'opposition entre
    2. La notion de rendering

      vient ajouter une couche de complexité supplémentaire : l'infini raffinement du rendu...

      • Exemple 1 : (caché à l'utilisateur) l'anti-crénelage : aliasing, anti-aliasing

      • Exemple 2 : (à la disposition de l'utilisateur) le crénage (kerning) qui règle l'espace entre les lettres
        pour tenir compte des chevauchements.

        Comparez le rendu d'un même texte par Safari Safariet par FirefoxFirefox.

        Commande du crénage dans une version déjà ancienne de Microsoft Word :

        Crénage en Word

        Résultat obtenu :

        Aventure

        Illustration montrant l'examen des facultés de crénage de la police Times New Roman
        sous Windows, avec le logiciel True Type Explorer (cf. infra) :

        TTE


    3. La technique actuelle :

      La base est la technique truetype [Wikipédia, Wikipedia], en abrégé ttf (true type font).

      Il existe des logiciels éditeurs de polices (font editors) permettant à tout un chacun d'en fabriquer.
      Par exemple FontForge.

      1. Complexité de la technique truetype Une police ttf comprend tout un arsenal :
        un jeu de dessins pour les glyphes, assortis d'instructions détaillées pour les mettre à l'échelle,
        et une batterie de tables pour assurer la communication avec l'extérieur.

        Excellent exposé de Patrick Andriès.

      2. Exemple de dessin de police ttf

        Mangal

        (police Mangal sous Windows) employant des courbes de Bézier
        représentant le caractère "r voyelle" du sanskrit (en écriture devanâgari),
        La même lettre ci-dessous dans la police Devanagari MT sur Macintosh.
        r voyelle

      3. Les tables
        • du code indiquant le caractère vers le glyphe qui lui correspond : CMAP,
        • pour trouver les ligatures MORT

      4. Les dérivées de truetype :

    4. Les polices sur l'ordinateur

      • L'inspection des polices
        Chaque ordinateur possède une collection de polices, qui est considérée comme une ressource
        relevant directement du système d'exploitation.
        Sur les machines actuelles cette collection est très vaste !
        Cette collection de polices est à la disposition de tous les logiciels qui en ont besoin.
        Nous parlerons ici des outils qui permettent d'examiner cette collection :
        ceux qui permettent de s'en servir seront traités à la section III.

        Sur l'inspection des polices, voyez Font View proposée par FontForge.

        1. Sous Windows, les fichiers de polices sont rassemblés dans le répertoire Polices
          accessible via le Panneau de configuration.
          Quand on clique sur un de ces fichiers, on obtient un aperçu permettant (en principe)
          de juger la police d'un point de vue de typographe.
          Sur l'exemple ci-dessous, on note que l'aperçu de la police Mangal ne dévoile pas la plage de caractères
          qu'elle traite, à savoir l'écriture devanâgari.


          PolicesPC


        2. Sous MacOS, les fichiers de polices se trouvent dans un répertoire Fonts, sous-répertoire de Bibliothèque (Library).
          L'aperçu que donne le système et différent ce celui que donne Windows...

          PolicesMac

          Pour juger des qualités typographiques d'une police, il faut l'examiner à l'aide d'une application particulière appelée
          Livre des polices (Font Book).

          Livre des polices


        3. TrueType Explorer
          L'outil le plus perfectionné pour examiner en détail une police est le très remarquable logiciel TrueType Explorer,
          qui ne fonctionne malheureusement que sous Windows.
          Nous l'avons déjà utilisé ci-dessus pour illustrer le crénage et pour montrer le dessin d'une police.
          Voici sa fenêtre d'entrée :

          Font Desktop


      • Se procurer des polices
        La collection de polices qui se trouve sur une machine donnée va évidemment varier suivant l'usage qui est fait de cette machine.

        1. Un utilisateur expert en PAO se fournira auprès des grandes fonderies, comme Adobe
          ou Hœfler & Frere-Jones.
          On notera que les belles polices sont considérées commes des œuvres d'art,
          et que leur acquisition peut être onéreuse.

        2. Cette vénérable tradition entre en conflit avec le courant du logiciel libre
          et la pratique généralisée de la gratuité sur Internet.
          Il y a là un phénomène de société digne d'intérêt.
          Sur la notion de gratuité appliquée aux polices, lire ceci.

        3. L'utilisateur ordinaire cherchera sur le réseau des polices gratuites,
          sans doute de moindre qualité esthétique, mais suffisantes pour rendre les oppositions traditionnelles
          entre serif et sans-serif, chasse constante et chasse variable, etc.
          Sa préoccupation sera surtout de couvrir un maximum de types d'écritures du monde.
          En effet, impossible de visualiser un texte si on ne dispose pas d'une police capable de l'afficher,
          même avec un rendu médiocre !
          Les possibilités sont multiples, mais si on veut sortir de l'alphabet latin il faut chercher avec opiniâtreté !
          La plupart des sites typographiques, comme http://www.dafont.com/fr/, ne proposent que des polices occidentales
          (avoir des lettres accentuées est déjà une grande hardiesse !).
          On se tournera vers
          • les sources habituelles de logiciel libre, par exemple GNU-FreeFont ;
          • des organisations religieuses, continuant la tradition linguistique des missionnaires, comme SIL ;
          • des projets à l'échelle d'une région du globe, comme The Tibetan & Himalayan Digital Library (qui a malheureusement changé de politique) ;
          • et on déplorera qu'un centre universitaire comme le Yamada Language Center  ne propose plus de polices !

        Exercice : Votre ordinateur affiche-t-il complètement cette liste de pays et de capitales ?
        Sinon, y remédier !
      • Le détail de la mise en œuvre est compliqué...
        Ce que fait l'éditeur de texte ou le navigateur :
        lorsque la police demandée (dans la page Web, par exemple) ne se trouve pas dans le collection locale,
        il va chercher une police approchante : celle dont la distance Panose-1 avec la fonte manquante est
        la moindre  [Haralambous p. 21] (démo RTF).
        Du moins, c'est ce qu'il est censé faire ! La réalité s'avère complexe et parfois décevante.

        Le problème se déplace lorsqu'il s'agit de typographie pour des pages Web,
        qui seront affichées dans des contextes dont on ne connaît pas l'équipement typographique.
        Il faut alors distinguer les polices conçues pour être affichées à l'écran (screen fonts) ou pour être imprimées (printer fonts).
        Sur ce point voyez par exemple Accessible Web Typography - an introduction for web designers.


III. Clavier, palette etc.

  1. Le clavier

  2.  Écrire avec un jeu de caractères donné (avec une police ad hoc !)

    En sens inverse de l'inspection des polices, il s'agit d'outils permettant de rechercher les écritures
    que la collection des polices présentes sur l'ordinateur va permettre de réaliser,
    et de les mettre en œuvre pour écrire caractère par caractère.
    La nomenclature des écritures en question est grosso modo celle des blocs Unicode (voir cours n° 4).

  3. Dispositifs de saisie plus complexes

    Tout clavier reste impuissant devant les caractères chinois.
    On est obligé de recourir à une autre solution, celle de l'intuition par la machine, sur la base d'une frappe approximative, en fonction d'un savoir encyclopédique. Le cas échéant, plusieurs choix peuvent être proposés.
    Plus généralement, il existe de nombreuses méthodes d'entrée (en anglais input methods), notamment pour le chinois à partir du pinyin...
    Elles rejoignent les procédés de saisie intuitive précédemment évoqués.

    Il faut distinguer deux modalités :
    1. Les logiciels installés sur votre machine (comme Kotoeri et VietTelex, ci-après)
    2. Ceux qui opèrent à travers une page Web, accessible via Internet (Yamli et Google Transliterate)