Cours PLURITAL 2009-2010

Cours n° 3 (10 novembre 2009)

Jean-François Perrot

Codage des caractères sur 8 bits


  1. Des jeux de caractères plutôt que des caractères individuels

  2. Idée générale des codages sur 8 bits
    1. Principe :
    2. Prolifération multidimensionnelle
    3. Exemples

  3. La série de codes ISO-8859
    1. Lire la documentation
    2. Le rôle particulier d'ISO-8859-1, alias Latin 1
    3. Latins autres
    4. Le grec et le cyrillique
    5. L'arabe et l'hébreu

  4. Systèmes extrême-orientaux
    1. Les systèmes indiens.
    2. Les caractères chinois et leurs dérivés.

  5. Le cas du courrier électronique
    1. Clients & serveurs de mail
    2. L'exigence ASCII et la convention MIME
    3. Stucture des messages
    4. Les principaux procédés de traduction d'octets en ASCII.
    5. L'affaire des pièces jointes.
    6. Mots encodés

  1. Des jeux de caractères plutôt que des caractères individuels

    Nous attendrons Unicode pour donner un sens technique précis au mot "caractère".
    Pour l'instant (en ce début du cours n° 3) le caractère est pour nous une abstraction
    reliant deux réalités concrètes : les octets (cours n°1) et les polices (cours n°2)

  2. Idée générale des codages sur 8 bits

  3. La série de codes ISO-8859

  4. Systèmes extrême-orientaux

    Nous avons vu, avec le cas du cyrillique, l'apparition de systèmes échappant à la tentative d'unification de l'ISO,
    sous l'impulsion de gouvernements soucieux de garder le contrôle de leur territoire...
  5. Le cas du courrier électronique

    Exemple intéressant où les codages sur 8 bits règnent en maîtres et où leur rôle est facilement observable.
    Cette section fait suite à la Note sur les fichiers-texte du cours n° 1.


    Arrêtons-nous là !