Cours PLURITAL 2010-2011

Jean-François Perrot & Marie-Anne Moreaux

Examen écrit du mardi 14 juin 2011               Durée 3h, tous documents autorisés


Les trois questions que voici sont sans rapport entre elles. Traitez-les dans l'ordre de votre choix.

Veillez à toujours motiver vos décisions...





  1. Une histoire de Webmail

    On peut lire son courrier électronique de deux manières :

    Les logiciels client sont censés interpréter sans erreur les indications de codage des caractères
    qui accompagnent les messages comme exposé au cours n° 3.
    Dans le cas d'un webmail, il faut aussi compter avec les idiosyncrasies du serveur...

    Voici par exemple ce que me dit le serveur Horde de mon laboratoire :

    Horde

    Je constate qu'en effet le message n'est pas affiché correctement, et je clique suivant la proposition qui m'est faite.
    J'obtiens ceci :

    Bis
    Cet affichage est correct, mais je cherche à comprendre pourquoi Horde ne me l'a pas donné
    immédiatement, et a préféré me tenir au sujet de my own character set un discours d'ailleurs erroné
    car mon compte est justement paramétré avec utf-8 comme codage par défaut !
    Je vais donc inspecter le code-source du message (au moyen du bouton "Message Source")
    et je lis :

    Source

    1. À quoi riment les deux formules cabalistiques "=?UTF-8?B?.....?=" ?

    2. Comment expliquez-vous le détail du libellé du code-source ? Notamment, pourquoi le "í"
      de "Eiríkr" et le "a accent grave" sont-ils rendus par un seul caractère au lieu de deux ?

    3. À votre avis, comment se fait-il que dans l'affichage initial deux caractères seulement
      soient restés incompris ?

    4. Globalement, comment interprétez-vous le comportement du serveur Horde ?




  2. Western : Windows-1252 ou Latin-1 ?

    Une étudiante (excellente) m'écrit pour se plaindre qu'elle n'arrive pas à convertir certains textes,
    trouvés sur Internet, dans le format demandé par les outils linguistiques dont on lui impose l'usage.
    Ces textes sont donnés en UTF-8, et l'outil exige un codage Latin-1.
    Je fais un essai avec l'un des textes en question : pour moi tout va bien, la conversion se fait sans problème...
    Je m'aperçois alors que ma souris a glissé et qu'au lieu de Western (ISO Latin-1)
    j'ai sélectionné dans mon éditeur de textes l'option Western (Windows Latin-1).

    1. Mon observation est-elle compatible avec celle de l'irréprochable étudiante ?

    2. Le petit texte que voici, produit en UTF-8, est-il susceptible de causer de difficultés
      si je veux l'écrire en ISO Latin-1 ? et en Windows ?

      Ex

      Pour dissiper vos doutes, voici le relevé des octets qui le composent :

      Oct

  3. En pièce jointe ou inclus dans le texte ?

    En tant que secrétaire d'une association de bienfaisance, je dois rédiger des compte-rendus
    de séance et les envoyer par e-mail à mes collègues. J'ai alors le choix d'envoyer mon texte
    en pièce jointe ou de l'inclure dans mon message.
    Je trouve naturel d'envoyer une pièce jointe... et voici le résultat :
    Je renvoie mon compte-rendu inclus dans mon message... et tout le monde est content !

    Comment est-ce possible ?

    Quelques précisions :