Cours PLURITAL 2010-2011
Jean-François Perrot & Marie-Anne Moreaux
Examen écrit du mardi 14 juin
2011
Durée 3h, tous documents autorisés
Les trois questions que voici sont sans rapport entre elles.
Traitez-les dans l'ordre de votre choix.
Veillez à toujours motiver vos décisions...
-
Une histoire de Webmail
On peut lire son courrier électronique de deux manières :
- au moyen d'un logiciel client installé sur son propre
ordinateur
(Microsoft Outlook, MacOS X-Mail, ou Mozilla
Thunderbird)
- à l'aide d'un navigateur grâce à une interface webmail
comme celle de Gmail ou de Horde.
Les logiciels client sont censés interpréter sans erreur les
indications de codage des caractères
qui accompagnent les messages comme exposé au cours n° 3.
Dans le cas d'un webmail, il faut aussi compter avec les
idiosyncrasies du serveur...
Voici par exemple ce que me dit le serveur Horde de mon
laboratoire :

Je constate qu'en effet le message n'est pas affiché correctement, et
je clique suivant la proposition qui m'est faite.
J'obtiens ceci :

Cet affichage est correct, mais je cherche à comprendre pourquoi Horde
ne me l'a pas donné
immédiatement, et a préféré me tenir au sujet de my own character
set un discours d'ailleurs erroné
car mon compte est justement paramétré avec utf-8 comme codage par
défaut !
Je vais donc inspecter le code-source du message (au moyen du bouton "Message
Source
")
et je lis :

- À quoi riment les deux formules cabalistiques "
=?UTF-8?B?.....?=
"
?
- Comment expliquez-vous le détail du libellé du code-source ? Notamment, pourquoi le "í"
de "Eiríkr" et le "a accent grave" sont-ils
rendus par un seul caractère au lieu de deux ?
- À votre avis, comment se fait-il que dans l'affichage initial
deux caractères seulement
soient restés incompris ?
- Globalement, comment interprétez-vous le comportement du
serveur Horde ?
-
Western : Windows-1252 ou Latin-1 ?
Une étudiante (excellente) m'écrit pour se plaindre qu'elle n'arrive
pas à convertir certains textes,
trouvés sur Internet, dans le format demandé par les outils
linguistiques dont on lui impose l'usage.
Ces textes sont donnés en UTF-8, et l'outil exige un codage Latin-1.
Je fais un essai avec l'un des textes en question : pour moi tout va
bien, la conversion se fait sans problème...
Je m'aperçois alors que ma souris a glissé et qu'au lieu de Western
(ISO Latin-1)
j'ai sélectionné dans mon éditeur de textes l'option Western
(Windows Latin-1).
- Mon observation est-elle compatible avec celle de
l'irréprochable étudiante ?
- Le petit texte que voici, produit en UTF-8, est-il
susceptible de causer de difficultés
si je veux l'écrire en ISO Latin-1 ? et en Windows ?

Pour dissiper vos doutes, voici le relevé des octets qui le composent :

-
En pièce jointe ou inclus dans le texte ?
En tant que secrétaire d'une association de bienfaisance, je dois
rédiger des compte-rendus
de séance et les envoyer par e-mail à mes collègues. J'ai alors
le choix
d'envoyer mon texte
en pièce jointe ou de l'inclure dans mon message.
Je trouve naturel d'envoyer une pièce jointe... et voici le résultat :
- compte-rendu illisible
- impossible d'ouvrir la pièce jointe
- c'est des hiéroglyphes !
Je renvoie mon compte-rendu inclus dans mon message... et tout le monde
est content !
Comment est-ce possible ?
Quelques précisions :
- mes estimables collègues ne sont pas informaticiens, ni
linguistes.
- mon texte - comme mon message - est rédigé en UTF-8.