Cours PLURITAL 2013-2014
Jean-François Perrot & Marie-Anne Moreaux
Examen écrit du mardi 27 juin
2013
Durée 3h, tous documents autorisés
Les trois questions que voici sont sans rapport entre elles.
Traitez-les dans l'ordre de votre choix.
Veillez à toujours motiver vos décisions...
-
Pouchkine masqué
Le roman en vers Eugène Onéguine jouant un rôle particulier
dans l'histoire des mathématiques, je cherche une traduction sur le
réseau. J'en trouve une à l'adresse http://lib.ru/LITRA/PUSHKIN/ENGLISH/onegin_j.txt
.
Effectivement, la page s'ouvre de manière alléchante :
Tout joyeux, donc, je la télécharge. Mais quand j'ouvre mon fichier
avec Safari...
- Saisi d'horreur, j'essaie avec Firefox...
Comment expliquez-vous le changement d'affichage entre Safari et Firefox, pour le même fichier HTML ?
- Dernier recours : lire le code-source HTML (pour épargner
votre vue, j'ai souligné les passages critiques)
Avec quel codage le fichier a-t-il été produit ?
- Reste
à savoir comment le navigateur a fait pour lire
correctement la page venue de Russie, alors que la même page installée
sur mon ordinateur donne le résultat déplorable illustré ci-dessus.
Qu'en pensez-vous ?.
-
Un dommage irréparable...
Je reçois indirectement une information fort intéressante :
La répétition de la séquence "�
"
m'interpelle.
Mon fidèle mailer, interrogé sur le codage du message, répond "Occidental
(Windows1252)
".
- À quels octets correspondent ces trois caractères ?
- Que représente ce triplet en UTF-8 ?
- Imaginez-vous un scénario expliquant la forme du message
ci-dessus ?
-
... et un dommage réparable !
Dans l'exemple précédent, le dommage causé par des transcodages
hasardeux peut être qualifié d'irréparable puisque toute l'information
relative aux lettres accentuées du message initial a été perdue.
En effet, on ne peut restituer ces lettres qu'en faisant appel à une
connaissance du français qu'il n'est pas très facile de communiquer à
la machine. Encore cette restitution n'est-elle pas complète : quels
signes venaient donc précéder les noms de MM. Jean-Yves
DOMMERGUES et Michel BERNARD, et l'annonce de la "Pause
caf� (et viennoiseries)" ?
Voici un cas où, au contraire, le raisonnement conduit à une
restitution certaine :
Le texte-source de l'en-tête est :
From: xxx
Content-Type: text/plain; charset=windows-1252
Content-Transfer-Encoding: quoted-printable
Subject:
=?windows-1252?Q?=5BGdR_Stic-Sant=C3=83=C2=A9=3A_newslist=5DPost?=
=?windows-1252?Q?e_=E0_l=27Universit=E9_de_Sherbrooke_=28Canada?=
=?windows-1252?Q?=29?=
Que s'est-il passé ?