Cours PLURITAL 2013-2014

Jean-François Perrot & Marie-Anne Moreaux

Examen écrit du mardi 27 juin 2013               Durée 3h, tous documents autorisés

Les trois questions que voici sont sans rapport entre elles. Traitez-les dans l'ordre de votre choix.

Veillez à toujours motiver vos décisions...



  1. Pouchkine masqué

    Le roman en vers Eugène Onéguine jouant un rôle particulier dans l'histoire des mathématiques, je cherche une traduction sur le réseau. J'en trouve une à l'adresse http://lib.ru/LITRA/PUSHKIN/ENGLISH/onegin_j.txt.
    Effectivement, la page s'ouvre de manière alléchante :

    russe

    Tout joyeux, donc, je la télécharge. Mais quand j'ouvre mon fichier avec Safari...

    Safari

    1. Saisi d'horreur, j'essaie avec Firefox...

      Firefox

      Comment expliquez-vous le changement d'affichage entre Safari et Firefox, pour le même fichier HTML ?


    2. Dernier recours : lire le code-source HTML (pour épargner votre vue, j'ai souligné les passages critiques)

      TW

      Avec quel codage le fichier a-t-il été produit ?

    3. Reste à savoir comment le navigateur a fait pour lire correctement la page venue de Russie, alors que la même page installée sur mon ordinateur donne le résultat déplorable illustré ci-dessus.
      Qu'en pensez-vous ?.


  2. Un dommage irréparable...

    Je reçois indirectement une information fort intéressante :

    eml

    La répétition de la séquence "�" m'interpelle.
    Mon fidèle mailer, interrogé sur le codage du message, répond "Occidental (Windows1252)".
    1. À quels octets correspondent ces trois caractères ?
    2. Que représente ce triplet en UTF-8 ?
    3. Imaginez-vous un scénario expliquant la forme du message ci-dessus ?

  3. ... et un dommage réparable !

    Dans l'exemple précédent, le dommage causé par des transcodages hasardeux peut être qualifié d'irréparable puisque toute l'information relative aux lettres accentuées du message initial a été perdue.
    En effet, on ne peut restituer ces lettres qu'en faisant appel à une connaissance du français qu'il n'est pas très facile de communiquer à la machine. Encore cette restitution n'est-elle pas complète : quels signes venaient donc précéder les  noms de MM. Jean-Yves DOMMERGUES et Michel BERNARD, et l'annonce de la "Pause caf� (et viennoiseries)" ?

    Voici un cas où, au contraire, le raisonnement conduit à une restitution certaine :

    Sherbrooke

    Le texte-source de l'en-tête est :

    From: xxx
    Content-Type: text/plain; charset=windows-1252
    Content-Transfer-Encoding: quoted-printable
    Subject: =?windows-1252?Q?=5BGdR_Stic-Sant=C3=83=C2=A9=3A_newslist=5DPost?=
     =?windows-1252?Q?e_=E0_l=27Universit=E9_de_Sherbrooke_=28Canada?=
     =?windows-1252?Q?=29?=



    Que s'est-il passé ?