Cours PLURITAL 2009-2010

Jean-François Perrot & Marie-Anne Moreaux


Examen écrit du mercredi 16 juin 2010               Durée 3h, tous documents autorisés


Les trois questions que voici sont sans rapport entre elles. Traitez-les dans l'ordre de votre choix.

Veillez à toujours motiver vos décisions...





  1. Une collaboration difficile

    Dans le cadre d'un travail en commun sur un texte d'éloge académique, je reçois d'un de mes chers collègues un fichier-texte (provenant d'un document en Microsoft Word) dont voici un fragment :

    ExWord

    1. Ce texte est manifestement corrompu. Pouvez-vous en déterminer la cause ?

    2. Le contenu du fichier analysé par un éditeur hexadécimal montre que le mal est profond. En voici un bref extrait :

      Hexa

      Quel est le système de codage du fichier ?
      [N.B. le caractère '‡' alias "DOUBLE DAGGER" porte le n° 0x2021 dans le catalogue Unicode.]


    3. Comme le document complet comporte plusieurs pages, il faut trouver un procédé "automatique" pour le restaurer.

      Puis-je espérer me tirer d'affaire avec un éditeur de texte seulement capable de changer le codage du fichier ?


    4. Je m'aperçois que mon éditeur hexadécimal est capable de sauvegarder son contenu d'octets dans un fichier-texte en lui appliquant un codage décidé par l'utilisateur. Youpiie ! Je suis sauvé !

      Pourquoi et comment ?






  2. Une expérience vietnamienne

    On trouve dans un texte en pdf sur la grammaire du vietnamien
    http://ressources-cla.univ-fcomte.fr/gerflint/Mekong1/nguyen_lan_trung.pdf
    le passage suivant :

    ExViet1

    1. Quand on transfère ce fragment  par copier-coller dans un éditeur de textes, il se trouve modifié dans sa présentation :

      ExViet-2

      D'où viennent ces changements ?

    2. Le même fragment transféré dans un autre éditeur (cette fois, un éditeur html) se trouve plus profondément modifié :

      ExViet-3

      Que se passe-t-il ?

      Ne croyez pas que l'éditeur en question ne connaisse pas tous les caractères diacrités du vietnamien ! L'illustration ci-contre montre qu'il n'en est rien.
      Et l'emploi répété de cet outil permet d'obtenir une écriture correcte :

      ExViet-4

    3. Pour en avoir le cœur net, on va regarder les octets :

      ExViet-5

      Qu'en dites-vous ?


    Insérer








  3. From Russia with Love

    Voici une partie de l'en-tête d'un message qui est arrivé dans ma boîte aux lettres :

    From: =?koi8-r?Q?=E0=D2=C9=CA_=ED=C9=D2=CF=CE=C5=CE=CB=CF?= <tallman@inbox.ru>
    To: esug-list@lists.esug.org
    Subject: =?koi8-r?Q?Re[2]=3A_[Esug-list]_GSoC_idea=3A_GLORP_&_Magritte_integration?=

    On vous demande de traduire les champs "From" et "Subject" de cet en-tête.


    Pour vous aider, voici un extrait de la page http://fr.wikipedia.org/wiki/KOI8-R


    x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
    Cx ю а б ц д е ф г х и й к л м н о
    Dx п я р с т у ж в ь ы з ш э щ ч ъ
    Ex Ю А Б Ц Д Е Ф Г Х И Й К Л М Н О
    Fx П Я Р С Т У Ж В Ь Ы З Ш Э Щ Ч Ъ