Cours PLURITAL 2012-2013
Jean-François Perrot & Marie-Anne Moreaux
Examen écrit du mardi 25 juin
2013
Durée 3h, tous documents autorisés
Les trois questions que voici sont sans rapport entre elles.
Traitez-les dans l'ordre de votre choix.
Veillez à toujours motiver vos décisions...
-
Transformations
- Je pars du texte suivant, trouvé dans une annonce d'HDR, reproduit ici en UTF-8 :
La résolution de problèmes algébriques non
linéaires
constitue l’un
des grands défis posés au calcul scientifique.
Dans de nombreux domaines des sciences de l’ingénieur,[…] la nécessité
d’obtenir quelques garanties sur la qualité des résultats des calculs
font du
Calcul Formel un outil privilégié. Les enjeux sont donc multiples :
développement d’algorithmes exacts, maîtrise de leur
complexité, développement de logiciels efficaces en pratique et
identification des spécifications utiles aux
utilisateurs.
Ces travaux s’appuient sur des idées géométriques récentes aboutissant
à des
algorithmes efficaces en pratique et une bonne maîtrise de la
complexité.
On précise que ce texte est extrait d'une source en HTML, et que les formes comme ffi
sont donc des entités au sens de HTML. Quel est leur rôle ?
- Je prends ce texte avec mon éditeur HTML, je le sauvegarde en
UTF-8, j'obtiens un fichier HTML que Firefox m'affiche ainsi (en grossissant pour bien montrer les détails de typographie) :
Pourquoi diable voit-on apparaître deux polices différentes ?
- Intrigué par cette incongruité typographique, je vais voir le
texte-source (HTML, ici affiché en police Geneva)
<html xmlns="http://www.w3.org/1999/xhtml"><head>
<meta content="text/html; charset=UTF-8"
http-equiv="content-type" />
<title>Essai</title></head>
<body>La résolution de problèmes algébriques non linéaires
constitue l’un<br />
des grands défis posés au calcul scientifique.<br />
Dans de nombreux domaines des sciences de l’ingénieur, […] la
nécessité<br />
d’obtenir quelques garanties sur la qualité des résultats des calculs
font du<br />
Calcul Formel un outil privilégié. Les enjeux sont donc multiples
:<br />
développement d’algorithmes exacts, maîtrise de leur<br />
complexité, développement de logiciels efficaces en pratique et<br
/>
identification des spécifications utiles aux utilisateurs.<br />
Ces travaux s’appuient sur des idées géométriques récentes aboutissant
à des<br />
algorithmes efficaces en pratique et une bonne maîtrise de la complexité.
<br /></body></html>
Mais où nos entités sont-elles passées ?
- Pour en avoir le cœur net, je sauvegarde à nouveau mon
fichier, cette fois en Latin-1
<html xmlns="http://www.w3.org/1999/xhtml"><head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="content-type" />
<title>Essai</title></head>
<body>La résolution de problèmes algébriques non linéaires
constitue l’un<br />
des grands défis posés au calcul
scientifique.<br />
Dans de nombreux domaines des sciences de l’ingénieur,
[…] la nécessité<br />
d’obtenir quelques garanties sur la qualité des résultats des
calculs font du<br />
Calcul Formel un outil privilégié. Les enjeux sont donc multiples
:<br />
développement d’algorithmes exacts, maîtrise de leur<br
/>
complexité, développement de logiciels efficaces en pratique
et<br />
identification des spécifications utiles aux
utilisateurs.<br />
Ces travaux s’appuient sur des idées géométriques récentes
aboutissant à des<br />
algorithmes efficaces en pratique et une bonne maîtrise de la
complexité.
<br /></body></html>
Que nous révèle ce nouveau codage ?
-
Curieux mélange
Un collègue sur le départ diffuse l'annonce suivante :
Sujet : Pot de départ
Bonjour \`a tous,
Pour f\^eter ma mutation sur Toulouse et vous voir avant de partir
je vous invite pour un petit déjeunerde d\'epart. Caf\'e, chocolat,
th\'e et viennoiseries diverses seront au rendez-vous :
Lundi 16 Juin
A partir de 9h30
étage 9 - 175-176/101-MariÚ
Amicalement
Pierre
Comment expliquez-vous les bizarreries de ce message ?
Et maintenant, allons voir le texte-source :
Subject: Pot de =?iso-8859-1?Q?d=C3=A9part?=
.......
Content-Type: text/plain; charset=utf-8
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable
Bonjour \`a tous,
Pour f\^eter ma mutation sur Grenoble et vous voir avant de partir
je vous invite pour un petit d=C3=83=C2=A9jeunerde d\'epart. Caf\'e,
chocol=
at,
th\'e et viennoiseries diverses seront au rendez-vous :=20
Lundi 16 Juin
A partir de 9h30
=C3=83=C2=A9tage 9 - 175-176/101-Mari=C3=83=C5=A1
Amicalement
Pierre
'Curiouser and curiouser!' cried Alice
Qu'en pensez-vous ?
-
Un appel mal relayé
Extrait du texte-source d'un message (en HTML)
Content-Type: text/html; charset=windows-1252
Content-Transfer-Encoding: quoted-printable
<html><head>
<meta content=3D"text/html; charset=3Dwindows-1252"
http-equiv=3D"Content-Type">
</head><body>
Appel =C3=A0 communication <br>Colloque ISKO-France 2013
<br> 10-11 Octobre 2013 <br>
<br>Paris <br><br>
<br>Le chapitre fran=C3=A7ais de l'ISKO a comme pr=E9occupation
majeure,
depuis sa<br>cr=E9ation en 1996, la question de l'organisation
des connaissances.
Cette<br>th=E9matique a =E9t=E9 trait=E9e sous
l=E2€™angle des structures
d=E2€™organisation, des<br>outils techniques de
m=E9diation mais aussi des
formes et m=E9canismes de<br>partage des connaissances.
Ces questions sont au c=C5“ur des processus
de<br>production, de structuration et
d=E2€™acc=C3=A8s =C3=A0
l=E2€™information.
</body></html>
Comment ce texte va-t-il être affiché par un logiciel de courrier ?
Pourquoi ce mélange entre octets écrits en quoted-printable ("=E9
") et comme entités ("€
") ?
Enfin, d'où peut provenir cette cohabitation entre deux systèmes de codage ("E9
" contre "C3A0
") ?