Corrigé
Lien vers l'énoncé en pdf
Ã
'
sont des LATIN CAPITAL LETTER A WITH TILDE
) :Ça, c'était mon frère René (Ã
gauche, près de la fenêtre) et ça c'était ma sœur Iñès.
C3A9
(utf-8)C3
code le caractère LATIN CAPITAL LETTER A WITH TILDE
;A9
doit donner le caractère "copyright", c'est
bien le cas.C3A8
en utf-8,
devient "A tilde + tréma" en Windows1252/Latin-1C3AA
en utf-8,
devient "A tilde + FEMININE ORDINAL INDICATOR
" C3A0
en utf-8,
devient "A tilde + espace insécable" ce qui explique l'espacement dans "(Ã
gauche,
"C3A7
, majuscule
= C387
, deviennent respectivement "A tilde + paragraphe"
"A tilde + DOUBLE DAGGER
", mais ce
dernier n'existe qu'en Windows1252, il est exclu de la normalisation en
Latin-1 : le codage d'origine était donc Windows1252.C3B1
devient "A tilde +
plus-ou-moins" en Windows1252/Latin1C593
devient
"angström + LEFT DOUBLE QUOTATION MARK
", en Windows1252
seulement.Ça, c'était mon frère René (à gauche,
près de la fenêtre) et ça c'était ma sœur Iñès.
C3
correspond-il
au signe "racine carrée" ? Dans la table MacRoman ! Il ne nous reste
plus qu'à vérifier les correspondances dans
cette table :
A9
-> 'copyright', A8
-> 'marque enregistrée',
AA
->
'marque déposée', A0
->
'DAGGER
', A7
->
'eszett' allemand (ß,
pas un β bêta grec), 87
->
'a accent aigu', B1
->
'plus-ou-moins', comme
précédemment ! C593
-> "ALMOST EQUAL TO
+ i accent grave". Ãa, c'était mon frère René (Ã
gauche, près de la fenêtre) et ça c'était ma sÅur Iñès.
Ãa, c'était mon frÚre René (Ã
gauche, prÚs de la fenêtre) et ça c'était ma sÅur IñÚs.
DOUBLE
DAGGER
et le LEFT DOUBLE QUOTATION MARK
) sont
remplacés ici par des caractères de contrôle. LATIN
SMALL LETTER S WITH CARON
. Il s'agit très probablement d'un de
codes ISO-8859, mais lequel ? D'après les exemples donnés dans le cours
n°3, ce pourrait être ISO-8859-2, mais dans cette table la lettre en
question est codée par l'octet B8
et non par A8
.
Il s'agit en fait du code ISO-8859-15, alias Latin-9, le seul avec
lequel on peut écrire le français correctement...ŒïŒªŒªŒ∑ŒΩŒπŒ∫œåœÇ
Οργανισμός
Τυποποίησης
Ελληνικός
CE95CEBBCEBBCEB7CEBDCEB9CEBACF8CCF82
Œ
' majuscule, soit par 'œ
'
minuscule.Œ
' majuscule et 'œ
'
minuscule) sont associées à deux octets "proches". En
Windows1252,
nos deux compères sont codés par 8C
et 9C
respectivement, soit une différence de 16, tandis qu'en MacRoman les
octets sont CE
et CF
= CE
+1.
La cause est donc entendue, il s'agit de MacRoman.jfp% hexdump -C msg.mac
00000000 ce 95 ce bb ce bb ce b7 ce bd ce b9 ce ba cf
8c |................|
00000010 cf 82 20 ce 9f cf 81 ce b3 ce b1 ce bd ce b9
cf |.. .............|
00000020 83 ce bc cf 8c cf 82 20 ce a4 cf 85 cf 80 ce
bf |....... ........|
00000030 cf 80 ce bf ce af ce b7 cf 83 ce b7 cf
82 |..............|
0000003e
Reopen using encoding...
" de votre
éditeur. En effet, la sauvegarde dans un autre codage - si elle est
possible - va conserver les caractères et changer les octets !From: Mohammad Ahmed <mahmad@squ.edu.om>
Date: Fri, 11 Jan 2013 13:30:23 +0400
Subject: =?iso-8859-1?Q?administrateur_du_syst=E8me?=
Date: Wed, 9 Jan 2013 20:21:13 +0100 (CET)
From: "serveurs-mail@libero.it" <serveurs-mail@libero.it>
Reply-To: "serveurs-mail@libero.it" <serveurs-mail@libero.it>
Subject: =?UTF-8?Q?SERVEUR*/-_(G00GLE!!-_:AVIS_DE?=
=?UTF-8?Q?_DESACTIVATION_DE_COMPTE--MAIL=E2=80=8F?=
MIME-Version: 1.0
Content-Type: text/plain;charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
MIME-Version: 1.0
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
Les abonn=C3=A9s aux services *Google* (Compte Gmail! )
sont tenus
de se faire identifier par l'=C3=A9quipe de notification afin
d'=C3=A9viter la
mise en r=C3=A9ception de votre compte et de toujours
b=C3=A9n=C3=A9ficier =
de nos services. En passant imp=C3=A9rativement le texte ci-dessous.
Am=E9liorez votre QUOTA BO=CETE AUX LETTRES
Votre bo=EEte de r=E9ception a presque d=E9pass=E9 sa limite de
stockage.
Il ne sera pas en mesure d'envoyer et de recevoir des e-mails en cas de
d=
=E9passement de la limiter
Et votre compte e-mail sera supprim=E9 de nos serveurs.
Content-Transfer-Encoding:
, n°s 3 & 4), mais ils diffèrent
par le codage d'origine de leurs caractères, qui est utf-8 pour l'un et
Latin-1 pour l'autre (valeur du champ charset
). La
déclaration MIME n°3 (utf-8) correspond donc au texte n°5, où le 'e
accent aigu' est rendu par 2 octets C3A9
, et celle du n°4
au texte n°6, où il apparaît sous la forme E9
.
Subject:
=?iso-8859-1?Q?...
), il accompagne donc 4
et 6, tandis que l'en-tête n°2, transmis en quoted-printable
codant de l'utf-8 (Subject: =?UTF-8?Q?
...
)
correspond à 3 et 5.Subject
, les indications de
codage sont cohérentes avec le contenu du champ, à savoirsyst=E8me
est bien système, avec 'è
'
codé par l'octet E8
en Latin-1=E2=80=8F
? U+200F
RIGHT-TO-LEFT MARK
.instantanée
, par
l'option find all du logiciel de recherche "plein texte" :U+0065
) + COMBINING
ACUTE ACCENT
(U+0301
= CC81
en utf-8).65 CC 81
.fp% hexdump -C instant.txt
00000000 46 61 63 65 62 6f 6f 6b 20 63 68 65 72 63 68
65 |Facebook cherche|
00000010 20 73 61 20 76 6f 69 78 20 28 73 69 63 29 20
64 | sa voix (sic) d|
00000020 61 6e 73 20 6c 61 20 6d 65 73 73 61 67 65 72
69 |ans la messageri|
00000030 65 20 69 6e 73 74 61 6e 74 61 6e 65 cc 81 65
0a |e instantane..e.|
00000040 0a 4c 65 20 72 c3 a9 73 65 61 75 20 73 6f 63
69 |.Le r..seau soci|
00000050 61 6c 20 46 61 63 65 62 6f 6f 6b 20 61 20 6d
69 |al Facebook a mi|
00000060 73 20 c3 a0 20 6a 6f 75 72 2c 20 6a 65 75 64
69 |s .. jour, jeudi|
00000070 20 33 20 6a 61 6e 76 69 65 72 2c 20 73 6f 6e
20 | 3 janvier, son |
00000080 61 70 70 6c 69 63 61 74 69 6f 6e 20 64 65 20
6d |application de m|
00000090 65 73 73 61 67 65 72 69 65 0a 69 6e 73 74 61
6e |essagerie.instan|
000000a0 74 61 6e 65 cc 81 65 2c 20 4d 65 73 73 65 6e
67 |tane..e, Messeng|
000000b0 65 72 2e 20 4c 65 20 70 72 6f 67 72 61 6d 6d
65 |er. Le programme|
000000c0 20 70 65 72 6d 65 74 20 64 c3 a9 73 6f 72 6d
61 | permet d..sorma|
000000d0 69 73 20 64 27 65 6e 72 65 67 69 73 74 72 65
72 |is d'enregistrer|
000000e0 20 64 65 73 20 6d 65 73 73 61 67 65 73 20 76
6f | des messages vo|
000000f0 63 61 75 78 20 0a 65 74 20 64 65 20 6c 65 73
20 |caux .et de les |
00000100 69 6e 74 c3 a9 67 72 65 72 20 64 61 6e 73 20
6c |int..grer dans l|
00000110 65 20 66 6c 75 78 20 64 65 73 20 63 6f 6e 76
65 |e flux des conve|
00000120 72 73 61 74 69 6f 6e 73 2e 0a 4c 65 20 73 65
63 |rsations..Le sec|
00000130 74 65 75 72 20 64 65 73 20 73 65 72 76 69 63
65 |teur des service|
00000140 73 20 64 65 20 74 c3 a9 6c c3 a9 70 68 6f 6e
69 |s de t..l..phoni|
00000150 65 20 70 61 72 20 49 6e 74 65 72 6e 65 74 20
65 |e par Internet e|
00000160 73 74 20 64 65 20 66 61 69 74 20 64 65 20 70
6c |st de fait de pl|
00000170 75 73 20 65 6e 20 70 6c 75 73 20 0a 63 6f 6e
63 |us en plus .conc|
00000180 75 72 72 65 6e 74 69 65 6c 2e 20 4c 65 73 20
6d |urrentiel. Les m|
00000190 65 73 73 61 67 65 72 69 65 73 20 69 6e 73 74
61 |essageries insta|
000001a0 6e 74 61 6e c3 a9 65 73 20 63 6f 6e 6e 61 69
73 |ntan..es connais|
000001b0 73 65 6e 74 20 75 6e 20 65 6e 67 6f 75 65 6d
65 |sent un engoueme|
000001c0 6e 74 20 73 69 6d 69 6c 61 69 72 65 2e
20 |nt similaire. |
000001ce
030
et 0a0
. 1a0
, est bien codé C3A9
.