Ex.txt
. 6c 65 73 20 64 e9 70 65 6e 73 65 73 20 64 65 20
6c 92 c9 74 61 74 20 0d 0a 76 69 73 61 6e 74 20
e0 20 73 74 69 6d 75 6c 65 72 20 0d 0a 6c 92 e9
63 6f 6e 6f 6d 69 65 2e 0d 0a
6c 65 73 20 64 e9
70 65 6e 73 65 73 20 64 65 20
6c 92 c9
74 61 74 20 0d 0a 76 69 73 61 6e 74 20
e0 20 73 74 69 6d 75 6c 65
72 20 0d 0a 6c 92 e9
63 6f 6e 6f 6d 69 65 2e 0d 0a
10
,
donc avoir pour premier chiffre 8
, 9
, A
ou B
.e9 70
, 92 c9
, e0 20
,
et 92 e9
,FF FE
ou FE
FF
EF BB BF
si on était en UTF-8) qui pourrait
apparaître tout au début du fichier, l e s d e9 p e n
s e s d e
l 92 c9 t a
t CR LF v i s a n t
e0 s t i m u l e r CR
LF l 92 e9
c o n o m i e . CR LF
les dépenses de l?État
visant à stimuler
l?économie
.92
ne fait pas partie du codage,les dÈpenses de lí…tat
visant ‡ stimuler
líÈconomie
.92
fait partie du système.
L'affichage se fait donc sans erreur.les dépenses de l’État
visant à stimuler
l’économie
.92
CR LF
.recode
,recode
est considérable) qu'une règle d'adaptationà
, é
,
et É
, qui logent dans le bloc Latin-1
Supplement.é
) ;U+2019
, en
UTF-8 E2 80 99
, qui loge dans la zone Symbols
Area, bloc General Punctuation. RIGHT SINGLE QUOTATION MARK
, il
fait
pendant à U+2018
LEFT SINGLE QUOTATION MARK
,
92
et 91
) et de MacRoman (octets D5
et D4
).NamesList.txt
déclare à son sujet :* this is the preferred character to use for apostrophe
B4
).recode WINDOWS-1252..ISO-8859-1 < /Users/marie-annemoreaux/Desktop/exam\ 2.txt > res.txt
les dépenses de l´État
visant à stimuler
l´économie.
0000: 6C 65 73 20 64 E9 70 65 6E 73 65 73 20 64 65 20 les d.penses de
0010: 6C B4 C9 74 61 74 20 0D 0A 76 69 73 61 6E 74 20 l..tat ..visant
0020: E0 20 73 74 69 6D 75 6C 65 72 20 0D 0A 6C B4 E9 . stimuler ..l..
0030: 63 6F 6E 6F 6D 69 65 2E 0D
0A
conomie...
/* ************************************************************************ */
recode WINDOWS-1252..MacRoman < /Users/marie-annemoreaux/Desktop/exam\ 2.txt > res.txt
les dépenses de l’État
visant à stimuler
l’économie.
0000: 6C 65 73 20 64 8E 70 65 6E 73 65 73 20 64 65 20 les d.penses de
0010: 6C D5 83 74 61 74 20 0D 0A 76 69 73 61 6E 74 20 l..tat ..visant
0020: 88 20 73 74 69 6D 75 6C 65 72 20 0D 0A 6C D5 8E . stimuler ..l..
0030: 63 6F 6E 6F 6D 69 65 2E 0D 0A
conomie...
/* ************************************************************************ */
recode WINDOWS-1252..utf-8 < /Users/marie-annemoreaux/Desktop/exam\ 2.txt > res.txt
les dépenses de l’État
visant à stimuler
l’économie.
0000: 6C 65 73 20 64 C3 A9 70 65 6E 73 65 73 20 64 65 les d..penses de
0010: 20 6C E2 80 99 C3 89 74 61 74 20 0D 0A 76 69 73 l.....tat ..vis
0020: 61 6E 74 20 C3 A0 20 73 74 69 6D 75 6C 65 72 20 ant .. stimuler
0030: 0D 0A 6C E2 80 99 C3 A9 63 6F 6E 6F 6D 69 65 2E ..l.....conomie.
0040: 0D 0A
....
From: Société Astronomique de France
<saf.lalettre@club-internet.fr>
To: Jean-Francois.Perrot@lip6.fr
Subject: =?iso-8859-1?Q?Soci=E9t=E9_Astronomique_de_franc?=
=?iso-8859-1?Q?e,_la_lettre,_d=E9cembre_2009?=
Content-Type: multipart/related;
type="multipart/alternative";
boundary="----=_NextPart_001_35D9_61CB1D76.1EE4647A"
Date: Fri, 11 Dec 2009 00:57:27 +0100
From:
contient des caractères non-ASCII,=?iso-8859-1?Q?Soci=E9t=E9_...
?Société
"
avec ses accents et de rester conforme au règlement
Subject:
est codé en Latin-1 et transmis en quoted-printable,
=E9
".From:
!From:
=?windows-1252?Q?Jean-Fran=8Dcois_Perrot?=<Jean-Francois.Perrot@lip6.fr>
From:
=?UTF-8?B?SmVhbi1GcmFuwo1jb2lzIFBlcnJvdA==?=<Jean-Francois.Perrot@lip6.fr>
Jean-Fran=8Dcois_Perrot
" à décoder en quoted-printable,
lus en Windows-1252.Jean-Fran"
,8D
cois_Perrot
"8D
ne fait pas partie du code,A
= 000000
(le premier indice dans
la chaîne base 64). Jean-Francois Perrot
"
: 4a 65 61 6e 2d 46 72 61 6e c2 8d 63 6f 69 73 20
50 65 72 72 6f 74 00
A
.Jean-Fran
c2 8d
cois Perrot
".c2 8d
est la représentation UTF-8 normale de l'octet
non-ASCII 8d
, lequel comme nous le savons n'appartient pasContent-Type: text/plain; charset=ISO-8859-1;
Content-Transfer-Encoding: quoted-printable
Le 19 janv. 10 =E0 18:50, Jean-Fran=3D8Dcois_Perrot a
=E9crit :
Le 18 janv. 10 =E0 14:26, Jean-Fran=8Dcois Perrot a
=E9crit :
Le 18 janv. 10 à 14:26, Jean-Fran=8Dcois_Perrot a
écrit :
=3D
" se décode en "=
" et "8D
"
reste invariant puisque c'est de l'ASCII.8D
qui n'appartient pas au code ISO-8859-1.
4A 65 61 6E 2D 46 72 61 6E C2 8D 63 6F 69 73 20
50 65 72 72 6F 74 20 61 20 C3 A9 63 72 69 74
C2 8D
qui codent (en UTF-8)
un
caractère qui n'existe pas dans le catalogue Unicode.sauf une fois où je suis déguisé en
dont voici le code-source :From:
=?ISO-2022-JP?B?SmVhbi1GcmFuYyxvaXMgUGVycm90?=<Jean-Francois.Perrot@lip6.fr>
Jean-François Perrot
".ISO-2022-JP
traité au cours 3 : le "c
cédille" ne fait pas partie de ce code,Jean-Franc,ois
Perrot
".c,
" à "ç
".4a 65 61 6e 2d 46 72 61 6e 63 2c 6f 69 73 20 50 65 72 72 6f 74
c'est-à-dire Jean-Franc,ois
Perrot
comme prévu.