Références en ligne :
- Bernard Desgraupes, Passeport pour Unicode, Vuibert Informatique, Paris 2005.
- les chapitres 2 à 5 de Fontes & codages, de Yannis Haralambous
- Wikipédia, source de toute science, a désormais une page très substantielle : http://fr.wikipedia.org/wiki/Unicode
qui fournit le point d'entrée à toute une constellation.- La maison-mère : http://www.unicode.org/
- Le site québécois de Patrick Andriès, avec une introduction systématique à Unicode 5.0 et une mine d'informations variées
http://hapax.qc.ca/
- Le site Web d'Alan Wood, qui offre une aide efficace : http://www.alanwood.net/unicode/
- Un numéro de la revue Document numérique consacré à Unicode, écriture du monde ? en 2002
Le standard Unicode met en exergue 10 principes, dont
l'exégèse ne manque pas d'intérêt
(Desgraupes, chap. 1, Haralambous, chap. 2).
De notre point de vue d'utilisateurs, je retiens les trois points
suivants :
0x103A0–0x103DF
du premier plan supplémentaire.GREEK SMALL
LETTER ALPHA WITH TONOS
,GREEK SMALL
LETTER ALPHA WITH OXIA
.LATIN CAPITAL LETTER A
ou bien n° 913 GREEK CAPITAL LETTER ALPHA
;ARABIC LETTER ALEF MAKSURA
ARABIC LETTER FARSI YEH
.Ariane ou, selon l'ancienne graphie, Ariadne (en grec ancien Ἀριάδνη / Ariádnê)votre éditeur hexadécimal favori vous informe alors que
Ἀριάδνη = E1BC88 CF81 CEB9 CEAC
CEB4 CEBD CEB7
(en UTF-8),
et en traduisant de l'UTF-8 vers les numéros Unicode décimaux (cf. plus loin) vous obtenez
Ἀριάδνη = 7944 961 953 940 948
957 951
C'est-à-dire que seul Ἀ appartient au bloc Greek Extended, et
que ά qui devrait logiquement être GREEK SMALL LETTER ALPHA WITH OXIA
est en
fait n° 940, GREEK SMALL LETTER ALPHA WITH TONOS.
WITH OXIA
"
et "WITH TONOS
" sont effectivement identiques,U+11000
–U+1107F
, dans le premier plan supplémentaire),Tu déploies tout ton charme et les cœurs en sont troublés ;
000052D5 0002029A 000082B1 00007A96 000241DA 00007CBE 0000795E
00000020 00000054 00000075 00000020 00000064 000000E9 00000070
0000006C 0000006F 00000069 00000065 00000073 00000020 00000074
0000006F 00000075 00000074 00000020 00000074 0000006F 0000006E
00000020 00000063 00000068 00000061 00000072 0000006D 00000065
00000020 00000065 00000074 00000020 0000006C 00000065 00000073
00000020 00000063 00000153 00000075 00000072 00000073 00000020
00000065 0000006E 00000020 00000073 0000006F 0000006E 00000074
00000020 00000074 00000072 0000006F 00000075 00000062 0000006C
000000E9 00000073 00000020 0000003B
FEFF
en tête du fichier)FEFF 52D5 D840 DE9A 82B1 7A96 D850 DDDA 7CBE 795E
0020 0054 0075 0020 0064 00E9 0070 006C 006F 0069
0065 0073 0020 0074 006F 0075 0074 0020 0074 006F
006E 0020 0063 0068 0061 0072 006D 0065 0020 0065
0074 0020 006C 0065 0073 0020 0063 0153 0075 0072
0073 0020 0065 006E 0020 0073 006F 006E 0074 0020
0074 0072 006F 0075 0062 006C 00E9 0073 0020 003B
E58B95 F0A08A9A E88AB1 E7AA96 F0A4879A E7B2BE E7A59E
20 54 75 20 64 C3A9 70 6C 6F 69 65 73 20 74 6F 75 74
20 74 6F 6E 20 63 68 61 72 6D 65 20 65 74 20 6C 65 73
20 63 C593 75 72 73 20 65 6E 20 73 6F 6E 74 20 74 72
6F 75 62 6C C3A9 73 20 3B
Unitex
,UTF-16LE
), FFFE D552 40D8 9ADE B182 967A 50D8 DADD BE7C 5E79
2000 5400 7500 2000 6400 E900 7000 6C00 6F00 6900
6500 7300 2000 7400 6F00 7500 7400 2000 7400 6F00
6E00 2000 6300 6800 6100 7200 6D00 6500 2000 6500
7400 2000 6C00 6500 7300 2000 6300 5301 7500 7200
7300 2000 6500 6E00 2000 7300 6F00 6E00 7400 2000
7400 7200 6F00 7500 6200 6C00 E900 7300 2000 3B00
0xE0A48B
)0xCEB1
)0x78
, ASCII : on reconnaît la lettre
minuscule "x") C
ou par D
)E
)F
)é
', U+00E9
, devient C3A9
en Unicode (comme vous l'avez vu lors du TD n°3)U+lenumérohex
plutôt que par son nom officiel, parfois très malcommode.U+0391
U+1FBB
\x{lenumérohex}
,Entrer & sortir :
les machines modernes avec écran et clavier nous laissent croire que
lire et écrire ne font qu'un
c'est faux !
L'écriture (fabrication d'un fichier) et la lecture (interprétation)
sont deux processus dissymétriques.
Cette dissymétrie est masquée par la puissance des machines et par la
bonne adéquation des outils (clavier - écran - logiciels).
Mais la puissance est relative et l'adéquation dépend du but poursuivi !
Il convient donc de se
renseigner soigneusement sur l'usage
du logiciel employé,
de préférence avant d'avoir à sauvegarder son
travail en urgence,
car un mauvais choix de codage peut conduire à la perte irrémédiable de
l'information acquise...