en le sauvegardant en "texte seulement" (fichier
MoiNH.txt) et en lui appliquant notre programme,
on obtient le texte UTF-8 suivant (fichier
MoiNHU.txt) :
Moi, Nâzïm Hikmet
Ben, bir insan.
Ben Türk şairi Nâzım Hikmet ben,
Tepeden tırnağa insan,
Tepeden tırnağa kavga, hasret ve ümitten
ibaret ben...
Moi, un homme.
(S'il avait voulu dire "Je suis un homme", il aurait écrit Ben, bir insanım.)
Tepeden tırnağa = de la tête aux pieds
tepe = le sommet
tırnak = l'ongle
kavga = la bagarre, la querelle
hasret = le regret, la nostalgie
ibaret = composé de + ablatif
ümit = umut = l'espoir
les trois substantifs kavga, hasret et ümit sont à l'ablatif !
= fait de bagarre, de nostalgie et d'espoir
Dans l'affaire, on a perdu la différentiation opérée par les deux polices, les caractères gras, les italiques,
bref toute la mise en forme, mais on récupéré intégralement le texte...