Cours PLURITAL 2013-2014

Cours n° 1 (révision du 7 octobre 2013)

Jean-François Perrot

Des octets au code ASCII


  1. Idée générale

    1. Fichiers
      1. Le nom
      2. Fichiers locaux (local files)
      3. Fichiers distants (remote files)

    2. Information, interprétation
      1. Information
      2. Interprétation
      3. Le but de ce premier cours

  2. Le matériel présenté dans cette page s'organise en 4 sections.

    1. Information, bits & octets
    2. Interprétation numérique
    3. Outils de base (éditeurs hexa)

    4. Fichiers en texte pur


Idée générale

  1. Fichiers

  2. Information, interprétation


Le matériel présenté dans cette page s'organise en 4 sections.

  1. Sur la nature de l'information, les bits et les octets, voir le texte détaillé Bits, octets, caractères.
    Ce texte tente d'élucider les notions d'information, de quantité d'information,
    et leurs rapports avec la représentation des nombres en base 2 et en base 16 (hexadécimale).
    Il aboutit à la présentation du code ASCII, qu'il est indispensable de bien connaître.
    Comme première application de ce discours, on a détaché une note sur la représentation du saut de ligne
    à laquelle vous aurez probablement à vous reporter dans l'avenir.

    Le langage Perl possède deux fonctions standard pack et unpack qui permettent de manipuler les différentes interprétations
    que peut recevoir une suite d'octets. Je vous propose d'en prendre connaissance et de réfléchir à leur signification.

  2. En marge de ce développement, on propose un point de vue sur la représentation des nombres (entiers).
    Vous y trouverez de quoi représenter des entiers (pas trop grands, donnés en notation décimale)
    dans la base de votre choix (au plus 36), et réciproquement.
    Il est important de bien saisir la différence de nature entre information et nombre :
    (re)voyez le paragraphe Interprétation numérique.
    De manière à bien vous persuader que vos fichiers sont effectivement justiciables de ces considérations,
    je vous propose d'essayer un outil artisanal qui affiche (pour un petit fichier) son contenu en binaire
    (reconstitué par calcul !), en octal et en hexadécimal (trois représentations équivalentes de la même information),
    ainsi que le nombre entier correspondant (en notation décimale).

  3. Il faut absolument se familiariser avec les outils "professionnels" propres à révéler l'anatomie d'un fichier,
    et permettant même d'y pratiquer des interventions chirurgicales :  les éditeurs hexadécimaux.

  4. Les fichiers de caractères (alias "en texte pur") seront désormais l'objet de notre étude.
    Mais il faut bien se persuader que la plupart du temps leur rôle est celui d'une base pour des interprétations ultérieures.
    Vous trouverez ci-joint une esquisse présentant sommairement deux exemples de ces situations,

Bonne lecture ! Tous vos commentaires sont les bienvenus.