MESSAGES : STRUCTURE ET CONTENU
Les messages
dont nous parlons ici sont réduits à leur
plus simple expression.
Nous les appelons messages
parce qu'ils transportent de l'information
(concept devant être défini), et qu'ils sont sujets à différents codages.
Le phénomène nouveau
qui attire l'attention sur eux est que les ordinateurs traitent "tout"
comme des messages de ce genre,
c'est à dire que les ordinateurs ne voient le monde que sous l'aspect
d'une information codée : un message.
a)
Nature des messages, exemples :
Nos messages sont essentiellement
des chaînes de caractères.
Plus généralement, des chaînes
de "messages élémentaires".
Leur
propriété essentielle est de pouvoir
se décomposer en "sous-messages", chaque message étant
produit par l'enchaînement (ou concaténation) de ses sous-messages.
Ce sont donc des structures à une seule dimension,
orientée de gauche à droite, perçue comme le support
d'une lecture.
Exemples :
- les numéros
minéralogiques
des automobiles
forment une classe de messages familiers, qui se
décomposent (pour la France) en trois sous-messages
:
une suite de chiffres, une suite de lettres, une suite de deux
chiffres (si on ne prend pas en compte l'exception des deux
départements corses).
- les numéros de
téléphone, les
numéros de sécurité sociale, les matricules de
toute sorte
sont autant d'espèces de messages, formés
exclusivement de chiffres
(encore que les numéros
de téléphone aient aussi contenu des lettres il n'y a pas si
longtemps).
- les cotes de
bibliothèque sont des messages aux structures
variées :
indications de fonds, de format,
de date, de contenu, d'auteur, de numéro d'ordre, dont chacune est
à considérer comme un message élémentaire.
Le lecteur n'aura pas de peine à
allonger cette liste, peut-être avec un pincement de cœur,
et en trouvant que les sociétés modernes tendent trop
à remplacer les gens par des numéros...
b)
Signification, contenu d'un message :
Nous considérons nos messages d'un point
de vue résolument utilitaire, en admettant qu'ils servent exclusivement
à
effectuer des choix :
la signification d'un message sera le choix qu'il permet
de faire entre différentes éventualités, lesquelles étaient
définies avant sa réception.
Pour reprendre une heureuse formulation de Rabardel, "le sens
précède le message, il n'est pas produit par l'ordinateur
et n'en relève nullement"
[in Les Hommes et les
Technologies, Approche Cognitive des Instruments Contemporains,
Armand Colin 1995, p. 45].
Par exemple :
la donnée d'un numéro
minéralogique
permet de choisir
une voiture parmi toutes celles
qui sont immatriculées dans le pays considéré,
celle d'une
cote dans la
bibliothèque
X conduit
à obtenir
un ouvrage parmi ceux qui sont disponibles dans cette
bibliothèque,
etc.
A priori, rien de commun entre une voiture
et un livre, et il n'y a pas de comparaison entre le choix de
l'une et la sélection de l'autre.
Pourtant, il est raisonnable de
considérer que le choix est d'autant plus "difficile" que le nombre
de possibles est plus grand,
et d'estimer, par conséquent, que le message
qui l'a permis est d'autant plus "important".
On
comparera donc le nombre de voitures immatriculées
et le nombre de livres dans la bibliothèque, pour conclure que
la plaque "disait plus de choses" que la cote (ou vice-versa, suivant
le pays d'immatriculation et la bibliothèque).
C'est ici que commence notre histoire...
Pour systématiser cette idée
de l'"importance" des messages, disons que le contenu
d'un message est mesuré par le nombre d'éventualités
entre lesquelles il permet de choisir.
Ainsi, le contenu d'un numéro de Sécurité Sociale
français est plus grand que celui d'une plaque minéralogique française,
puisqu'il permet
de choisir parmi tous les Français, qui sont plus
nombreux que leurs voitures (est-ce bien certain ?).
Comme on le voit, le contenu est le même
pour tous les messages d'une même espèce (tous les numéros
de S.S. ont le même contenu,
puisqu'ils permettent de sélectionner
un individu dans la même population).
Ou tout au moins,
le même pour toute une sous-espèce :
le contenu d'une plaque minéralogique
du département de la Creuse est moindre que celui d'une
plaque parisienne,
vu la différence du nombre de voitures concernées
(ceci suppose que les deux derniers chiffres ne sont pas pris en compte
dans
l'analyse du contenu).
On peut également voir ce contenu
comme le nombre de messages différents appartenant à
l'espèce en question :
le nombre d'individus doit être égal
au nombre de messages,
puisque chaque message spécifie
un choix dans la population concernée,
et que chaque individu de ladite
population est éligible (sans quoi on
ne le compterait pas).
L'essentiel, c'est que le contenu d'un
message ne dépend pas du message particulier envisagé,
mais seulement de sa composition, de sa structure.
Tous les messages
ayant la même structure (p.ex. 4 chiffres, 3 lettres, 2 chiffres)
ont le même contenu, quel que soit par ailleurs le domaine
de leur compétence.
Ce point est essentiel, nous allons le développer.
c)
La loi fondamentale :
Si un message M est obtenu en enchaînant deux sous-messages P
et Q ,
alors
son contenu est le produit (arithmétique) des contenus de P
et de Q .
Pour le voir, il suffit d'analyser le processus de choix à partir
d'un message.
Chaque élément du message
permet un choix partiel, et le choix final est la composition de
ces choix partiels.
Plus précisément, soit un message M
formé de
deux sous-messages successifs M'
et M", et m l'individu qu'il
désigne au sein de la population concernée.
le fait que le premier sous-message M' donne une
information
incomplète, insuffisante pour déterminer m complètement
(puisqu'on a besoin de M"
ensuite) peut se mathématiser comme suit.
On considère la relation d'équivalence E ainsi
définie sur la population visée
:
deux individus p et
q sont
équivalents s'ils
correspondent à deux messages Mp
et Mq qui
ont en commun le
premier sous-message M'
et ne se différencient que par leurs seconds
sous-messages M"p
et M"q
respectivement, c'est-à-dire si Mp
= M'+M"p
et Mq = M'+M"q en
notant "+" la concaténation des messages.
On peut alors analyser la sélection de l'élément
m désigné
par M en
deux temps. D'abord le premier sous-message
M'
permet
de repérer non pas m lui-même,
mais seulement sa classe
d'équivalence modulo E (on
dirait en langage courant que m
est déterminé
non pas exactement, mais à l'équivalence E près). Ensuite,
le deuxième sous-message M"
permet de repérer m dans
sa classe.
Soient K'
et K" les
contenus de M'
et de M"
respectivement : du raisonnement
précédent suit que K'
est le nombre de classes mod. E,
et
que chaque classe a le même nombre d'individus, qui est
K". Le
recensement de la population donne donc K'*K" individus. Le
contenu K
du message entier est donc K
= K'*K",
comme annoncé.
Exemple:
avec un premier sous-message formé de deux chiffre binaires
et le second sous-message étant de
la forme "la lettre A, B, ou C suivie de deux chiffres binaires",
Le premier sous-message peut être P
= "00", "01", "10"
ou "11", donc 4 possibilités.
De même, nous avons 12 = 3 * 4 possibilités pour le second
sous-message.
Et au total 4 * 12 = 48 possibilités pour le message entier.
On peut schématiser ainsi les
différents choix possibles en fonction des deux sous-messages :
\ A A A
A B B B B C
C C C
\ 0
0 1 1 0 0 1
1 0 0 1 1
\ 0
1 0 1 0 1 0
1 0 1 0 1
\
-------------------------------------
00 | 1| 2| 3| 4| 5| 6| 7| 8| 9|10|11|12|
-------------------------------------
01 |13|14|15|..|..|
| | | |..|23|24|
-------------------------------------
10 |25| |
| | | | | |
| | |36|
-------------------------------------
11 |37| |
| | | | | |
|..|47|48|
-------------------------------------
Soulignons que cette analyse
traite les deux sous-messages comme
"indépendants", et qu'elle vise en somme un "contenu maximal"
qui ne tient pas compte d'éventuelles restrictions
liées au contexte : par exemple, certains numéros
de téléphone ne sont pas valables, le département 00
n'existe pas, etc. Cet aspect de la question réapparaîtra plus
tard.
Plus généralement, un message composé de n sous-messages
successifs, soit M
= P1 P2 ... Pn a un contenu qui
est le produit des contenus des n
sous-messages Pi. Si ces composants
sont
tous de la même espèce (p.ex. des chiffres, ou des lettres),
et ont donc tous le même contenu (appelons-le C ), le contenu du
message
M est C à
la puissance n.
Exemple : Contenu d'une plaque d'immatriculation de
format
parisien (avec 3 lettres).
Le message se divise en trois sous-messages : M = P1 P2 P3 ,
où P1 est formé de 4
chiffres, P2
de 3 lettres et P3 de deux chiffres.
Son contenu K
est donc le produit des trois contenus K1* K2* K3.
Le contenu de P1 est égal au
contenu d'un chiffre à la puissance
4. Le contenu d'un chiffre est 10 (puisqu'il y a 10 chiffres 0, 1,
2,...,9). D'où K1 = 10 000.
Le contenu de P2 est égal à celui
d'une
lettre au cube. Celui d'une lettre est 26, puisqu'il y
a 26 lettres à choisir dans l'alphabet, ce qui fait K2 = 263
= 17 576.
Enfin, par le même raisonnement que pour P1, K3 (le
contenu de P3) vaut 100, donc au
total K =
10 000 * 17 576 * 100 = 17 576 000 000.
Evidemment, nous avons simplifié le
problème en considérant qu'il y avait exactement
4 chiffres et 3 lettres, mais le principe demeure.
Notons
que si nous ne tenons pas compte des 2 derniers chiffres, en
considérant
qu'ils ne font pas partie du message car nous
savons déjà que la voiture concernée est de Paris, le
contenu devient 175 760 000, ce qui montre que les Parisiens pourront
continuer
quelque temps encore à immatriculer leurs
véhicules sans crainte d'épuiser les numéros disponibles
!
Notons aussi que le fait d'avoir un groupe de 3 lettres au
lieu de 2 joue un grand rôle : ajouter une lettre multiplie le contenu
par 26...