Marianne et Nathalia, deux juristes de notre service, sont chargées d'élaborer un système "intelligent" de rédaction de contrats de service (SSII) appliqués aux techniques I.A..

Elles nous avaient remis une suite de questions ouvertes et variées telles que : qu'est-ce que l'I.A. ? quand je dis "méta", suis-je au pays de l'I.A. ? qui est propriétaire de l'information produite par un système "intelligent" ? ...

Ceci est un essai de réponse que je leur ai fait en décembre 1995. Nous-mêmes, supposés spécialistes en la matière, sommes bien en peine d'exprimer et définir ce qu'est l'I.A. ! On trouvera dans ce texte quelques références aux personnes de notre équipe de travail (Jean-Louis G., Françoise F. et les Neurones).


Brève réflexion sur l'I.A.
à l'usage de Nathal.IA et Mar.IA.nne

A la lecture de la lettre To Godel Escher Bach from Nathalia, j'ai cru identifier que votre principale question métaphysique était d'identifier ce que cache l'acronyme I.A. et les notions qu'il supporte. Serions nous déjà entrés dans l'univers de l'I.A., puisque l'introduction emploie le mot méta et parle de méta-identification ? Pas encore.

Plutôt que de répondre à cette lettre point par point. Je préfère vous présenter une réflexion légèrement décousue sur le thème de l'I.A., sous l'angle de mon interprétation propre et personnelle, reflétant mon avis et comment je la vis. Par opposition aux techniques d'I.A. j'utiliserai le terme volontairement vague de technique classique.

L'I.A., et je donne à cet acronyme son premier sens d'Intelligence Artificielle et non pas d'Informatique Avancée, regroupe tout un ensemble de techniques différentes mais participant d'une même approche. Quand, en technique classique, on va réaliser des programmes qui calcule et compute "bêtement", le programme d'I.A. va réfléchir.

En quoi la cogitation du programme classique est-elle dénuée d'intelligence ? Ce programme applique un ensemble de transformations qui va aboutir à la solution. Ce programme sait d'emblée où il va, il ne se pose pas de question, il enchaîne les opérations.

Le programme d'I.A. est-il intelligent, lui ? Non plus, il applique lui aussi une technique sans apporter aucune plus value à ce qu'on lui aura dit de faire, ou plus exactement à comment on lui a dit de procéder. En effet, le programme d'I.A. n'a pas préscience de la solution, il est obligé de réfléchir comme on lui aura appris afin de trouver la solution.

Le programme classique, s'il ne connaît pas directement la solution, connaît la formule permettant de la produire. Le programme d'I.A. ne produit pas la solution il la trouve.

On pourra aussi tenter de différencier le programme d'IA du programme classique en le qualifiant de non-déterministe, dans le sens où, même si l'on est le programmeur, on ne sait pas à l'avance le résultat que nous donnera la machine. Néanmoins, cette notion n'est pas correcte puisque, mis dans un état donné, un programme -qu'il soit classique ou d'IA- aura toujours le même comportement. Tout programme est donc déterministe, stricto sensu.

Reprenons l'exemple classique. Pour aller à la plage, un programme classique vous indi quera "Tournez à droite, poursuivez jusqu'au feu, puis à gauche et encore à gauche". Le programme d'IA vous dira "Suivez les gens ayant un parasol", voire "Prenez toujours les rues qui descendent".

Ainsi, on montre qu'il s'agit de niveau de connaissance. Par suite, cela explique pour quoi le terme méta est souvent employé dans les techniques d'IA. En effet, il est nécessaire en IA d'exprimer des connaissances sur des connaissances (méta-connaissances), autrement dit des règles de production de connaissances, voire des règles de production de règles (et le terme de méta devient récursif) comme on le verra plus loin.

Si un programme manipule des méta-connaissances, c'est dans le but de trouver des solutions non identifiées a priori. L'objet étant de trouver des solutions et non plus de les produire, la clef du programme d'IA est alors l'heuristique, la méthode pour pouvoir crier -comme Métamède dans son bain- Heureka !

La partie à proprement parler intelligente du programme réside dans l'heuristique. Pour élaborer cette heuristique, plusieurs techniques générales de l'IA sont reconnues. A TAIC on pratique les systèmes experts, les réseaux neuronaux et la programmation par contraintes. A celles-la on pourra en ajouter d'autres comme la logique floue par exemple.

Comment s'y prend-on en général pour créer et décrire ces heuristiques ? Principalement en calquant leur processus sur nos schémas de pensée et de raisonnement ... supposés car on n'en sait pas plus sur notre pensée que les concepts et analyses élaborés a posteriori sur son fonctionnement (fin de la phrase). On reproduit d'ailleurs le fonctionnement de notre cerveau tant aux niveaux réflexion désincarnée que physiologique, avec les réseaux neuronaux imitant le cablage physique de notre matière grise.

Pour aller plus avant dans le domaine de la compréhension de nos processus de pensée, et par suite de notre intelligence et de notre conscience, il faut aborder les sciences cognitives et l'épistémologie. Parmi tous ces savants chercheurs de notre intelligence, on trouvera différents courants de pensée (électriques pour certains, animistes ou phlogistiques pour d'autres comme on va le voir). En effet, certains ont une approche dualiste et considèrent la pensée comme détachée de nos neurones (corps & esprit) ; d'autres sont mecanistes et visualisent la pensée comme une émanantion de la globalité de notre activité synaptique (une fourmilière n'a pas d'âme et pourtant elle est globalement intelligente, quand chacune de ses fourmi est dénuée d'intelligence).

Une petite pause culturelle s'impose à nous pour comprendre ces différentes approches de la pensée et de son analyse. On reprendra Marvin Minsky, pionnier de l'IA, dont la maison chinoise est une vue de l'esprit, au propre comme au figuré ; on lira Pierre Changeux (L'Homme Neuronal), neuro-psychologue français écouté dans les sphères cognitivistes ; on écoutera Jean-Louis, référence maison de l'histoire et des techniques de l'IA sous ses différentes formes.

Cette pause effectuée, nous pouvons reprendre notre périgrination sur les voies de la reproduction de l'intelligence et de ses mécanismes. Nous avons identifié une approche mécanique, à la réseaux neuronaux, qui reproduit le fonctionnement basique du cerveau dans le bain amiotique des Fantatisc Francoise Fogelman Four Fans, autrement dit les NeuNeus que l'on peut consulter pour en savoir plus. Nous avons en outre identifié une approche analytique de nos modes de réflexion. Quels sont, en la matière (grise), nos mécanismes de production d'informations nouvelles ? Nous procédons principalement de deux manières : par déduction et par induction.

Le plus connu et le plus simple des deux modes est le premier. La déduction procède de la logique par association et succession d'informations. Elle est assez sûre dans le sens où, pour peu qu'on ait des informations correspondant aux prémices d'un énoncé, on peut mécaniquement déduire une information nouvelle sans coup férir (d'autant que je ne sais pas encore ce qui fait rire une machine, fusse-t-elle intelligente). Le problème est évidemment d'identifier ces règles d'association, de cause à effets, de symptômes à diagnostics ... ou l'inverse !

A ce niveau on reconnaît deux lignées de mécanismes, que l'on dénomme chaînage (id est enchaînement des règles logiques). Le chaînage avant permet de produire un diagnostic possible à partir de symptômes, à l'aide de règles de type "si X alors Y / si Y alors Z". Le chaînage arrière permet de valider un diagnostic en remontant à ses symptômes possibles : "pour que Z il faut que Y / pour que Y il faut que X". Certains langages de programmation sont même dédiés à ces types de réflexion, Prolog est un moteur d'inférences (autrement dit : mécanisme de production de connaissances à partir de règles appliquées à des connaissances) à chaînage arrière quand OPS5 est un langage basé sur le chainage avant.

L'induction pour sa part est plus fine mais moins sûre quant à sa capacité de production. Elle est moins mécanique que la déduction mais reste parfois le seul moyen de passer au-delà. L'induction consiste à reconnaître des schémas généraux de règles pour en inventer de nouvelles ayant les mêmes principes. L'induction procède par analogie sur ces schémas généraux que l'on appelle des modèles. Il s'agit de déterminer un modèle de règles (méta-règles) afin de l'instancier (instancier signifie produire un exemplaire à partir d'un moule décrivant les caractéristiques communes à tous les exemplaires issus de ce modèle) et produire de nouvelles règles (analogues). Par suite, ces nouvelles règles vont nous permettre de produire de nouvelles informations, but final avoué de toutes ces recherches ...

[disgression informative] ... la programmation n'est que manipulation d'information, voire production d'information. On remarquera que l'association pertinente d'informations constitue une nouvelle information, recelant plus ou moins d'intelligence.

La difficulté majeure dans la procédure inductive reste la détermination de modèle de règles. Il faut savoir extraire et généraliser les processus communs, à partir d'exemples connus et reconnus efficaces. L'induction ne relève ni de la recherche instinctive (qu'est-ce que l'instinct, d'ailleurs ? votre prochain essai après celui sur la nature de l'intelligence) et encore moins de l'aléatoire (l'essai sur l'aléatoire sera pour plus tard, ou aux calendes Tchernobyliennes). Si l'on devait l'apparenter à la recherche instinctive, c'est par le fait que l'on sent que la solution "pourrait être de telle forme", à condition de reconnaître des similitudes avec un autre système de réflexions aux conclusions déjà éprouvées.

Maintenant que l'on a des connaissances sur des connaissances et que l'on sait produire de nouvelles connaissances, est-on propriétaire des inférences de nos systèmes ? Ma raison et mon coeur parlerons mais je n'ai aucune notion de l'approche légale et juridique de la chose (j'ai déjà du mal à faire la différence entre ces deux mots !). Tant qu'il n'y a aucune plus-value extérieure lors du processus de l'information, je serais tenté de dire que je suis propriétaire de l'information produite, puisque toute l'intelligence de cette règle était contenue dans l'expression de la méta-connaissance que j'ai implémenté. S'il y a plus-value extérieure à mon système, par exemple si mes règles infèrent sur des connaissances avec lesquelles un tiers aura alimenté mon système, la propriété des connaissances résultantes produite sera partagée, voire sienne selon ce que je lui aurai cédé de mes droits d'auteur. Je doute cependant que la notion de création nous soit reconnue comme aux artistes.

Que dire des systèmes ayant des facultés d'apprentissage. Tout d'abord qu'ils sont peu nombreux de part la difficulté à capitaliser (confere JLG et non Karl Marx) intelligemment et automatiquement. Cette timidité des systèmes d'auto-apprentissage tient pour beaucoup à la nécessité de validation des informations produites par le système. Ces productions doivent correspondre à quelque chose d'effectivement avéré (par exemple : confirmation par un expert du diagnostic appris par auto-analyse). En fait, le système n'a pas les moyens de prouver la correction de ses productions ce qui explique qu'elles doivent être vérifiées. Il y a un monde de la vérification à la preuve (ça doit être une différence de niveau méta ou quelque chose comme ça).

On pourra avoir des systèmes experts d'auto-apprentissage à la condition qu'ils aient un expert (humain s'entend) pour les guider. Non seulement pour la simple validation mais aussi pour vérifier que le système ne produit pas autre chose que ce que l'on attend de lui. Un système s'alimentant de ses propres conclusion pourrait dévier du comportement attendu au fûr et à mesure des générations pour peu que les règles de productions aient un potentiel expressif plus large que ce pourquoi elles avaient été initialement prévues. Ces systèmes déviants ne sont pas les plus fréquents et l'on rencontrera plutôt des systèmes peu ou prou efficaces.

Cet exposé pourrait être enthousiasmant s'il correspondait à la réalité. Cependant, la raison industrielle exige beaucoup de pragmatisme. Ce côté terre à terre explique largement la frilosité de l'industrie à l'égard de l'IA. Contrairement aux techniques classiques, l'IA ne garanti pas de résultats déterminés mais seulement des méthodes. On ajoutera à cela la déception qui a fait suite aux premiers moments d'euphorie où l'on a promis des cyborgs pour demain et décrit l'IA comme la panacée.

Pourquoi R2D2 n'est-il pas de nos contemporains ? Pourquoi Kasparov est-il toujours champion du monde (quoique mis en difficulté par Deeper Blue ... ce texte date de fin 1995 !) ? Entre autres parce que l'humain possède encore quelques facultés d'avance sur la machine malgré sa puissance calculatoire et sa vitesse. Par exemple, l'homme a une capacité d'appréhension globale de l'information que n'a pas la machine. Il est très difficile a une machine d'apprendre à reconnaître une forme, une situation. La machine ne sait que regarder dans le détail. De plus le degré d'intelligence de l'homme tient plus du degré de ramification de son cerveau que de la taille de ce dernier. La machine a le volume, pas la complexité.

... pour le moment !



Home