UQAM Programme de doctorat en informatique cognitive Cours DIC 8101
Computer science as Empirical Inquiry: Symbols and Search de Newell, Allen et Simon, Herbert A.
Résumé par Albert Lejeune
Remis aux professeurs Jean-Guy Meunier et Pierre Poirier
Montréal, le 20 novembre 2008
L'informatique (Computer Science) est une discipline empirique plutôt qu'une science empirique telle l'astronomie. Chaque machine, comme chaque programme est une expérience nouvelle. Le propos de Newell et Simon (N&S) consiste dans le développement d'une compréhension des phénomènes générés autour des ordinateurs au moyen de la recherche empirique. Ils examinent successivement le développement d'un système symbolique et le développement de la recherche heuristique.
Symboles et systèmes de symboles physiques (SSP) Les symboles sont à la racine de l'action intelligente qui est le thème premier de la recherche en IA (intelligence artificielle). On sait qu'il n'y a pas de principe dit 'intelligence' mais qu'il faut se poser la question de McCulloch (1961) : Qu'est-ce qu'un symbole, tel que l'intelligence puisse l'utiliser et qu'est-ce qu'une intelligence pouvant utiliser un symbole?
Les lois de la structure qualitatives Toutes les sciences caractérisent la nature essentielle des systèmes qu'elles étudient. Ces caractérisations sont de nature qualitative. Il en va ainsi pour la cellule en biologie, les plaques tectoniques en géologie, les microbes en médecine, ou la doctrine atomique en physique.
Les systèmes de symboles physiques Dans l'appellation 'système de symboles physiques' (SSP), l'adjectif physique désigne deux choses: 1. les systèmes obéissent aux lois de la physique et sont réalisables par des ingénieurs et 2. les symboles ne désignent pas seulement des symboles humains. Un SSP est donc un ensemble de symboles qui sont des patrons physiques qui se produisent en tant que composants d'un autre type d'entité appelé expression (ou structure symbolique). Le SSP comprend des processus qui opèrent sur des expressions pour en produire d'autres par création, modification, reproduction et destruction. Deux notions sont essentielles pour bien comprendre la structure du SSP: la désignation (une expression désigne un objet si le SSP peut affecter l'objet ou se comporter en fonction de lui) et l'interprétation (le SSD peut interpréter une expression si l'expression désigne un processus tel que le SSD puisse l'exécuter). L'hypothèse centrale est que le SSP possède les moyens nécessaires et suffisants de l'action intelligente générale.
Le développement de l'hypothèse symbole-système Un SSP est une instance de machine universelle impliquant que l'intelligence soit réalisée au moyen d'un ordinateur universel. Cependant le cas du système symbolique implique un énoncé supplémentaire sur la nature des systèmes intelligents. Cet énoncé impose de rappeler (1) la logique formelle, (2) les machines de Turing, (3) le concept de mémorisation d'un programme, (4) le traitement de listes et (5) le langage LISP. En (1), l'hypothèse S-S remonte aux travaux de Frege, Whitehead et Russell portant sur la logique formelle, notamment la logique de premier ordre. C'est une étape de manipulation des symboles formels; une attitude qui se retrouve dans le développement de la – mal nommée - théorie de l'information de Shannon. En (2), le développement du premier ordinateur digital et les travaux de Turing sur la théorie des automates peuvent être traités ensemble. Il faut aussi se rappeler les rôles joués par Emil Post et Alonzo Church. La contribution de N&S est dans la conceptualisation d'un symbole comme étant quelque chose qui désigne. Les données ne sont plus regardées comme des simples suites de 0 et de 1. En (3), il faut souligner que la mise en mémoire des programmes permet de les considérer et de les opérer comme étant des données, ce qui était déjà implicite dans le modèle de Turing. En (4), depuis 1956, le traitement de listes s'est rapidement développé. Les contenus des structures de données sont devenus des symboles, des patrons qui désignent, qui ont des référents. Le traitement de listes, c'est à la fois la création d'une mémoire
dynamique particulière, la démonstration de la nature de l'ordinateur comme étant à la fois un ensemble de types de données, un ensemble d'opérations sur ces types de données et un modèle de désignation. En (5), le langage LISP, créé par McCarthy's en 1959-60, complète la démarche d'abstraction de N&S en créant un nouveau système formel d'expressions symboliques.
L'évidence N&S établissent à ce point de la présentation, l'évidence d'une action intelligente des SSP. Il s'agit ici d'une généralisation empirique et non d'un théorème. Les faits concernent d'une part l'aspect suffisant d'un SSP pour produire de l'intelligence et, d'autre part, la nécessité d'avoir un SSP là où l'intelligence se manifeste. Comme dans la théorie du germe à la base de la maladie contagieuse, la recherche en IA recherche des domaines en quête d'intelligence pour ensuite construire un programme capable de se charger d'une tâche propre à ce domaine. Ce furent les cas du General Problem Solver (GPS) et des systèmes PLANNER et CONNIVER. Il faut mentionner également la recherche en modélisation du comportement symbolique humain.
La recherche heuristique La résolution de problème Pour un système donné, la résolution de problème est l'indicateur premier de la présence d'une intelligence. Énoncer un problème consiste à désigner (a) un test pour une classe de structures symboliques, et (b) un générateur de structures symboliques; la solution d'un problème consistant dans la génération d'une structure qui, en utilisant (b), va satisfaire le test (a). La recherche en IA a approfondi notamment le domaine des jeux d'échecs. La création d'un générateur de mouvements pose cependant la question de l'espace de représentation de ce jeu; un espace pour représenter les situations initiales et finales consistant en l'atteinte du but.
La recherche en résolution de problème En IA, dans la première décade, la résolution de problème était synonyme d'étude des processus de recherche dans un arbre de nœuds. Ce type de recherche va finir par se focaliser sur l'extraction d'informations à partir d'un espace de problème, qui devrait démontrer un certain degré d'ordre et de structure (patrons). Cet espace devrait être détectable et le générateur devrait pouvoir se comporter de façon différenciée selon le patron détecté. Les arbres de recherche ont été particulièrement explorés par des chercheurs voulant éviter d'utiliser la force brute de l'ordinateur en favorisant – à la manière des maîtres des échecs - les économies et la pertinence des branchements entre les nœuds. Un système intelligent doit suppléer à la sélectivité de son générateur de solution au moyen d'autres techniques exploitant de l'information. Les méthodes dites faibles contrôlent l'expansion exponentielle des nœuds de solution alors que les méthodes dites fortes préviennent de ce danger. Il faut distinguer également les situations plus structurées des situations moins structurées, là où le chercheur ne possède pas de théorie pertinente de la structure de l'espace du problème.
L'intelligence sans trop de recherche Peu de programmes dépassent les compétences d'un amateur. En effet, le cerveau humain bénéficie de traitement parallèle massif de l'information alors que l'ordinateur demeure une machine de traitement en série. Cependant des progrès sont en cours: (1) dans l'utilisation non locale de l'information, (2) dans les systèmes à reconnaissance sémantique et (3) dans la sélection de représentations appropriées.