19.02.2018

Historique

Cet historique est basé en grande partie sur le premier chapitre de Why People Get Lost (de Paul Dudchenko , 2010), complété par un recours aux articles d'origine qu'il cite, notamment pour les illustrations.

A l'époque du premier laboratoire de psychologie au monde, celui de Wilhelm Wundt à Leipzig, ouvert en 1879, la psychologie était une discipline jeune aux approches multiples. On s'y intéressait au traitement des stimuli par l'esprit, mais aussi à la psychologie sociale, au développement de l'enfant, au comportement des animaux. L'introspection était considérée comme un outil de choix pour accéder aux mécanismes de l'esprit humain. Or, si elle a des mérites certains, et s'il faut bien admettre que l'étude de certains phénomènes (comme p.ex. les illusions perceptives) nécessite qu'on fasse appel à elle, l'introspection a aussi des limites et des défauts: le résultat des introspections est évidemment très subjectif, elle ne donne pas accès aux mécanismes inconscients, et ses produits ne sont pas souvent réplicables. La fragilité de cette méthode, selon ses détracteurs de l'époque, empêche la psychologie (une discipline expérimentale pourtant) de faire sa place parmi les vraies sciences naturelles.

James B. Watson , un jeune chercheur de Chicago, propose alors en 1919 une approche destinée à rapprocher la psychologie des sciences "dures", en en faisant une branche purement objective et expérimentale, dont le but théorique est la prédiction et le contrôle du comportement. L'introspection et les phénomènes accessibles à la conscience n'y ont guère leur place: on cherche à comprendre (dans le sens restreint ci-dessus) le comportement de manière unifiée, sans qu'il soit nécessaire de distinguer, par exemple, entre comportement humain et comportement animal.

Ainsi, cette psychologie des années 1920, qu'on appellera logiquement le béhaviorisme, se centre sur le comportement, objectivement mesurable, et comme on ne postule pas de différence de base entre espèces, on choisit volontiers d'étudier les mécanismes psychologiques chez des animaux plus commodes que les humains: en particulier les rats.

Cette position n'est pas absurde. Les rats sont, comme les humains, des mammifères, et les systèmes nerveux des mammifères ont de nombreux points communs. On peut postuler que les mécanismes de base de l'apprentissage, de la mémoire, de la perception, de l'attention, et même les mécanismes émotionnels, présentent des similitudes suffisantes pour qu'on puisse étudier sur le rat les mécanismes qu'on suppose chez l'homme et qu'on ne peut pas toujours étudier directement sur celui-ci, pour des raisons éthiques ou de commodité.

Or, les études sur l'apprentissage et plus généralement sur l'intelligence chez les rats ont dès le départ, et bien avant la pétition de principe de Watson, eu un lien très fort avec les questions d'espace (est-ce pour cette raison que la cognition spatiale est restée le parent pauvre de la psychologie cognitive par la suite? "l'espace, un truc de béhavioriste, des rats dans des labyrinthesà"): en effet, dès 1901, pour réaliser une "étude expérimentale des processus mentaux du rat" (c'est le titre de l'article [1] ), Willard Small met ses sujets dans un labyrinthe , inspiré du labyrinthe [2] qui se trouve dans un coin du palais royal de Hampton Court , à l'ouest de Londres: sa topologie est la même, mais Small l'a "redressé" pour en faire un rectangle. Murs et plafonds sont en treillis, donc le labyrinthe (contrairement à celui de Hampton Court) est "transparent".

D'abord perdus et parcourant les culs-de-sac, les rats s'améliorent au fil des passages, passant de 13 minutes au premier essai à une minute au neuvième. Il est intéressant de noter que des rats aveugles montraient les mêmes performances. Small supposait que les rats associaient les réponses correctes à la récompense de nourriture qui se trouvait au bout.

En 1902, Kinnaman [3] entraîne des macaques rhésus dans un labyrinthe exactement identique (sauf qu'il est d'une taille adaptée aux singes) et trouve des résultats semblables , ce qui conforte les béhavioristes dans l'idée que les mécanismes d'apprentissage sont semblables entre espèces. Lorsque Watson reprend ces études en 1907 avec son collègue Carr [4] , il explore plus en détail ces mécanismes.

Pour ce qui nous intéresse ici, une série d'études faites par Watson explore ce qui se passe quand on prive le rat de certains sens, ou qu'on manipule le labyrinthe. Dans le noir ou carrément énucléés, les rats apprennent aussi vite qu'en pleine vision. Il déprive ensuite d'autres groupes de rats: les uns de l'odorat, les autres de l'ouïe, à d'autres encore il ôte les vibrisses, et même il anesthésie les pattes des derniers. Dans tous les cas, les rats apprennent aussi bien. Watson en conclut que les rats apprennent une série de réponses internes - un jeu de mouvements successifs, qui ne nécessite pratiquement aucun feedback de l'environnement. Ils démontrent ceci élégamment en raccourcissant une partie du labyrinthe après apprentissage: la forme générale des allées est maintenue, mais une série de lignes droites sont devenues plus courtes. Les rats foncent s'écraser dans les parois qui sont maintenant sur leur chemin.

Mais les choses ne sont pas si simples, et un autre résultat vient beaucoup troubler les conclusions de Watson: quand, après apprentissage, le labyrinthe est tourné de 180°, les rats normaux sont complètement perdus, comme l'écrit Watson, dépité, dans cet article [5] . Ceci semble s'opposer à l'idée d'une mémoire kinesthésique, que tout, pourtant, semblait confirmer.

En fait, ceci suggère que cette mémoire kinesthésique, qui existe bel est bien, est cependant liée à, ou indicée par, une représentation que le rat possède de sa direction dans la pièce. Bien que cette indexation ne soit pas à proprement parler utile pour résoudre le labyrinthe, elle se fait automatiquement [6] . A un point de choix, le rat n'enregistre pas la réponse égocentrée "je tourne à droite": il enregistre peut-être plutôt: "je tourne en direction du nord (ou de la fenêtre, ou...)"

Face à ces résultats, Watson se demande si les rats n'auraient pas (comme on le supposera ensuite, avec raison, pour les pigeons) un "sens de la direction" que n'auraient pas les êtres humains.

Si l'idée d'un sens supplémentaire tombait apparemment à côté de la réalité, cet accent sur la représentation de la direction de soi prendra toute son importance dans les années 90, comme on le verra plus loin, avec la découverte des cellules de direction de la tête et de tout le traitement qui vient en amont de celles-ci.

De son côté, Karl Lashley (1890-1958), qui est aujourd'hui surtout connu pour son ouvrage de 1950, In Search of the Engram [7] , étudie aussi l'orientation des rats dans les labyrinthes. Son intérêt à lui, c'est de savoir où se trouve la mémoire, et ici la mémoire spatiale. Il effectue des lésions corticales sur ses sujets, et constate que le déficit dépend surtout de l'étendue des lésions , pas de leur localisation. Les rats font d'autant plus d'erreurs que le pourcentage de cortex lésé est grand, et ce de manière quasi exponentielle. Il en conclut que la mémoire spatiale est distribuée un peu partout dans le cortex. Si on sait maintenant que des structures sous-corticales bien localisées (et pas touchées par Lashley) sont cruciales pour l'établissement et la consolidation de la mémoire, en particulier de la mémoire spatiale, il reste vrai que les souvenirs une fois consolidés sont massivement stockés dans les connexions cortico-corticales.

Incidemment, Lashley observe aussi des cas de raccourcis faits par les rats, qui, trouvant une façon de sortir des allées grillagées du labyrinthe, passent ensuite par-dessus tout le labyrinthe, en ligne droite jusqu'au but: comme le remarque Tolman en commentant ces observations anecdotiques, "all such observations suggest that rats really develop wider spatial maps which include more than the mere trained-on specific paths."

Edward Chace Tolman (1886-1959), quant à lui, a été influencé par le béhaviorisme, mais il développe finalement une position originale, sur la base d'une série fouillée de 9 études publiées avec quelques collègues autour de 1946, les Studies in Spatial Learning. Son approche, en effet, constitue le début d'une psychologie cognitiviste: les rats ne se contentent pas d'apprendre une série de réponses, ils ont des cognitions concernant la localisation du but. Se fondant sur les observations anecdotiques de Lashley, Tolman, par exemple, met au point une expérience qui vise à montrer que le rat, même s'il a appris à suivre les allées du labyrinthe, possède une représentation de quel est le chemin direct (pour ainsi dire vectoriel) qui mène au but. Cette expérience du  " sunburst maze " de Tolman a lieu ainsi: d'abord le rat apprend à rejoindre la nourriture en suivant, depuis une placette ronde, une série de 4 allées successives menant au but. Une fois que le rat a bien appris le labyrinthe, celui-ci est remplacé par une version nouvelle: l'allée qui permettait de sortir de la placette est maintenant un cul-de-sac, et 18 autres allées partent de la placette. Le rat commence bien sûr par entrer dans l'allée habituelle. Confronté à une voie sans issue, il revient en arrière dans la placette et se met à explorer les entrées des différentes allées, sur quelques centimètres. "After going out a few inches only on any one path, each rat finally chose to run all the way out on one." Dans quelle allée les rats de l'échantillon choisissent-il préférentiellement de courir ensuite? Celle qui mène dans la bonne direction globale du but depuis la placette , soit l'allée no. 6. Ceci semble indiquer qu'ils ont à leur disposition une représentation générale du lien spatial existant entre la placette centrale et le but.

Même dans un labyrinthe tout simple, en T, se demande déjà Tolman, est-ce que les rats apprennent à faire un acte moteur ("tourner à droite," une répose égocentrée) ou bien à aller vers un lieu qui est toujours le même (une réponse allocentrée)? Pour répondre à cette question, Tolman utilise un labyrinthe en T surélevé et deux groupes de rats. Pour le premier groupe, chaque rat est alternativement mis au point de départ S1 et S2, et doit apprendre à tourner toujours à sa droite pour trouver la récompense: quand il part de S1, la nourriture est en F1, et quand il part de S2, la nourriture est en F2. Pour le second groupe, chaque rat part aussi alternativement de S1 et de S2, mais la nourriture est toujours en F1, c'est-à-dire dans le même point de l'espace. Lequel des deux groupes apprend-il le plus facilement? Tolman trouve que c'est le groupe "lieu" qui apprend vite (à partir du 9ème essai, les 8 rats de ce groupe ne se trompent plus), alors que la tâche reste difficile pour le groupe "réponse". Il semble donc que ce que les rats apprennent, ce n'est pas une réponse égocentrée, mais une représentation du lieu où ils doivent aller - une information allocentrée. Plus tard, d'autres chercheurs, comme Ritchie et al. (1950) suggéreront qu'effectivement ce qu'apprend le rat c'est d'abord un lieu, mais que si on le surentraîne, il apprend la réponse motrice, une réponse automatique qui diminue le coût cognitif de traiter l'information (complexe) de lieu. Evidemment, cette réponse automatisée se fait au détriment de la souplesse et de l'adaptabilité dans la réponse!

En 1948, Tolman consigne ses conclusions dans un article de revue, toujours cité à ce jour, qui s'intitule Cognitive Maps in Rats and Men. Tolman y suggère que les processus mentaux qui mènent à la réponse de l'animal ne sont pas aussi simples que ce qu'on croyait, et que la représentation sous-jacente est élaborée dans une sorte de centre de contrôle (ressemblant plus à la salle des cartes d'un navire qu'à un central téléphonique) et prend la forme de quelque chose qui ressemble à une carte de l'environnement:

This group (and I belong to them) may be called the field theorists. We believe that in the course of learning something like a field map of the environment gets established in the rat's brain. We agree with the other school that the rat in running a maze is exposed to stimuli and is finally led as a result of these stimuli to the responses which actually occur. We feel, however, that the intervening brain processes are more complicated, more patterned and often, pragmatically speaking, more autonomous than do the stimulus-response psychologists. Although we admit that the rat is bombarded by stimuli, we hold that his nervous system is surprisingly selective as to which of these stimuli it will let in at any given time. Secondly, we assert that the central office itself is far more like a map control room than it is like an old-fashioned telephone exchange . The stimuli, which are allowed in, are not connected by just simple one-to-one switches to the outgoing responses. Rather, the incoming impulses are usually worked over and elaborated in the central control room into a tentative, cognitive-like map of the environment. And it is this tentative map, indicating routes and paths and environmental relationships, which finally determines what responses, if any, the animal will finally release.

Tolman, en véritable précurseur, continue en se demandant quel est l'empan de l'information contenue dans cette sorte de carte. Est-ce une carte globale, qui permet de résoudre des problèmes spatiaux nouveaux et complexes, ou une carte plus proche d'un simple itinéraire, ne contenant que ce qui était proche du chemin parcouru?

Finally, I, personally, would hold further that it is also important to discover in how far these maps are relatively narrow and strip-like or relatively broad and comprehensive. Both strip-maps and comprehensive-maps may be either correct or incorrect in the sense that they may (or may not), when acted upon, lead successfully to the animal's goal. The differences between such strip maps and such comprehensive maps will appear only when the rat is later presented with some change within the given environment. Then, the narrower and more strip-like the original map, the less will it carry over successfully to the new problem; whereas, the wider and the more comprehensive it was, the more adequately it will serve in the new set-up. In a strip-map the given position of the animal is connected by only a relatively simple and single path to the position of the goal. In a comprehensive-map a wider arc of the environment is represented, so that, if the starting position of the animal be changed or variations in the specific routes be introduced, this wider map will allow the animal still to behave relatively correctly and to choose the appropriate new route.

Paradigmes

Dans la section qui suit, on va détailler les paradigmes les plus courants concernant les études en laboratoire sur les mammifères. En effectuant ce choix, on va évidemment passer à côté du grand nombre d'études qui portent sur, par exemple, les oiseaux migrateurs ou les pigeons voyageurs, comme les études en cage d'orientation, à l'intérieur d'un planétarium, que Stephen Emlen faisait subir à ses sujets , des passerines indigo (un oiseau migrateur solitaire nocturne) dans les années 70. Ou celles de l'équipe de Wolfgang Wiltschko qui travaillait sur la perception du champ magnétique dans l'orientation des pigeons voyageurs, en lâchant ceux-ci après différentes manipulation ou après les avoir munis d'électro-aimants.

Nous aborderons quand même par la bande les études de Rüdiger Wehner sur les fourmis du désert, études que l'on réalise par exemple en suivant des fourmis en liberté sur un terrain marqué , ou encore en les faisant s'orienter à l'intérieur de canaux à ciel ouvert disposés sur le sol du désert .

Cependant, ce sont les mécanismes neurobiologiques des mammifères, et en particulier des rongeurs, que nous allons le plus discuter ici, raison pour laquelle il nous est nécessaire de savoir comment les chercheurs ont travaillé sur leurs animaux.

Les tâches spatiales de laboratoire

L'archétype des tâches d'orientation, comme on l'a vu, est bien sûr le labyrinthe. Ces premiers labyrinthes étaient complexes (voir par exemple celui de Shepard). Leur complexité même rendait difficile l'analyse des comportements des animaux, notamment en ce qui concerne les stratégies employées (qui peuvent différer selon l'animal et mener toutes au succès). On mesurait typiquement la latence (temps pour réussir la traversée du labyrinthe) et le nombre d'erreurs. Tous deux diminuaient au fur et à mesure que l'animal apprenait à réaliser la tâche.

La simplification de ce paradigme a mené aux labyrinthes en T et au labyrinthe radial. Les rats ont deux tendances naturelles: l'exploration de nouveaux endroits et une stratégie de changement dans l'exploration (si je suis allé à droite la 1ère fois, je vais à gauche la seconde) dite d'alternation spontanée. La base de ces tâches de type labyrinthe est donc éthologique puisqu'elles reposent sur un comportement instinctif.

Labyrinthe en T

Le labyrinthe en T est... en forme de T. L'animal est libéré au premier essai dans le "tronc", et il va choisir une des deux branches terminales (donc tourner à gauche ou à droite). Remis au départ pour l'essai suivant, il va à nouveau choisir une des branches.

En renforçant les tendances naturelles mentionnées ci-dessus dans un labyrinthe en T (en récompensant l'animal alternativement dans une branche et l'autre), on aboutit à un test de la mémoire de travail (de quel côté je suis allé à l'essai précédent?).

Comment l'animal peut-il faire pour résoudre la tâche, pour se souvenir de, ou "encoder", l'essai précédent? En enregistrant la séquence de mouvements (sans s'occuper d'où le bras est dans la pièce) - une stratégie égocentrée associant stimulus [8] à réponse? Ou bien une stratégie allocentrée faisant appel à une mémorisation des directions prises "dans le monde"?

On a montré en faisant une rotation de 180° du labyrinthe en T durant l'expérience, entre un essai et le suivant (Douglas, 1966) que c'est l'orientation du rat dans la pièce, et non pas la réponse égocentrée, qui dirige le mouvement du rat [9] . Autrement dit, si l'animal a choisi la branche "ouest" à un essai, il choisira la branche "est" au suivant, même si pour cela il doit les deux fois de suite tourner son corps vers la gauche au point de décision.

Le labyrinthe en T peut aussi servir à tester la mémoire de référence (à long terme), si on demande de jour en jour à l'animal de choisir le même bras.

Ce paradigme, bien que très simple, permet de mettre en évidence des phénomènes étonnants, comme par exemple le fait que les stratégies spatiales mises en œuvre peuvent dépendre de l'état hormonal de l'individu. Ainsi, il y a chez les rats femelles un effet du cycle menstruel sur la stratégie adoptée par l'animal pour apprendre à aller à la nourriture. Dans une expérience, on prend des rattes à différents moments de leur cycle, et on les met au départ d'un labyrinthe en T. Le but (la nourriture) se trouve dans la branche de droite. Les animaux apprennent tous à la même vitesse, quel que soit leur état hormonal (environ 25 essais pour atteindre un certain critère de réussite). On pourrait donc croire que les rattes ont toutes mis en œuvre la même stratégie d'apprentissage; or, il n'en est rien.

Pour le savoir, on fait un essai de transfert ("probe test") sans nourriture et où le labyrinthe est tourné de 180° autour de son centre: l'animal va-t-il répondre de manière égocentrée, en répétant une réponse motrice ("je tourne sur ma droite au point de choix") ou de manière allocentrée, pour se diriger vers un lieu ("je vais "là", même si pour cela je dois cette fois tourner à gauche")?

Ainsi que le montrent les résultats, les femelles en proœstrus (avant l'ovulation) se dirigent en grande majorité vers le lieu réel où se trouvait la nourriture: elles ont appris à aller vers un lieu, pas une réponse motrice. Par contre, les femelles en oestrus (proches du moment d'ovulation) tournent majoritairement sur leur droite: elles ont appris une réponse motrice, pas à aller vers un lieu. Le cycle hormonal influence donc de manière massive la stratégie (mais pas l'efficacité) d'apprentissage spatial chez le rat femelle.

Labyrinthe radial

Inspiré par le sunburst maze de Tolman et inventé par Olton et Samuelson [10] , il a 4 à 12 bras disposés comme les rayons d'une roue (d'où son nom).

Dans le labyrinthe radial [11] , l'animal, libéré au centre, trouve de la nourriture à l'extrémité de chaque bras. Il l'ingère en une fois, de sorte qu'il ne lui sert à rien de revenir dans un bras déjà visité. Dans la version de base, on vérifie simplement que l'animal apprend à ne plus faire d'erreurs de ce type: on teste ainsi sa mémoire de travail (mémoire à relativement court terme).

On peut aussi tester sa mémoire de référence (mémoire à long terme): on l'oblige à choisir 4 bras particuliers (en fermant les autres), puis on l'ôte du labyrinthe un temps assez long, et on le remet: saura-t-il compléter son exploration en ne choisissant que les 4 autres bras?

Fermer quatre bras a par ailleurs l'avantage d'empêcher l'animal de recourir a des stratégies stéréotypées, efficaces mais pas intéressantes, comme de prendre toujours le bras qui est juste à droite du bras d'en face.

On compte les réussites et les erreurs (oublier un bras; entrer dans un bras déjà visité). L'avantage d'un tel labyrinthe (contrairement aux labyrinthes complexes de type Hampton Court) est qu'une erreur ne perd pas l'animal: il peut continuer la tâche.

Par exemple, Suzuki et collègues, en 1980, se demandent si les repères placés autour du labyrinthe et qui aident l'animal à mémoriser les branches déjà visitées sont utilisés en isolation les uns des autres ou en configuration. Pour répondre à cette question, ils disposent leur labyrinthe radial à l'intérieur d'une enceinte ronde, symétrique, et ils posent contre les parois des repères très différents les uns des autres, alignés avec les différents bras du labyrinthe. On laisse le rat visiter trois bras puis on le bloque au milieu. On fait une manipulation sur les repères, et on relâche le rat, qui doit donc entrer dans les 5 bras restants sans faire d'erreur. Comment les manipulations de repères influencent-elles le taux de succès? Quand on ne change rien aux repères, les rats en moyenne, font 10% d'erreurs (ils entrent en moyenne dans 4.5 bras sur les 5 corrects). Quand on déplace les repères tous ensemble de 180° (ce qui ne défait pas leur configuration), les rats font en moyenne 20% d'erreurs (avec les bras corrects définis relativement à cette nouvelle disposition des repères). Et quand on déplace les repères de manière désordonnée (avec les bras corrects définis par les repères qui sont alignés avec eux), les rats font 42% d'erreurs. Ce n'est donc pas seulement les repères pris individuellement (tel bras aligné avec tel repère) que les rats mettent dans leur représentation de l'espace environnant, mais aussi la configuration (tel repère est à gauche de tel autre, etc.).

Il est facile d'adapter la tâche pour tester non seulement la mémoire de travail mais la mémoire à long terme, en laissant s'écouler du temps entre les premiers choix et les derniers.



[1] Small, W. S. (1901). Experimental study of the mental processes of the rat. II. The American Journal of Psychology, 206-239.

[2] Planté en 1690 par George London et Henry Wise pour Guillaume III d'Orange.

[3] Kinnaman, A. J. (1902). Mental life of two Macacus rhesus monkeys in captivity. II. The American Journal of Psychology, 13(2), 173-218.

[4] Cf. p.ex. Carr, H., & Watson, J. B. (1908). Orientation in the white rat. Journal of Comparative Neurology, 18(1), 27-44.

[5] Watson, J. B. (1907). Kinaesthetic and organic sensations: Their role in the reactions of the white rat to the maze. The Psychological Review: Monograph Supplements, 8(2), 1-100; voir pages 85 et suivantes.

[6] On voit dès lors que cette résolution de lybyrinthe, en principe strictement égocentrée, combine en réalité déjà des représentations égocentrées et des représentations allocentrées.

[7] Lashley, qui était biologiste et généticien de formation, cherchait à identifier le siège de la mémoire dans le cerveau; il est arrivé à la conclusion que la mémoire n'était pas localisée en un endroit, mais distribuée partout dans le cortex, et a avancé deux hypothèses: celle de l'action de masse (la vitesse, l'efficacité et la précision de l'apprentissage dépendent de la quantité de cortex disponible) et celle de l'équipotentialité (une partie du cortex peut reprendre la fonction d'une autre, lésée).

[8] Le stimulus étant ici le point de décision du labyrinthe, néanmoins associé au souvenir de la décision à l'essai précédent!

[9] Le taux d'alternation est de 81% après transfert dans le second labyrinthe; mais si on secoue le rat horizontalement entre-deux, cela tombe à 53%. Des rats ayant des lésions vestibulaires n'alternent pas.

[10] Olton, D. S. (1978). Characteristics of spatial memory. In Cognitive Processes in Animal Behavior,  eds. S. H. Hulse H. Fowler and W. K. Honig), pp. 341-373.

[11] On a montré que le hamster posé sur un labyrinthe radial à 4 bras appâtés sur 8 va d'abord explorer sans toucher aux graines, puis, dans une 2ème phase, va faire le tour du labyrinthe et amasser les graines, sans entrer dans les bras non appâtés ou déjà vidés. Hilton Jones et al. (1990), Hamsters (Mesocricetus auratus) use spatial memory in foraging for food to hoard. Behavioural Processes, 21, 179-187.