Psychologie cognitive pour l'enseignant/Réduire la charge cognitive

Un livre de Wikilivres.
Aller à : navigation, rechercher


Plus une information à apprendre est composée d'un grand nombre de sous-éléments, plus elle aura tendance à saturer la mémoire de travail. Le nombre d’éléments présents en mémoire de travail s'appelle la charge cognitive : plus elle est élevée, moins la tache ou le concept abordé est facile. Il s'agit de la première limitation de la mémoire de travail sur l'apprentissage : si la mémoire de travail sature, l'apprentissage se passe mal, voire pas du tout. Pour prendre un exemple, c'est ce qui fait qu'un calcul trop compliqué est souvent un calcul qui demande de maintenir temporairement trop de résultats temporaires. Par exemple, c'est ce qui fait que vous aurez du mal à résoudre le calcul suivant de tête, vu que votre mémoire de travail ne peut pas stocker tous les résultats temporaires nécessaires pour mener à bien ce calcul :

    4565 * 891 

De plus, les informations à mémoriser ne sont pas les seules à utiliser la capacité de la mémoire à court terme : les relations que ces informations entretiennent entre elles vont aussi prendre de la place en mémoire de travail. Or, la mémoire de travail est utilisée pour comprendre ce que raconte un professeur, un texte, etc. Lors de cette compréhension, les informations à apprendre sont maintenues en mémoire de travail, afin d'être associées et reliées à des connaissances antérieures, et afin de faire des déductions : plus sa capacité est élevée, plus l'élève peut faire de connections et d'inférences. En conséquence, si une tache d'apprentissage sature la mémoire de travail, l'apprentissage se passe mal, voire n'a pas lieu.

C'est notamment le cas pour la compréhension de la transitivité par les enfants de 4 à 6 ans : les enfants ont souvent du mal à comprendre cette notion et à l'appliquer parce que leur mémoire de travail est trop faible. Il faut dire que comprendre la transitivité A -> B -> C demande de maintenir en mémoire de travail A, B, C, et les relations A->B, et B->C : cela fait beaucoup pour un enfant dont la mémoire de travail est très nettement inférieure à celle des adultes. Et à ce petit jeu, les enfants qui ont une mémoire de travail de plus grande capacité que leurs camarades ont nettement plus de facilité à comprendre la transitivité. De nombreuses expériences ont d'ailleurs relié l'évolution de la pensée chez l'enfant avec la capacité de la mémoire de travail[1].

Dans ces conditions, diminuer la charge cognitive est de première importance, reste à voir comment. Dans les grandes lignes, on peut identifier deux types de charge cognitive : une charge intrinsèque induite par la structuration des explications et des connaissances à apprendre, et une charge extrinsèque inutile qui dépend de la méthode de présentation utilisée. Dans ce chapitre, nous allons nous centrer sur la charge intrinsèque, la charge extrinsèque étant vue dans le cours sur les supports pédagogiques. Nous allons voir comment quelques modifications dans le séquencement des notions peuvent réduire la charge intrinsèque. Nous apprendrons donc comment structurer un cours ou des explications relativement complexes.

Le regroupement[modifier | modifier le wikicode]

Les limites de la mémoire à court terme semblent s’évanouir quand on est face à une situation familière. Ainsi, les experts dans un domaine peuvent retenir de grande quantités d’informations, bien au-delà de la capacité de la mémoire de travail. Par exemple, quand on présente une configuration de jeu à un joueur d'échec expert, il a tendance à mémoriser 4 à 5 fois plus de pièces qu'un novice. Cela vient du fait que les experts ont tendance à faire des regroupements : ils perçoivent des motifs qui permettent de classer les informations perçues dans des catégories d'objets, et de les regrouper. Ces regroupements forment un tout dans la mémoire de travail, et sont considérés comme un seul élément : on les appelés des chunks, ou schémas.

L'influence des connaissances antérieures[modifier | modifier le wikicode]

Mais cette capacité à faire des regroupements est assez dépendante des connaissances antérieures. Par exemple, les expériences de Yntema et Mueser montrent clairement que des contrôleurs aériens experts ne peuvent pas faire de regroupements dans des tâches de laboratoires déconnectées de leur expertise : leur mémoire de travail reste limitée à 7 informations en moyenne. Mais les études de Bisseret montrent que pour des tâches liées à leur domaine d'expertise, les contrôleurs aériens peuvent mémoriser jusqu’à 20 voire 30 informations dans leur mémoire de travail. Cette constatation a été vérifiée dans une grande quantité de domaines différents, comme l'expertise médicale, la programmation, la conception de circuits électronique, ou l'expertise mathématique. Pour reprendre l'exemple des joueurs d'échec experts, leur avantage mnésique ne vaut que pour des configurations de jeu rencontrées fréquemment, ceux-ci ayant des performances similaires à celles des novices pour des configurations de jeu aléatoires.

Cela vient du fait que ces chunks sont des connaissances mémorisées en mémoire à long terme : les regroupements doivent être mémorisés avant d'être utilisables. Les différences de performances entre experts et novices proviennent en partie de la mémorisation d’un grand nombre de regroupements spécifiques à ce domaine : on observe ce phénomène dans des domaines très divers, comme la programmation, la conception de circuits électroniques, les échecs, etc. Comme le dit Mislevy : « […] comparés aux novices, les experts dominent plus de faits et établissent plus d’interconnexions ou de relations entre eux. Ces interconnexions permettent de surmonter les limitations de la mémoire à court terme. Alors que le novice ne peut travailler qu’avec au maximum sept éléments simples, l’expert travaille avec sept constellations incarnant une multitude de relations entre de nombreux éléments ». C'est ainsi : un novice ne dispose pas de motifs ou de catégories familières qu'il peut utiliser pour regrouper de grandes quantités d'informations, et doit se débrouiller avec des informations élémentaires qu'il doit traiter individuellement.

Regroupements et schémas[modifier | modifier le wikicode]

Ce phénomène de regroupement a souvent lieu directement lors de la perception : plusieurs stimulus simples sont regroupés en un seul stimulus complexe. Ces regroupements perceptifs sont aussi appelés des chunks. On peut par exemple citer l'exemple des joueurs d'échec auxquels on demande de mémoriser une configuration de jeu : les novices doivent mémoriser des pièces indépendantes, tandis que les experts les regroupent en blocs de 3 à 5 pièces. Mieux : ces regroupements permettent de catégoriser des ensembles de pièces suivant leur sens stratégique, chaque regroupement étant associé au meilleur coup à jouer associée à cette configuration. Ce phénomène de regroupement est aussi utile en géométrie (Koedinger et Anderson, 1990) : les élèves qui ont de bonnes performances en géométrie ont acquis des regroupement visuels qui leur permettent de reconnaître des figures géométriques particulières (triangles, carrés, angles alternes-internes, etc), et d’accéder aux informations associées à ces figures. Ainsi, la capacité à résoudre certains exercices de géométrie dépend en partie de cette capacité à reconnaitre des figures, comme des angles alternes-internes, des figures géométriques, et ainsi de suite.

Mais certains regroupements sont des regroupements non pas perceptifs, mais conceptuels. Ces concepts relationnels, formés par interconnexion de concepts plus élémentaires, sont appelés des schémas. Ces schémas, de part leur caractère conceptuel, vont mémoriser des informations abstraites, commune à une classe d'objets ou de situations. Il s'agit là d'un point commun avec les catégories, à savoir la mémorisation des informations communes à une classe d'instances. Cependant, ces schémas sont plus flexibles, dans le sens où ceux-ci ne stockent pas que les points communs, les constantes, mais peuvent aussi mémoriser à la volée des informations variables. On peut se représenter ces schémas par des ensembles de cases, chaque case représentant un élément de l'objet ou du système. Certaines cases ont un contenu constant et invariable, alors que les autres stockent des détails qui peuvent varier suivant la situation.

De plus, ces schémas sont des regroupements de concepts. Pour donner un exemple, on peut prendre les recherches d'Egan and Schwartz, datées de 1979. Ces expériences comparaient les performances entre des spécialistes en électroniques et des novices : les cobayes devaient mémoriser un circuit électronique qui leur était présenté durant quelques secondes. Tandis que les novices se rappelaient de chaque pièce indépendamment, les experts se rappelaient d'ensembles de pièces assez conséquents, chacun de ces ensembles ayant un sens. Par exemple, les experts regroupaient un ensembles de résistances électriques, condensateurs, et bobines dans un sous-circuit qui correspond à un amplificateur de tension ou un amplificateur de courant. Dans cette situation, le chunk était une catégorie d'objet, à savoir un amplificateur de tension, ou autre. Comme le montre cet exemple, un schéma a une organisation hiérarchique : chaque schéma peut contenir des schémas plus élémentaires, qui sont eux-mêmes potentiellement constitués de sous-schémas, et ainsi de suite. Deplus, ces schémas vont aussi encapsuler les liens logiques et associations d'idées entre les informations regroupées.

Pour résumer :

  • un schéma est une abstraction qui mémorise ce qui est commun à plusieurs objets ou situations, comme une catégorie ;
  • un schéma peut relier plusieurs concepts simples et unifie le tout en un seul concept complexe ;
  • le schéma contient les relations logiques et les associations d'idées que ses éléments entretiennent entre eux ;
  • un schéma a une organisation plus ou moins hiérarchique où chaque schéma peut lui-même contenir des schémas plus élémentaires, qui sont eux-mêmes potentiellement constitués de sous-schémas, et ainsi de suite.

Recommandations pédagogiques[modifier | modifier le wikicode]

Voyons maintenant les recommandations pédagogiques que vous pouvons tirer de cette théorie.

Eliminer l'inutile[modifier | modifier le wikicode]

Diminuer la charge cognitive demande d'aller à l’essentiel, d'éliminer les informations superflues. Une expérience faite par Richard Mayer permet d’illustrer ce phénomène. L’expérience a comparé deux versions d’un texte scientifique, dont l’une était expurgée des informations quantitatives : cette dernière était nettement mieux retenue et comprise. Dans le même esprit, la recherche sur la compréhension de texte a montré l'existence d'un effet délétère des détails séduisants : des détails ou anecdotes intéressants peuvent perturber d'extraction de l'idée générale d'un texte et nuire à la mémorisation et à la compréhension. Cet effet est partiellement du à la capacité de la mémoire de travail, preuve en est que les sujets avec une bonne mémoire de travail sont nettement moins soumis à cet effet délétère.

Pré-training[modifier | modifier le wikicode]

Mais outre les techniques précédentes, il est aussi possible d'utiliser l'influence des connaissances antérieures sur la charge cognitive. Vu que les schémas sont pris comme un tout dans la mémoire de travail, on peut en déduire un conseil important : il faut réutiliser des concepts déjà abordés et/ou connus de l'élève pour simplifier les explications. De même, il est préférable d'introduire certains concepts précocement pour simplifier des explications ultérieures. Le plan du cours et des explications doivent idéalement être découpées en petites unités notionnelles cohérentes, qui sont progressivement assemblées en concepts plus complexes.

Pour donner un exemple, on peut citer l'étude de Mayer, Mautone, et Prothero, datée de 2002. Dans cette étude, des sujets jouaient à un jeu basé sur une leçon de géologie. Les élèves qui avaient reçu une instruction sur les termes de base (faille, arc, chaîne de montagne, etc) avant de jouer avaient une meilleure performance que les sujets qui découvraient la signification de ces termes en cours de jeu. Les élèves qui découvraient les termes en cours de jeu devaient former de nouvelles associations et de nouveaux schémas en même temps qu'ils réfléchissaient sur les problèmes. En comparaison, les sujets ayant reçu un enseignement préalable pouvaient se concentrer sur la résolution des problèmes posés lors du jeu.

Comme autre exemple, on peut citer l'étude de Clarke, Ayres, et Sweller, datée de 2005. Dans cette étude, des étudiants recevaient un cours sur les graphes mathématiques, et devaient utiliser un tableur lors de l'instruction. Un premier groupe de sujets n'avait aucune connaissance des tableurs avant d'entrer en cours et recevait des instructions sur le fonctionnement du tableur lors du cours, les explications étant intercalées entre les explications mathématiques sur les graphes. Le second groupe avait déjà reçu une instruction sur les tableurs avant le cours, et recevait uniquement une instruction sur le concept mathématique à aborder. Le second groupe voyait tout ce qui a rapport aux tableurs séparément de ce qui a rapport aux graphes : les informations liées aux tableurs étaient alors regroupées en schémas, diminuant la charge cognitive lors de l'apprentissage ultérieur sur les graphes. Et conformément à c qui était attendu, le second groupe avait des performances nettement meilleures.

Isolated/interacting element effect[modifier | modifier le wikicode]

La mémoire de travail surcharge facilement lors de l’apprentissage de concepts composés d’un grand nombre de composants/sous-concepts interagissant entre eux. Dans ce cas, la théorie de la charge cognitive recommande d’aborder chacun des composants indépendamment, avant de montrer comment ceux-ci interagissent ensemble. En faisant cela, la charge cognitive sera répartie dans le temps, améliorant l’apprentissage : on parle d’effet de l'isolation des éléments.

  • Premier exemple : les démonstrations qui utilisent des lemmes. Dans certains de mes cours d'université, les professeurs commençaient la démonstration du théorème, et l'interrompait au fil de l'eau pour démontrer les lemmes dont ils avaient besoin. Au lieu de faire cela, ils auraient du démontrer les lemmes avant de commencer la démonstration.
  • Autre exemple : si vous voulez expliquer le fonctionnement du circuit anatomique du réflexe du genou, il est préférable de décrire ce circuit, en voyant chacun de ses composant indépendamment, avant de montrer comment ce circuit fonctionne lors de l'exécution du réflexe.
  • Autre exemple : vous voulez enseigner comment fonctionne un processeur simple. Celui-ci contient plusieurs composants bien précis : une unité de calcul, un séquenceur, des registres, etc. Certains professeurs commencent directement leur cours par montrer comment une instruction s’exécute sur ce processeur : ils abordent chaque composant au fil de l’eau, quand ils en ont besoin. L'utilisation de l'isolated element effect recommanderait de voir indépendamment chaque composant du processeur un par un, avant de montrer le déroulement de l’exécution d'une instruction avec cet ensemble de composants.

Dans le même genre, chaque procédure doit être découpée en sous-procédures, qui entrainées indépendamment les unes des autres, avant d'être rassemblées pour obtenir la procédure complète. La première expérience sur le sujet portait sur l'apprentissage des procédures de sécurité électrique, qui demandent notamment d'utiliser plusieurs instruments comme des voltmètres ou des ampèremètres. Elle était réalisée par Pollock, Chandler, and Sweller en 2002. Les résultats ont clairement montré l'efficacité de ce principe d'isolation. On peut aussi citer l’expérience de Ayres de 2006 sur l'apprentissage de l'algèbre et des développements d'équations, et l'expérience de 2010 de Blayney, Kalyuga, and Sweller, sur l'apprentissage de l'utilisation d'un tableau pour des applications de comptabilité.

Séparation théorie-pratique[modifier | modifier le wikicode]

Il est aussi utile de séparer l'apprentissage des connaissances théoriques et les connaissances pratiques (procédures ou méthodes). Cela vient du fait que les connaissances qui portent sur les connaissances théoriques ont souvent une forte charge cognitive : voir ces connaissances en même temps que les connaissances liées aux procédures risque de faire saturer la mémoire de travail. Diverses expériences faites par Sweller et ses collègues, ont montré que cette séparation augmentait la compréhension et la mémorisation. En soi, cette séparation est une forme particulière des deux effets présentés plus haut.

Références[modifier | modifier le wikicode]

  1. néo-piagétiennes