Nous avons besoin d’approches d’évaluation qui informent et guident les progrès d’apprentissage des enfants, et restent à jour avec les compétences et le contenu enseignés. »
Dans les cercles de l’éducation, le consensus grandit que les évaluations couramment utilisées ne saisissent pas l’ampleur de ce que les enfants apprennent (ou devraient être). Une récente étude de la Brookings Institution indique que, si les éducateurs et les acteurs de l’éducation du monde entier partagent en grande partie les mêmes attentes quant aux compétences importantes pour les générations futures, les pays sont à des stades très différents et utilisent des approches différentes pour y parvenir.
Les changements techniques élargissent nos possibilités
À ce jour, l’utilisation de la technologie pour l’évaluation s’est concentrée sur l’amélioration de la qualité des données et l’efficacité de l’évaluation. Les tests électroniques ont une longue histoire dans l’évaluation standardisée à grande échelle des étudiants dans les pays à revenu élevé, par exemple via le test cognitif d’aptitude scolaire (SAT) ou le Graduate Record Examinations (GRE). De même, les plateformes électroniques destinées à faciliter les évaluations orales en lecture précoce et en numératie sont largement utilisées pour les diagnostics sectoriels et les évaluations de programmes dans les pays à faible revenu. Cette technologie facilite la collecte et la gestion efficaces des données et permet aux experts de rendre les données d’évaluation exploitables grâce à une analyse juste à temps et à une aide à la décision intégrée pour les décideurs non techniques.
Les progrès de la puissance de calcul des appareils portables et des outils psychométriques ont considérablement facilité les tests adaptatifs. Bien que ces méthodes aient été utilisées dans des tests standardisés à grande échelle (par exemple, le Graduate Management Assessment Test ou GMAT), ils peuvent également être utilisés pour l’auto-évaluation et l’apprentissage auto-dirigé. Depuis les débuts des programmes de forage et de mise en pratique, l’apprentissage assisté par ordinateur a prouvé son utilité en raison de sa réactivité à certaines formes d’objectifs objectifs, permettant ainsi aux individus d’évaluer leurs propres progrès et lacunes en matière de compétences. La vertu du test adaptatif est qu’il peut, au moins en principe, offrir la promesse d’instruments valides et fiables aux deux extrémités d’une échelle cognitive et avoir une utilité pratique pour des pays aussi divers que la Finlande ou le Burundi.
Tirer parti de la technologie pour mieux évaluer les compétences complexes
Nous soutenons que la technologie peut rapprocher les évaluations de la révélation de la véritable manifestation des compétences ou des capacités étudiées. La technologie offre également des opportunités pour de nouvelles méthodologies d’évaluation qui offrent une compréhension plus différenciée et holistique des capacités et des besoins de l’enfant.
En tirant parti de la technologie pour mieux rapprocher les situations du monde réel où les capacités évaluées sont manifestes, nous espérons aborder deux problèmes interdépendants dans les évaluations traditionnelles: la mesure de l’impureté et la validité écologique.
L’impureté de mesure fait référence au phénomène selon lequel les scores qui résultent d’une évaluation représentent des différences individuelles à la fois dans la construction principale d’intérêt, ainsi que dans une multitude de processus ou de constructions corrélés. Par exemple, les mesures du contrôle inhibiteur indexent les différences individuelles dans le contrôle inhibiteur, ainsi que les différences individuelles dans la vitesse de traitement et le langage réceptif (qui informent la capacité d’un enfant à comprendre la tâche). La mesure de l’impureté sape donc la prémisse même de l’évaluation car nous ne mesurons peut-être pas ce qui était prévu.
La technologie peut aider à détecter les signatures comportementales et / ou physiologiques qui accompagnent de nombreuses constructions cognitives. La capacité d’acquérir et d’intégrer rapidement ces sources d’information aux performances des tâches permet une mesure plus précise et peut éventuellement affiner la caractérisation du construit étudié. Cela nous rapproche de la réponse à des questions fondamentales sur la question de savoir si les progrès (ou l’absence de progrès) d’un élève peuvent être entravés par des difficultés sous-jacentes ou des processus non cognitifs sous-développés. Un exemple d’évaluation multimodale basée sur la technologie est le travail effectué par des chercheurs de l’Université de Stanford combinant des données sur les gestes des étudiants à partir d’un capteur Kinect avec des données enregistrées à partir d’une interface utilisateur tangible, tandis que les étudiants travaillaient par paires pour résoudre une tâche cognitive.
Le problème de validité écologique fait référence à la déconnexion entre les contextes dans lesquels les évaluations cognitives se produisent souvent (c.-à-d. Émotionnellement neutres, en tête-à-tête, distractions minimales) et les contextes dans lesquels les capacités et les compétences évaluées sont utilisées (c.-à-d. sociaux avec des demandes d’attention complexes et concurrentes). Ainsi, le problème de validité écologique limite la validité des évaluations standardisées comme prédicteurs des résultats réels.
Évaluer l’employabilité et les compétences du 21e siècle
Il est essentiel de mesurer l’employabilité et les compétences du 21e siècle qui combinent des domaines cognitifs et non cognitifs, en particulier des aspects de collaboration, de communication ou de résolution de problèmes. La technologie peut aider à construire des évaluations qui ressemblent mieux aux contextes dans lesquels les compétences sont requises. Cela peut inclure la mise à profit de simulations, de jeux et / ou de modalités basées sur des agents pour mieux se rapprocher des demandes du monde réel. Par exemple, pour mesurer la collaboration, des évaluateurs traditionnellement hautement qualifiés observeraient les étudiants dans une simulation conçue pour évoquer le travail d’équipe. Bien que cet idéal soit réalisable, il est également prohibitif à conduire à grande échelle. Les efforts humains coûteux se trouvent être là où les solutions technologiques peuvent aider à fournir des gains d’efficacité substantiels; nous reconnaissons qu’un remplacement basé sur la technologie d’un environnement d’évaluation opéré par l’homme peut ne pas être un remplacement entièrement équivalent, mais ce que nous renonçons en représentation authentique nous pouvons récupérer en termes de rentabilité et dans la richesse d’autres données périphériques et physiologiques.
Les travaux sur SimCityEDU par GlassLab, Pearson et Educational Testing Service (ETS) illustrent ce type de technologie à des fins d’évaluation, qui déploie un jeu de simulation environnementale où les élèves trouvent des solutions à des défis environnementaux de plus en plus complexes tout en étant évalués sur leur capacité à résoudre des problèmes. . Un autre exemple est le travail sur l’évaluation furtive par des chercheurs de la Florida State University. L’évaluation furtive, dans le contexte de l’évaluation basée sur le jeu, signifie non seulement suivre le score d’un joueur sur le jeu, mais aussi les progrès d’un joueur sur des éléments d’évaluation intégrés discrètement sur des compétences spécifiques , comme la capacité de résister aux distractions ou d’identifier rapidement des schémas.
Pour les pays à faible revenu, RTI International a étudié l’utilisation de jeux courts sur tablette pour évaluer les compétences relatives à l’employabilité telles que la réalisation de tâches, la gestion du temps et l’identification des problèmes. La plupart des compétences non cognitives, contrairement aux compétences académiques en lecture ou en mathématiques, sont intrinsèquement difficiles à quantifier, et donc leur mesure a souvent reposé sur des questionnaires auto-déclarés ou rapportés par des formateurs qui sont limités dans la mesure dans laquelle ils fournissent des preuves des compétences Dans la question. Bien que l’évaluation des compétences dans un environnement simulé ou à réalité mixte ne soit encore qu’une approximation du monde réel, ces évaluations basées sur la technologie permettent de mesurer l’application par un étudiant de ces compétences dans une gamme de scénarios. Cette approche, en théorie, devrait présenter une compréhension plus nuancée non seulement du degré auquel les étudiants présentent ces compétences, mais également dans quelles conditions.
L’évaluation formative
Dans les exemples ci-dessus, nous avons principalement décrit l’utilisation de la technologie pour les évaluations sommatives ou ponctuelles des étudiants. La technologie peut également faciliter l’évaluation continue, l’apprentissage personnalisé et la sélection stratégique des éléments d’évaluation. Cela permet de suivre les performances individuelles des élèves au fil du temps et de fournir des conseils pédagogiques basés sur les données. Aux États-Unis, il existe déjà de nombreuses technologies de ce type, en particulier pour les évaluations en lecture, en écriture et en mathématiques. Dans ce cas aux États-Unis, la technologie offre un potentiel d’enseignement qui comble le fossé entre ce que les élèves savent actuellement et ce qu’ils sont censés savoir. Bien qu’il puisse être ambitieux de s’attendre à ce que les enseignants, en particulier lorsque les capacités sont faibles et les classes nombreuses, mettent en œuvre un enseignement personnalisé, une telle technologie soutient la prise de décisions pédagogiques en matière de rythme, de regroupement et d’utilisation du matériel, répondant ainsi aux besoins des élèves en tenant compte du curriculum. . À ce jour, cependant, il existe peu d’exemples publiés d’utilisation de la technologie pour l’évaluation formative dans des contextes à faible revenu.
Identifier les handicaps
En outre, les avancées récentes dans les plates-formes électroniques de dépistage du handicap pour les appareils mobiles ouvrent des opportunités pour des évaluations plus complètes et la compréhension des capacités et des besoins des apprenants. En Éthiopie, RTI a mis à profit la technologie basée sur le téléphone mobile pour le dépistage visuel et auditif de plus de 3 700 étudiants en combinaison avec une évaluation électronique de leurs compétences en lecture. Dans un autre exemple, des chercheurs de l’Université de Jyväskylä en Finlande examinent la faisabilité d’un jeu de conscience phonologique pour prédire la dyslexie étudiante. Aux États-Unis, une équipe de chercheurs de l’Université du Nord du Texas étudie l’utilisation de la réalité virtuelle pour évaluer les compétences et les déficits neurocognitifs, y compris le traitement attentionnel de supervision et le trouble de déficit d’attention / hyperactivité. La technologie facilite ainsi l’intégration d’une gamme de méthodologies d’évaluation, offrant une compréhension plus différenciée et holistique des capacités et des besoins de l’enfant.
Possibilités et limites
Cependant, toutes les situations d’évaluation ne se prêtent pas à l’utilisation de la technologie. Une récente évaluation en lecture et en mathématiques réalisée dans le cadre du Défi de l’éducation des filles financé par le Département du développement international du Royaume-Uni en Afghanistan est revenue à l’utilisation du papier et du crayon car l’approvisionnement en électricité pour la collecte de données assistée par la technologie était impossible à garantir.
Le déploiement d’approches d’évaluation multimodales fondées sur la technologie combinant des évaluations cognitives avec des données physiologiques peut également ne pas être réalisable à grande échelle dans de nombreux contextes. Au lieu de cela, au cours des prochaines années, l’utilisation de ces méthodologies pourrait éclairer la conception et l’amélioration de l’évaluation (par exemple, sa durée), ainsi que les programmes d’intervention connexes, grâce à des applications basées sur des échantillons relativement petites. À terme, ces technologies pourraient être utilisées pour la mesure universelle.
De même, l’utilisation de la technologie pour faciliter une évaluation personnalisée durable et la fourniture de contenu au niveau des enfants restera probablement inabordable dans les contextes à faible revenu au moins pour les cinq à dix prochaines années. Les tablettes à bas prix coûtent environ 40 $ US, un montant insignifiant pour les pays à revenu élevé qui dépensent plus de 15 000 $ par étudiant par an. Mais cela est probablement trop élevé dans des pays comme le Malawi, qui ne dépensent que 30 $ par élève du primaire par an.
Les questions clés auxquelles répondre en utilisant la technologie pour l’évaluation sont les suivantes: Quelle est la valeur ajoutée de la technologie? Quel type d’interférence proviendra potentiellement de l’utilisation de la technologie pour l’évaluation? Comment l’introduction de la technologie change-t-elle ce que nous mesurons? Quelles sont les éventuelles préoccupations éthiques ou de confidentialité concernant l’utilisation de la technologie pour l’évaluation?
De plus, avec la puissante présence des médias sociaux, nous laissons une trace non seulement de nos goûts »et de nos aversions (implicites), et donc de notre composition psychologique et de ses corrélats, mais, ce qui est important d’un point de vue éducatif, nous laissons une trace de notre compétences et préférences cognitives. Les publications Facebook pourraient être analysées pour nos compétences en rédaction, ce que nous recherchons dans Google pourrait être analysé pour la sophistication, pour ainsi dire, de nos préoccupations. De courts tests cognitifs, courants maintenant sur Facebook comme activité amusante, pourraient se transformer en possibilité de tester littéralement les utilisateurs pendant des heures et des heures et au fil du temps. Cela est susceptible de se produire sans la permission des gouvernements, des groupes de réflexion, des universitaires ou des ONG. En fait, cela se produit déjà. Le problème est donc que, puisque l’éducation reste un bien public, comment le public devrait-il considérer l’utilisation de la technologie des médias sociaux dans le fonctionnement des plateformes d’évaluation éducative? Bien que tout cela puisse sembler futuriste aux 40% les plus pauvres du monde, les efforts actuels des grandes entreprises technologiques pour étendre Internet à de tels segments de la population sont axés sur le profit et, compte tenu de la puissance technologique et des poches profondes de ces entreprises, susceptible de se produire avant trop longtemps.