Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente
Resumo: Este trabalho tem como meta apresentar um módulo de diagnóstico para ser incluído na arquitetura tradicional de Sistemas Tutores Inteligentes. Neste módulo, é aplicada uma técnica de Aprendizado por Reforço (algoritmo Q-Learning) que possibilita modelar autonomamente o aprendiz. O maior valor de utilidade é calculado baseado em uma tabela de pares estado-ação, a partir da qual o algoritmo estima reforços futuros que representam os estados cognitivos do aprendiz. A melhor política a ser usada pelo tutor para qualquer estado cognitivo do aprendiz é disponibilizada pelo algoritmo de Aprendizagem por Reforço.
Abstract: The goal of this paper is to present a diagnostic module to be included in an Intelligent Tutoring System (ITS) architeture. In this module, a Reinforcement Learning technique (Q- Learning algorithm) is applied, making it possible to autonomously model the learner. A maximum utility value is calculated based on a state-action table upon which the algorithm estimates future rewards which represent the cognitive states of the learner. The best action policy to be used by the tutor at any learner¿s cognitive state is made available by the Reinforcement Learning algorithm.
2003