Richard S. Sutton
Andrew G. Barto
Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente