Reinforcement Learning: An Introduction.
Andrew G. Barto
Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente