Resumen:
A área de pesquisa em Computação Afetiva tem buscado formas de melhorar a detecção da confusão do aluno em ambientes computacionais de aprendizagem. Ambientes capazes de detectar a confusão do estudante podem utilizar diferentes estratégias pedagógicas, como intervir no ambiente e auxiliar o aluno a resolver sua confusão ou controlar a confusão do aluno para beneficiar sua aprendizagem. O autor tem interesse em contribuir com o estado da arte na detecção da confusão sem o uso de sensores (livre de sensores) no contexto de aprendizagem de programação de computadores. A Tese levantou a hipótese de que utilizar dados sobre estimativas de conhecimento do aluno, juntamente de dados de interação do aluno com o ambiente computacional, pode melhorar o desempenho de modelos de aprendizado de máquina livres de sensores na detecção da confusão do estudante em tarefas de aprendizagem de programação, quando comparado a modelos baseline. Os modelos baseline representam os trabalhos relacionados, que desenvolveram seus modelos utilizando dados de interação do aluno com o ambiente. A hipótese da Tese é justificada em teorias cognitivas de emoções, que relacionam a confusão com avaliações (appraisals) de incompatibilidade entre a informação que chega para o aluno e o modelo mental do estudante, como o modelo mental de conhecimento anterior. Para verificar sua hipótese, a trabalho gerou diversos modelos de aprendizado de máquina que representam a abordagem da Tese (hipótese da Tese) e a abordagem baseline (trabalhos relacionados), para diferentes configurações de janelas de tempo de observação (5, 10, 20, 40, 60, 90, 120, 180, 240 e 360 segundos e variável), e para diferentes algoritmos. Testes estatísticos compararam os resultados dos modelos de cada abordagem (Tese e baseline). Também foram aplicados métodos para verificar os dados mais relevantes para os modelos e verificar o poder de generalização para estudantes com características heterogêneas. Os modelos de aprendizado de máquina foram treinados e testados com amostras formadas por dados coletados de 62 alunos de ensino técnico e superior, durante cinco meses, enquanto solucionavam exercícios em um software de programação adaptado para a Tese. Testes estatísticos mostraram que os melhores modelos da Tese apresentaram acurácia preditiva superior e significativa em relação aos melhores modelos baseline, em todas as janelas de observação. Em uma relação dos dez atributos de dados mais relevantes para os melhores modelos da Tese, cinco foram atributos sobre interação com o ambiente e os outros cinco foram atributos sobre estimativas de conhecimento do aluno. Em relação ao poder de generalização para estudantes com características heterogêneas, foram encontradas diferenças significativas e consistentes entre as abordagens em janelas de observação de 5, 10 e 20 segundos. Nestas janelas, o desempenho dos melhores modelos da Tese foi superior ao desempenho dos melhores modelos baseline. Os resultados apresentaram evidências positivas que suportam a hipótese da Tese, de que estimativas de conhecimento do aluno podem melhorar o desempenho de modelos de detecção de confusão livres de sensores nas tarefas de programação. A Tese apresenta discussões para outros resultados intermediários e sobre cenários onde a abordagem apresentada é mais vantajosa.