Autor |
Kautzmann, Tiago Roberto; |
Lattes do autor |
http://lattes.cnpq.br/6635781352521505; |
Orientador |
Maillard, Patrícia Augustin Jaques; |
Lattes do orientador |
http://lattes.cnpq.br/5723385125570881; |
Co-orientador |
Ramos, Gabriel de Oliveira; |
Lattes do co-orientador |
http://lattes.cnpq.br/9281736089055094; |
Instituição |
Universidade do Vale do Rio dos Sinos; |
Sigla da instituição |
Unisinos; |
País da instituição |
Brasil; |
Instituto/Departamento |
Escola Politécnica; |
Idioma |
pt_BR; |
Título |
Os efeitos de usar estimativas de conhecimento do aluno em programação de computadores em modelos livres de sensores de detecção da emoção confusão; |
Resumo |
A área de pesquisa em Computação Afetiva tem buscado formas de melhorar a detecção da confusão do aluno em ambientes computacionais de aprendizagem. Ambientes capazes de detectar a confusão do estudante podem utilizar diferentes estratégias pedagógicas, como intervir no ambiente e auxiliar o aluno a resolver sua confusão ou controlar a confusão do aluno para beneficiar sua aprendizagem. O autor tem interesse em contribuir com o estado da arte na detecção da confusão sem o uso de sensores (livre de sensores) no contexto de aprendizagem de programação de computadores. A Tese levantou a hipótese de que utilizar dados sobre estimativas de conhecimento do aluno, juntamente de dados de interação do aluno com o ambiente computacional, pode melhorar o desempenho de modelos de aprendizado de máquina livres de sensores na detecção da confusão do estudante em tarefas de aprendizagem de programação, quando comparado a modelos baseline. Os modelos baseline representam os trabalhos relacionados, que desenvolveram seus modelos utilizando dados de interação do aluno com o ambiente. A hipótese da Tese é justificada em teorias cognitivas de emoções, que relacionam a confusão com avaliações (appraisals) de incompatibilidade entre a informação que chega para o aluno e o modelo mental do estudante, como o modelo mental de conhecimento anterior. Para verificar sua hipótese, a trabalho gerou diversos modelos de aprendizado de máquina que representam a abordagem da Tese (hipótese da Tese) e a abordagem baseline (trabalhos relacionados), para diferentes configurações de janelas de tempo de observação (5, 10, 20, 40, 60, 90, 120, 180, 240 e 360 segundos e variável), e para diferentes algoritmos. Testes estatísticos compararam os resultados dos modelos de cada abordagem (Tese e baseline). Também foram aplicados métodos para verificar os dados mais relevantes para os modelos e verificar o poder de generalização para estudantes com características heterogêneas. Os modelos de aprendizado de máquina foram treinados e testados com amostras formadas por dados coletados de 62 alunos de ensino técnico e superior, durante cinco meses, enquanto solucionavam exercícios em um software de programação adaptado para a Tese. Testes estatísticos mostraram que os melhores modelos da Tese apresentaram acurácia preditiva superior e significativa em relação aos melhores modelos baseline, em todas as janelas de observação. Em uma relação dos dez atributos de dados mais relevantes para os melhores modelos da Tese, cinco foram atributos sobre interação com o ambiente e os outros cinco foram atributos sobre estimativas de conhecimento do aluno. Em relação ao poder de generalização para estudantes com características heterogêneas, foram encontradas diferenças significativas e consistentes entre as abordagens em janelas de observação de 5, 10 e 20 segundos. Nestas janelas, o desempenho dos melhores modelos da Tese foi superior ao desempenho dos melhores modelos baseline. Os resultados apresentaram evidências positivas que suportam a hipótese da Tese, de que estimativas de conhecimento do aluno podem melhorar o desempenho de modelos de detecção de confusão livres de sensores nas tarefas de programação. A Tese apresenta discussões para outros resultados intermediários e sobre cenários onde a abordagem apresentada é mais vantajosa.; |
Abstract |
The research area of Affective Computing has been looking for ways to improve the detection of student confusion in computer-based learning environments. Environments capable of detecting student confusion can use different pedagogical strategies, such as intervening in the environment and helping students resolve their confusion or controlling it to benefit their learning. The author is interested in contributing to state the art in detecting confusion without using physical sensors (sensor-free) in the context of computer programming learning. The Thesis hypothesized that using data on student knowledge estimates and data on student interaction with the computer-based learning environment can improve the performance of sensor-free machine learning models in detecting student confusion in tasks of programming learning compared to baseline models. Baseline models represent related works, which developed their models using only student environment interaction data. The Thesis hypothesis is justified in cognitive theories of emotions, which relate the confusion with appraisals of incompatibility between the information that comes to the student and the student's mental model, such as the mental model of prior knowledge. To verify its hypothesis, the Thesis generated several machine learning models that represent the Thesis approach (Thesis hypothesis) and the baseline approach (related works) for different configurations of observation time windows (5, 10, 20, 40, 60, 90, 120, 180, 240 and 360 seconds and variable) and different algorithms. Statistical tests compared the results of each approach (Thesis and baseline). Methods were also applied to verify the models' most relevant data and the generalization performance for students with heterogeneous characteristics. The machine learning models were trained and tested with samples formed by data collected from 62 technical and higher education students for five months while solving exercises in a programming software adapted for the Thesis. Statistical tests showed that the best models of the Thesis approach presented superior and significant predictive accuracy compared to the best baseline models in all observation windows. In a list of the ten most relevant data attributes for the best models of the Thesis approach, five were attributes about interaction with the environment, and the other five were attributes about estimates of student knowledge. Regarding the performance of generalization for students with heterogeneous characteristics, significant differences were found between the approaches only in observation windows of 5, 10, and 20 seconds. In these windows, the performance of the thesis approach's best models was superior to that of the best baseline models. The results presented positive evidence that supports the hypothesis raised that estimates of student knowledge can improve the performance of sensor-free confusion detection models in computer programming tasks. The Thesis presents discussions for several other intermediate results and the scenarios where the Thesis approach is most advantageous.; |
Palavras-chave |
Detecção de confusão; Ambiente computacional de aprendizagem; Programação de computadores; Aprendizado de máquina; Computação afetiva; Confusion detection; Computer-based learning environment; Computer programming; Machine learning; Afective computing; |
Área(s) do conhecimento |
ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação; |
Tipo |
Tese; |
Data de defesa |
2022-06-06; |
Agência de fomento |
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior; |
Direitos de acesso |
openAccess; |
URI |
http://www.repositorio.jesuita.org.br/handle/UNISINOS/11830; |
Programa |
Programa de Pós-Graduação em Computação Aplicada; |