Semântica Distribucional Aplicada à Avaliação Didática
A semântica distribucional é uma teoria derivada da linguística e psicologia, que possui como premissa a hipótese de que se pode derivar o significado de uma palavra pelos diversos contextos em que ela ocorre. Trata-se de uma teoria com um vasto número de aplicações em âmbito computacional: representações baseadas em semântica distribucional são largamente empregadas em tarefas como geração de texto, tradução automática e classificação de documentos. Uma das grandes vantagens deste tipo de representação consiste no fato de que todo o aprendizado da linguagem deriva da apresentação de exemplos de textos da linguagem em questão. Nesta dissertação, são investigadas oportunidades de utilização de representações baseadas em semântica distribucional para o processo de avaliação didática de questões dissertativas em variados domínios de conhecimento, abstraídos como problemas de classificação supervisionada. O principal objetivo deste método consiste em fornecer ferramentos para auxiliar professores nesta tarefa, servindo como um mitigador da subjetividade intrínseca do processo de correção de exercícios produzidos por alunos. São eles: a detecção de estruturas retóricas de artigos de opinião em redações de vestibular e aplicação automática de conceitos em scripts em Java produzidos por alunos em um curso introdutório de programação. No primeiro, foi obtida acurácia máxima de 74,22% entre os diversos experimentos propostos. No segundo, em uma série de 12 experimentos, foi obtida uma média de acurácia de 74, 90% . Além das oportunidades em educação aqui propostas, são também realizadas comparações de diferentes representações distribucionais entre si, e também, a avaliação de sua efetividade em dois domínios distintos: linguagem natural (redações em português), e linguagem formal (scripts de programação).