Modelagem de Tópicos para Análise de Indícios de Depressão e Ideação Suicida de Postagens do Reddit em Língua Portuguesa
Este trabalho tem como objetivo examinar como técnicas de processamento de linguagem natural (PLN) e de aprendizado de máquina não supervisionado podem ser empregadas para detectar sinais de depressão e ideação suicida em postagens extraídas da plataforma de rede social Reddit. O estudo aborda a crescente importância da Internet como um espaço de expressão de sentimentos e investiga o potencial da modelagem de tópicos para revelar temas importantes em discussões sobre saúde mental. A pesquisa destaca a aplicabilidade de métodos como a Alocação Latente de Drichlet (LDA) e a Fatoração de Matrizes Não-Negativas (NMF) para caracterizar postagens de forma que se possa identificar padrões de linguagem e tópicos associados à depressão e à ideação suicida. Este trabalho não só busca entender os sinais linguísticos relevantes para o estado emocional dos usuários, mas também busca oferecer uma potencial ferramenta para profissionais da saúde mental, pesquisadores e formuladores de políticas públicas, visando fornecer insights para intervenções precoces e suporte psicológico. Ao focar na língua portuguesa, o estudo contribui para diversificar a pesquisa em PLN, ampliando a compreensão das comunidades de língua portuguesa online, entre muitos estudos realizados em diferentes línguas. A dissertação é fundamentada em uma revisão da literatura que abrange trabalhos relevantes na área, que demonstram a eficácia da modelagem de tópicos em dados sensíveis e a importância de analisar conteúdo online para prevenir comportamentos depressivos e suicidas. As questões de pesquisa focam na capacidade da modelagem de tópicos de identificar automaticamente indícios de depressão e ideação suicida e na busca de padrões linguísticos específicos que caracterizam tais postagens e de tópicos mais comuns relacionados à saúde mental na comunidade de língua portuguesa do Reddit.