Abstract:
As redes sociais digitais estão se tornando cada vez mais populares e, com isso, elas oferecem uma plataforma massiva para a análise do comportamento humano em contextos mediados por computadores. O comportamento humano pode ser explorado pela análise do conjunto de rastros digitais criados pelas pessoas ao interagirem com as redes sociais. Esse rastro digital é definido como pegadas digitais. As pegadas digitais podem ser classificadas em ativas, quando produzidas de forma consentida, e passivas, quando produzidas de forma não intencional. É através delas que estudos podem explorar comportamento e interação social em larga escala. A descoberta de informações significativas e valiosas a partir de pegadas digitais deixadas nas redes sociais é realizada a partir das tecnologias de reconhecimento de padrões, bem como técnicas estatísticas e matemáticas; esta disciplina é referida como Mineração de Dados. Nesse contexto, este trabalho busca identificar perfis de usuários em redes sociais a partir do agrupamento de dados de comportamento em redes sociais (pegadas digitais), dados demográficos e informações socioafetivas (traços de personalidade), utilizando-se de técnicas de Mineração de Dados. Dessa forma, verifica-se a viabilidade na criação de grupos significativos considerando características socioafetivas e pegadas digitais, bem como disponibiliza-se uma análise qualitativa e quantitativa dos grupos produzidos, a fim de entender a qualidade dos grupos formados e a validade deles em relação aos conhecimentos revisados da Psicologia da Personalidade. Mais especificamente, são empregados algoritmos de aprendizado não supervisionados (clusterização), como K-Means e Spectral Clustering. Diferentemente de outros trabalhos na área de Computação da Personalidade que buscam identificar a personalidade dos usuários a partir das pegadas digitais usando algoritmos de aprendizado de máquina supervisionados, esse trabalho utiliza algoritmos de aprendizado de máquina não supervisionado, agrupando usuários de redes sociais com perfis semelhantes, a partir da coleta de pegadas digitais, dados demográficos e traços de personalidade. Isso permite entender as manifestações da personalidade de usuários de redes sociais pelo seu comportamento e características demográficas, ou seja, o papel que personalidades diferentes desempenham no comportamento dos usuários em redes sociais. Embora esse trabalho analise um grupo pequeno de usuários (157 participantes), pode-se verificar algumas correlações observadas na bibliografia relacionada, sendo um primeiro passo para propostas futuras a fim de trazer consciência sobre a relação das redes sociais, a Computação da Personalidade e os diversos campos subjacentes relacionados a dados estritamente pessoais e sensíveis. Esta pesquisa também traz como contribuição um novo conjunto de dados rotulados e com alta dimensionalidade (uma base de dados), os quais combinam dados comportamentais com características extraídas de pegadas digitais ativas e passivas, personalidade e informações demográficas de rede social na língua portuguesa.