Predicting Depression: a comparative study of machine learning approaches based on language usage

Luciana Mariñelarena- Dondena, Edgardo Ferretti, Manolis Maragoudakis, Maximiliano Sapino, Marcelo Luis Errecalde

Resumen


Abstract

Depression is a major public health concern and a leading cause of disability. Globally, more than 332 million people of all ages suffer from depression. Several studies in the literature show that people language usage is indicative of their psychological states. That is why, there is growing interest in the application of natural language processing techniques for predicting depression. In this work, we present a comparative study of different machine learning methods and alternative ways of representing documents to automatically detect social media users who have reported to had been diagnosed with depression. The obtained results have demonstrated that a Deep Learning approach had the superior classification performance, when combined with a Synthetic Minority Oversampling Technique to deal with the problem of class imbalances in the dataset used in our experiments. The F1 score achieved was 82.93% with an accuracy of more than 94%.

Keywords: Depression; Machine Learning; Deep Learning; SMOTE (Synthetic Minority Oversampling TEchnique).

 

Resumen

La depresión es uno de los mayores problemas de salud pública que constituye a su vez una de las principales causas de incapacidad. A nivel mundial, más de 332 millones de personas de todas las edades padecen este trastorno. Investigaciones previas demuestran que el lenguaje que utilizan las personas refleja su salud mental. Por tal motivo, existe un creciente interés en la aplicación de técnicas de procesamiento del lenguaje natural para predecir la depresión. En este trabajo se presenta un estudio comparativo de diferentes métodos de aprendizaje automático como así también distintas maneras de representación de los documentos con el fin de detectar automáticamente a aquellos usuarios de medios sociales que manifestaron haber sido diagnosticados previamente con depresión. Los resultados obtenidos mostraron que la performance del clasificador mejoró considerablemente cuando se aplicó un enfoque de Aprendizaje Profundo combinándolo con el algoritmo SMOTE (Synthetic Minority Oversampling TEchnique) que permite hacer frente al problema de las clases desbalanceadas alcanzando así una medida F1 del 82.93%. En síntesis, este enfoque combinado SMOTE + Aprendizaje Profundo predice la depresión con una exactitud de más del 94%.

Palabras Clave: Depresión; Aprendizaje Automático; Aprendizaje Profundo; SMOTE (Synthetic Minority Oversampling TEchnique).

 

Resumo

A depressão é um dos maiores problemas de saúde pública que constitui por sua vez uma das principais causas de incapacidade. A nível mundial, mais de 332 milhões de pessoas de todas as idades padecem deste transtorno. Investigações prévias demonstram que a linguagem que utilizam as pessoas refletem a sua saúde mental. Por tal motivo, existe um crescente interesse na aplicação de técnicas de processamento da linguagem natural para prognosticar a depressão. Neste trabalho se apresenta um estudo comparativo de diferentes métodos de aprendizagem automático como assim também distintas maneiras de representação dos documentos com a finalidade de detectar automaticamente àqueles usuários de meios sociais que manifestaram haver sido diagnosticados previamente com depressão. Os resultados obtidos mostraram que a performance do classificador melhorou consideravelmente quando se aplicou um enfoque de Aprendizagem Profunda combinando com o algoritmo SMOTE (Synthetic Minority Oversampling TEchnique) que permite fazer frente ao problema das classes desbalanceadas alcançando assim uma medida F1 del 82.93%. Em síntese, este enfoque combinado SMOTE + Aprendizagem Profundo prognostica a depressão com uma exatidão de mais de 94%.

Palavras-Chave: Depressão; Aprendizagem Automática; Aprendizagem Profunda; SMOTE (Synthetic Minority Oversampling TEchnique).


Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.


 
Revista Cuadernos de Neuropsicología - Panamerican Journal of Neuropsychology es una revista científica indexada en las siguientes bases de datos:
 
    
IMBIOMEDLATINDEXPEPSIC REDIB
    

    
Google ScholarMatriz de Información para el Análisis de Revistas (MIAR)Paperity SHERPA/RoMEO
    

Todos los contenidos de la Revista Cuadernos de Neuropsicología - Panamerican Journal of Neuropsychology se distribuyen bajo una licencia de uso y distribución Creative Commons Reconocimiento 3.0. (cc-by)