A depressão é um dos distúrbios mais comuns no mundo, que afeta a vida de mais de 300 milhões de pessoas e quase 800.000 suicídios por ano, segundo os dados da Organização Mundial de Saúde de março de 2018. Diagnosticar a depressão pode ser um empreendimento complexo e desafiador. Segundo a Clínica Mayo , os sintomas da depressão variam, e os médicos podem usar um exame físico, testes de laboratório, questionário de avaliação psiquiátrica e os critérios do DSM-5 (Manual Diagnóstico e Estatístico de Transtornos Mentais) da Associação Americana de Psiquiatria - APA - para determi nar um diagnóstico de depressão. Para um profissional de saúde mental, fazer as perguntas certas e interpretar as respostas é um fator-chave no diagnós tico. Mas e se um diagnóstico pu desse ser alcançado por meio de conversas naturais, em vez de exigir contexto a partir de perguntas e respostas?
Uma inovadora equipe de pesquisa do Instituto de Tecnologia de Massachusetts (MIT) composta por Tuka Alhanai e James Glass no CSAIL (Laboratório de Ciência da Computação e Inteligência Artificial) e Mohammad Ghassemi no IMES (Instituto de Engenharia e Ciência Médica) descobriram uma maneira de detectar a depressão em indivíduos através da identificação de padrões em diálogos naturais.
Os pesquisadores do Instituto de Tecnologia de Massachusetts (Massachusetts Institute of Technology - MIT) desenvolveram um modelo de IA (Inteligência Artificial) baseado em uma rede neural que poderia prever a depressão com base na identificação de padrões de fala a partir de entrevistas de áudio e texto. Usando um conjunto de dados de 142 entrevistas de pacientes registrados, a equipe objetivou modelar sequências para detecção de depressão. Os pesquisadores incluíram experimentos em modelagem livre de contexto, modelagem ponderada e modelagem de sequências.
Primeiro, a equipe procurou avaliar a precisão da predição de recursos de áudio e texto "quando considerada independentemente do tipo de pergunta feita e do tempo que foi perguntado durante a sessão de entrevista" - em outras palavras, modelagem "sem contexto". A equipe forneceu 279 recursos de áudio e 100 textos para um modelo de regressão logística com regularização de L1 [4]. Para os recursos de texto, a equipe aproveitou Doc2Vec da biblioteca Python Gensim para "um total de 8.050 exemplos de treinamento, 272.418 palavras e um tamanho de vocabulário de 7.411 ." Para recursos de áudio, a equipe extraiu um conjunto inicial de 553 recursos que representam cada resposta do assunto .
No segundo experimento, a equipe teve como objetivo compreender o desempenho preditivo "ao condicionar o tipo de pergunta feita, e independente do tempo que foi solicitado durante a sessão de entrevista". Para conseguir isso, eles criaram um modelo ponderado semelhante ao contexto. modelo livre, com um diferenciador chave - atribuiu pesos ao modelo com base no "poder preditivo da questão encontrada no conjunto de treinamento".
Para o terceiro experimento, a equipe se concentrou em "modelar mudanças temporais da entrevista" e usou uma rede neural bidirecional de memória de curto prazo (LSTM) porque tinha a vantagem adicional de modelar dados sequenciais.
Curiosamente, os pesquisadores descobriram que o modelo precisava de mais de quatro vezes mais dados ao usar o áudio do que o texto ao prever a depressão. O modelo exigiu em média 30 sequências para áudio, em comparação a apenas sete sequências de texto de pergunta e resposta. A equipe observou que a modelagem de sequências é mais precisa para prever depressão, e o modelo multimodal de texto e áudio foi o de melhor desempenho. Ironicamente, a natureza dos modelos de rede neural do IA ofuscam exatamente os padrões que ele descobre dos dados de entrada. A opacidade da IA é devida à complexidade inerente das redes neurais com conexões complexas entre os nós e a grande quantidade de parâmetros. Independentemente disso, este estudo do MIT representa um passo inovador para a criação de uma nova ferramenta em potencial para auxiliar médicos e profissionais de saúde mental a lidar com as complexidades do diagnóstico de depressão no futuro.
Até que ponto a tecnologia pode nos favorecer no diagnóstico de transtornos mentais ? Fica o questionamento para o desenvolvimento de próximos textos. Assine a nossa newsletter para não perder nenhuma novidade.
Alhanai , Tuka ; Ghassemi , Mohammad; Glass, James. "Detecting Depression with Audio/Text Sequence Modeling of Interviews." MIT. 2-6 September 2018. Retrieved from http://groups.csail.mit.edu/sls/publications/2018/Alhanai_Interspeech-2018.pdf on October 14, 2018
Mayo Clinic Staff. "Depression (major Depressive disorder." Mayo Clinic. Retrieved from https://www.mayoclinic.org/diseases-conditions/depression/diagnosis-treatment/drc-20356013 on October 14, 2018.
Junte-se aos leitores inteligentes que recebem nossas novidades direto no e-mail: