Algoritmos falham ao tentar prever trajetória de vida de indivíduos

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda

© Shutterstock

Tech CIÊNCIA-PESQUISA 28/09/20 POR Folhapress

SÃO PAULO, SP (FOLHAPRESS) - Algoritmos de computador ditam cada vez mais as recomendações de filmes, séries e livros que as pessoas recebem na internet, mas ainda estão muito distantes da capacidade de predizer a trajetória de vida de indivíduos, mesmo quando abastecidos com grande quantidade de dados. No maior estudo já feito sobre o tema, modelos de inteligência artificial foram só um pouco melhores do que uma simples média ao tentar "prever o futuro".

PUB

"É possível que, com mais dados ou tipos diferentes de dados, as previsões poderiam ser mais precisas. Mas acho que ninguém sabe se isso é verdade neste momento", diz o coordenador do estudo, Matthew Salganik, do Departamento de Sociologia da Universidade de Princeton (EUA).

"Meu palpite é que, quando se tenta fazer predições de longo prazo sobre situações importantes da vida, sempre haverá alguns limites para a previsibilidade."

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda. Esse levantamento acompanhou 4.242 famílias que tiveram filhos por volta do ano 2000, recolhendo informações sobre essas crianças e seu entorno em seis momentos, que vão do nascimento aos 15 anos de idade.

Para cada uma dessas famílias, entrevistas feitas com mães, pais, professores e a própria criança permitiram que se formasse um banco de dados com mais de 12 mil variáveis. A proposta do grupo de Salganik era tentar usar essa massa de informações para prever o que aconteceria com as crianças conforme elas passassem dos nove para os 15 anos de idade (a última fase da pesquisa).

Com esse objetivo, o pesquisador reuniu 160 equipes diferentes de especialistas, que podiam usar diferentes metodologias de inteligência artificial para "prever o futuro". A ideia era avaliar o potencial do chamado aprendizado de máquina, no qual, em vez de testar ideias sobre como um fenômeno acontece, o programa de computador simplesmente recebe o máximo possível de informações disponíveis sobre aquele fenômeno e tenta encontrar, nessa massa de dados, os padrões que explicam seu funcionamento.

Por exemplo, o criador do algoritmo pode rotular uma grande quantidade de textos como sendo escritos em português e espanhol e determinar que o computador identifique padrões que separem os textos escritos numa língua dos escritos em outra. Com base nisso, o algoritmo "treinado" poderia determinar em que língua foi escrito um novo texto que ele receber.

Os diferentes modelos de aprendizado de máquina tinham que tentar "adivinhar" o que aconteceria com um pequeno conjunto de variáveis, no qual estavam incluídos coisas como a média de notas de cada criança na escola, a situação profissional de seus pais ou cuidadores e a queda ou aumento da renda em cada família.

Para atingir esse objetivo, os sistemas receberam mais uma colher de chá: foram "treinados" com metade da amostra de famílias. Ou seja, no começo do estudo, eles já "sabiam" como 50% das crianças estudadas tinha se saído dos nove aos 15 anos. O desafio era usar essas informações, bem como o resto dos dados, para prever como as demais crianças evoluiriam, em nível individual.

Não deu muito certo. Numa escala usada pelos pesquisadores, que vai de 0 (previsões que equivalem à média dos dados usados para "treinar" o sistema) e 1 (previsões totalmente precisas), os algoritmos com maior sucesso tiraram "notas" entre 0,2 e 0,05. Foi um resultado apenas ligeiramente melhor que o obtido por um modelo matemático simples, feito "no braço" e usando apenas quatro variáveis, entre as mais de 12 mil disponíveis na pesquisa original.

"Ainda bem que não deu certo", brinca Fernando Osório, professor do ICMC-USP (Instituto de Ciências Matemáticas e de Computação da USP) e pesquisador da área de inteligência artificial. "A gente vê algoritmos fazendo coisas muito legais, diagnosticando câncer ou Covid-19 dando um show no ser humano, e esquece que são coisas muito pontuais. Talvez máquinas conseguissem fazer previsões a curto e médio prazo em sistemas dinâmicos, porém estáveis. Mas, quando estamos falando de seis anos da vida de uma pessoa, temos sistemas muito instáveis e sujeitos a muitas variáveis externas e eventos imprevistos."

É possível comparar a natureza desse tipo de trajetória individual com a previsão do tempo, por exemplo. Ambas as coisas têm em comum a dificuldade de chegar a determinada "granularidade" dos dados, diz ele. "Ou seja, você consegue dizer 'amanhã vai chover em São Carlos', mas aí a chuva cai num bairro e não cai no outro. Imagine como é prever não só o bairro, mas a casa exata onde a chuva vai cair", compara.

Para o pesquisador, é preciso levar em conta ainda as implicações sociais de tentar alcançar esse nível de determinismo em análises do desenvolvimento humano.

"É algo que deveria fazer com que os responsáveis por políticas públicas pensem com cuidado sobre o uso de previsões, mesmo as baseadas em muitos dado e aprendizado de máquina complicado, para tomar decisões que envolvam pessoas", diz Salganik. "Além disso, como cientistas, um de nossos objetivos pode ser a compreensão das fontes dessa complexidade."

PARTILHE ESTA NOTÍCIA

RECOMENDADOS

brasil Rio Grande do Sul Há 5 Horas

Avião cai em Gramado; governador diz que não há sobreviventes

mundo EUA Há 8 Horas

Professora que engravidou de aluno de 12 anos é condenada

fama GUSTTAVO-LIMA Há 11 Horas

Gusttavo Lima é hospitalizado, cancela show no festival Villa Mix e fãs se revoltam

brasil BR-116 Há 9 Horas

Acidente com ônibus, carreta e carro deixa 38 mortos em Minas Gerais

fama WILLIAM-BONNER Há 7 Horas

William Bonner quebra o braço e fica de fora do Jornal Nacional no fim do ano

fama Vanessa Carvalho Há 9 Horas

Influenciadora se pronuncia após ser acusada de trair marido tetraplégico

fama Pedro Leonardo Há 9 Horas

Por onde anda Pedro, filho do cantor Leonardo

lifestyle Smartphone Há 8 Horas

Problemas de saúde que estão sendo causados pelo uso do celular

esporte FUTEBOL-RIVER PLATE Há 8 Horas

Quatro jogadoras do River Plate são presas em flagrante por racismo

esporte CBF-DENÚNCIAS Há 10 Horas

Presidente da CBF demite diretor que é amigo de Ronaldo por justa causa